Science用新方法檢測人類基因組重復序列
日期:2010-10-29 15:26:00
DNA拷貝數變異部分地造成了個人間差異,亦有可能是某些人患有特異的病癥或疾病易感性的重要原因,并在根本上決定了對個體影響的程度。在一年前,對DNA序列的重復拷貝數進行計數和定位還幾乎是一件不可能的事情。基因的重復拷貝數越多,越是難以對其進行精確的估計。
“技術上的限制使得我們無法了解人類拷貝數變異的真實情況,”華盛頓大學基因組學科教授、論文的資深作者Evan E. Eichler博士說:“大部分動態及可變基因通常都被排除在全基因組研究之外。”然而這些難以研究的基因卻一直是科學家們感興趣的焦點,科學家們猜測這些基因與人類的進化、腦發育、新陳代謝及免疫疾病有著密切的關系。
Eichler實驗室的科研人員開發了幾種分析和計算技術克服了對多拷貝基因進行研究的障礙。論文的首作者Peter H. Sudmant 和Jacob O. Kitzman是華盛頓大學基因組學科系的大學生。
與千人基因組計劃和安捷倫科技有限公司(Agilent Technologies)的研究人員合作,華盛頓大學的科研小組使用了新技術深入分析和比較了159個個體基因組。在對這些個體全基因組評估過程中,研究人員對多拷貝基因及基因家族進行了精確的分析。
研究人員證實利用新方法可對1900個堿基對長的DNA片段拷貝數進行精確估計,拷貝數的計數范圍為0-48之間。人體基因組約由30億個DNA堿基對組成,堿基對是指一對相互配對的核苷酸,是組成DNA的基本單位。
研究人員在個體特異性拷貝中鑒別了410萬個獨特的單核苷酸位點,并證實那些重復拷貝或存在于基因組多個不同位點的基因其拷貝數及序列的差異造成了個體基因功能上的差別,揭示了進化過程中這些多拷貝基因發生的改變。
通過與猿類基因組比較,研究人員鑒別了人類特有的重復基因。此外研究人員發現這些重復基因與腦發育有著重要聯系。其中一些基因還與腦細胞連接的生長及分支、異常的大小頭、特異的多巴胺受體、視覺空間及社交障礙、脊髓性肌萎縮嚴重性、智力障礙和癲癇等有關。
在人類僅有7-9%的基因存在拷貝數變異。人類大部分基因通常都僅有兩個拷貝。甚至在大部分可變基因中,研究人員發現其中80%的拷貝重復數也在0-5個拷貝之間。研究人員指出極端的基因變異通常僅存在于少量的基因家族中。在新研究中,研究人員鑒定了56個高度可變的基因家族,它們的拷貝數變異大約在5-368的范圍內。 “這些基因有著非常豐富的重復片段,”研究人員說:“重復片段主要位于人類基因組計劃鑒別的基因組長重復區域。”
研究人員稱他們還發現了44個“隱藏”的重復基因家族成員。“完成對這些基因組的缺失成員的測序將有助于我們更準確地了解人類基因組的結構及多樣性,“研究人員說。
雖然基因組片段重復使人類與其他靈長類動物產生了本質的區別,但基因組重復促進的基因反復重排也與許多的疾病例如智力障礙、精神分裂癥和孤獨癥等相關。研究人員猜測由重復產生的極端變異有可能導致了疾病相關的基因組失穩。
雖然研究結果表明科學家們現在可以利用新的技術對人類基因組的一些復雜的遺傳區域進行探索。然而作者指出人類還有28個大的基因組區域由于非常的復雜目前還無法揭示其導致遺傳多樣性的機制。
盡管還存在一定的局限性,新技術仍為科學家們了解拷貝數變異對人類健康及疾病影響及機制帶來了新的希望。研究人員說:“我們的方法使得科學家們能夠對一些高度重復的人類基因組區域,其中包括1000個過去難以檢測的基因進行疾病相關的遺傳學研究。”