Nature子刊介紹基因組裝配新方法
日期:2013-11-28 09:05:47
美國麻省大學醫學院(UMMS)的研究人員,利用DNA互作頻率數據,開發了更快更準確的基因組裝配方法,并成功將其應用于復雜的基因組。
二代測序技術生成的DNA短讀段,是構建完整基因組序列的基礎,而UMMS開發的這種新方法能夠將這些讀段更有效的拼湊起來。
Job Dekker博士及其同事通過這項研究展示,測定DNA片段間的相互作用頻率,可以幫助人們在基因組三維結構的指引下,快速準確的組裝基因組。他們利用這一技術,給人類基因組的未完成區域補上了65個DNA片段,文章于十一月二十四日發表在Nature Biotechnology雜志上。
“二代測序技術生成了大量的短DNA讀取,這些信息對于研究者們非常寶貴,”文章資深作者,UMMS的Dr. Dekker教授說。“隨著DNA讀取越來越短,完整基因組的裝配也變得更具挑戰性。歷經二十年的努力,人類基因組仍有缺口。”
在近十年來,高通量DNA測序的成本大大降低,測序新基因組已成常規。二代測序技術能夠輕松讀取成千上萬的DNA序列,但這些序列都是被隨機打斷的短片段,需要經由計算機程序裝配成為能夠互相重疊的大片段。像這樣的初步裝配結果,往往是一系列DNA片段,人們得通過相互比對,才能將其按正確順序排列成為完整的基因組。
然而,基因組中有大量區域充斥著重復性序列。在這種情況下,特定DNA片段可能有數千種可能的位置,要想為其準確定位是非常困難的。“如何組裝這些DNA片段,已經成為相關研究的瓶頸,”文章的第一作者,Noam Kaplan博士說。
為此,Dekker和Kaplan嘗試將基因組三維結構作為組裝線性DNA序列的指引。他們通過Hi-C技術,測定了基因組各DNA片段之間的相互作用頻率。在基因組的三維結構中,距離較近的DNA序列互作更為頻繁,而距離較遠的DNA序列互作較少。隨后研究人員通過計算機,在3D互作頻率的基礎上進行計算,以確定基因組各個片段的線性位置。
舉例來說,從一維的線性基因組來看,一個序列也許能放在好幾個不同的位置。而互作頻率數據,可以確定該序列與其它序列的關系,即它與其它序列是近還是遠。“當特定序列有多個可能的位置時,我們能夠從三維上確定它在哪里更加合適,”Dr. Kaplan說。Kaplan和Dekker用這一新方法,確定了65個此前未能定位的片段位置。
Dekker補充道,“與現有方法相比,這一基因組裝配的新方法更快速也更簡單,能生成更高質量的基因組序列。此外,這一方法還有望用于鑒定癌癥的標志性染色體畸變。”
上一篇: 冷泉港科學家揭示促癌“垃圾DNA”