Nature子刊:單分子測序揭示鸚鵡模仿能力
日期:2012-07-04 08:00:23
研究團隊通過單分子測序揭示了鸚鵡基因組的特殊區域,并采用第二代測序技術對單分子測序數據進行了修正。文章發表在7月1日Nature Biotechnology雜志網站上。
如今單分子測序技術炙手可熱,這一新技術能生成超長的測序讀段,“能更容易拼裝基因組的復雜部分,”文章的共同作者Duke大學神經學生物學家Erich Jarvis說。Jarvis感興趣的是調控鸚鵡模仿能力的基因序列,因為這些序列能為神經學科學家提供人類語言能力相關調控基因的信息。
Jarvis及其同事最初采用第二代測序來裝配鸚鵡的基因組區域,第二代測序技術能一次讀取100到400bp,需要數天來裝配基因組構架圖。然而,科學家測序后發現得到的讀長不足以裝配出鳴聲學習基因的某些調控區域。盡管研究人員嘗試了修改算法,仍無法解決這一問題。
去年羅氏454和Pacific Biosciences單分子測序技術的讀長都達到了1000bp。而Pacbio的技術能一次生成2,250 到23,000bp的數據,能在約一天內裝配整個基因組。
Jarvis及其同事采用了PacBio RS儀器來解決他們基因組測序遇到的難題。通過Assemblathon競爭,科學家發現Pacbio儀器在讀取虎皮鸚鵡(Melopsittacus undulates)基因組時,難以精確解碼某些復雜區域,儀器的錯誤率較高。Jarvis說,這種錯誤率幾乎使他們難以用這些超長讀段進行基因組裝配。
單分子測序儀器能生成超長序列,極大的改善基因組和轉錄組的裝配。不過,目前單分子測序讀取的錯誤率較高,從而限制了其應用(如細菌重測序應用)。而第二代測序產生的讀段雖然短,但精確性更高。
研究人員引入了一種修正算法和裝配策略,應用第二代測序產生的短高保真序列對單分子測序進行了修正。他們成功將單分子測序(或稱為第三代測序)儀的錯誤率從15%減少到了小于0.1%。由此,科學家終于裝配出了鸚鵡鳴聲學習行相關基因的調控區域(如FoxP2基因和egr1基因)。
這一研究成果能幫助神經學科學家能更好的了解鳥類模仿和鳴唱的遺傳學機制。同時也能為科學家提供有關人類交流和語言學習能力的遺傳信息。
研究人員還對PacBio RS儀器生成的多種噬菌體、原核生物和真核生物的測序數據進行了修正,驗證了該方法的可靠性。Jarvis認為科學家能夠通過使用混合性測序方法,解碼癌細胞發育相關的復雜基因和控制大腦功能的復雜基因序列。
上一篇: 南開大學PNAS文章解析關鍵蛋白