三代測(cè)序時(shí)代即將來臨:PacBio首次確認(rèn)一種疾病大片段缺失突變
日期:2016-12-09 08:49:51
二代測(cè)序?yàn)樯茖W(xué)研究帶來了翻天覆地的變化,但是越來越多研究表明這種短讀長(zhǎng)測(cè)序 (short-read sequencing, SRS)雖然高通量,成本低,然而對(duì)于串聯(lián)重復(fù)序列、高GC/AT序列、高度多態(tài)性區(qū)域、高度同源區(qū)域以及大片段結(jié)構(gòu)變異的檢測(cè)能力非常有限,難以全方位的捕捉基因組的變化。據(jù)估計(jì),使用100bp的測(cè)序讀長(zhǎng),有5% 的測(cè)序片段無法定位到唯一的基因組區(qū)域。
第三代測(cè)序的出現(xiàn)為解決這一難題帶來了希望,比如PacBio屬于長(zhǎng)讀長(zhǎng)測(cè)序(long-readsequencing,LRS),可以有效的彌補(bǔ)SRS的不足之處。PacBio在臨床基因組學(xué)中的應(yīng)用,讓我們有機(jī)會(huì)了解以往常被忽視的遺傳變異。此外牛津納米孔公司MinIONs測(cè)序也逐漸在基因組測(cè)序領(lǐng)域煥發(fā)出光彩。
比如近期生物學(xué)預(yù)印網(wǎng)站BioRxiv公布了一項(xiàng)斯坦福大學(xué)的最新成果:Long-read whole genome sequencing identifies causal structural variation in a Mendelian disease,這是第一例發(fā)表的PacBio在致病突變確診當(dāng)中的應(yīng)用,證明了第三代測(cè)序技術(shù)在疾病相關(guān)的結(jié)構(gòu)變異中有巨大的潛力。
Carney綜合征(Carneycomplex, CNC)是一種罕見的常染色體顯性遺傳疾病,多發(fā)心臟和皮膚黏液瘤,常伴有皮膚色素沉著與內(nèi)分泌過度等癥狀。位于17號(hào)染色體的抑癌基因PRKAR1A與CNC發(fā)病有關(guān),因此又稱為CNC1基因,該基因的突變可引起腫瘤發(fā)生。
本文的患者個(gè)體為Carney綜合征的疑似病例。患者出生時(shí)表現(xiàn)出了一定的呼吸問題,7歲時(shí)首次發(fā)現(xiàn)心臟黏液瘤,隨后予以切除,10歲時(shí)發(fā)現(xiàn)有睪丸腫塊,13歲時(shí)發(fā)現(xiàn)有垂體瘤,18歲時(shí)再次切除了復(fù)發(fā)的心臟粘液瘤。此時(shí),患者被懷疑患有Carney綜合征,但臨床PRKAR1A基因突變檢測(cè)顯示為陰性。2016年,患者在準(zhǔn)備進(jìn)行心臟移植時(shí),醫(yī)生團(tuán)隊(duì)第二次進(jìn)行了全基因組測(cè)序分子診斷。此次檢測(cè)使用Illumina HiSeq 2500平臺(tái)完成,平均測(cè)序深度36×,數(shù)據(jù)分析由斯坦福大學(xué)(Stanford Medicine Clinical Genomics Service)完成,但此次分析沒有檢測(cè)出任何可以解釋患者臨床表征的遺傳變異。
為了評(píng)估基因組結(jié)構(gòu)變異,發(fā)現(xiàn)潛在的致病原因,研究人員在PacBio Sequel系統(tǒng)上進(jìn)行了全基因組測(cè)序,測(cè)序文庫(kù)為10kb DNA文庫(kù),共使用10個(gè)SMRT cell芯片,測(cè)序獲得26.7Gb數(shù)據(jù)(約8.6×),測(cè)序讀長(zhǎng)N50為9612 bp。經(jīng)生物信息分析,共發(fā)現(xiàn)了大于50bp的6971個(gè)缺失和6821個(gè)插入變異。通過與陰性對(duì)照對(duì)比,并側(cè)重分析疾病相關(guān)基因的外顯子區(qū)域,共鑒定出重要的3個(gè)插入和3個(gè)缺失變異,其中就包含PRKAR1A。分析結(jié)果顯示,在PRKAR1A基因第一個(gè)外顯子中包含2184 bp的雜合性缺失突變。 Sanger測(cè)序結(jié)果也發(fā)現(xiàn)此缺失突變的存在,并且證實(shí)了PacBio可以精確檢測(cè)出缺失斷裂點(diǎn)。
文章指出,人類基因組中存在著許多低復(fù)雜度的區(qū)域,如重復(fù)序列和高多態(tài)性的區(qū)域、HLA區(qū)域等,這些區(qū)域的存在對(duì)短讀長(zhǎng)和基于參考的基因組組裝是非常大挑戰(zhàn)。雖然目前的SRS已經(jīng)在單核苷酸和小插入/缺失變異的遺傳發(fā)現(xiàn)中非常成功,但最近的研究表明我們大大低估了基因組中結(jié)構(gòu)變異的復(fù)雜性,另外,許多疾病正是由超出SRS分辨率范圍的序列重復(fù)引起的。
同時(shí),12月初,牛津大學(xué)人類遺傳學(xué)威康信托中心(WTCHG)聯(lián)合基因組分析公司Genomicsplc宣布,他們利用牛津納米孔公司MinIONs測(cè)序儀首次完成了多個(gè)人類基因組的測(cè)序。
2012年,Oxford Nanopore公司在AGBT(基因組生物學(xué)技術(shù)進(jìn)展年會(huì))上發(fā)布了自己的納米孔測(cè)序系統(tǒng)——MinION。MinION測(cè)序儀是一種手持式設(shè)備,通過USB設(shè)備與電腦相連,加上耗材試劑,它的售價(jià)僅為1000美元。
今年年初Nature雜志發(fā)表的一項(xiàng)研究展示了這種便攜式基因組測(cè)序儀在這次疫情中起到的重要作用。研究人員用這些測(cè)序儀在幾內(nèi)亞建立了基因組測(cè)序?qū)嶒?yàn)室,對(duì)埃博拉患者的樣本進(jìn)行實(shí)時(shí)測(cè)序,嚴(yán)密監(jiān)控了埃博拉疫情的發(fā)展。
國(guó)立首爾大學(xué)醫(yī)學(xué)院的研究人員和10xGenomics公司也利用去年新發(fā)售的GemCodeTM測(cè)序平臺(tái)以及第三代測(cè)序PacBio單分子實(shí)時(shí)測(cè)序平臺(tái),對(duì)一名韓國(guó)人的基因組(AK1)進(jìn)行從頭組裝和單倍體型定相信息分析。這是迄今為止發(fā)表的最為連續(xù)的人類基因組組裝,填補(bǔ)了特異人群參考基因組的空白,并確定了結(jié)構(gòu)變異。相關(guān)結(jié)論發(fā)表在Nature雜志上。