Sci Rep:PRC2與lncRNA相互作用的序列特異性新發(fā)現(xiàn)
日期:2017-02-14 09:04:04
國際學術期刊《科學報告》(Scientific Reports)近期在線發(fā)表了中國科學院-馬普學會計算生物學伙伴研究所邵振研究組關于PRC2與長非編碼RNA(lncRNA)之間相互作用的序列特異性研究成果。
由多梳(PcG)家族蛋白組成的表觀調(diào)控復合物PRC2是控制動物組織發(fā)育的重要因子,但在高等動物中PRC2如何被特異性招募到染色質(zhì)特定區(qū)域的分子機制還不清楚。隨著XIST與HOTAIR等PRC2結(jié)合lncRNA的發(fā)現(xiàn),人們猜測此類lncRNA可能決定了PRC2染色質(zhì)招募的特異性(Margueron et al. Nature 2011)。但是,直到現(xiàn)在PRC2與RNA結(jié)合是否具有序列特異性仍被廣泛爭論(Davidovich et al. Mol Cell 2015)。
邵振研究組首先開發(fā)了一個基于馬爾可夫鏈思想的序列組成分析流程,通過計算不同核苷酸間轉(zhuǎn)移在每條序列中出現(xiàn)的頻率來刻畫其組成,進而選擇被特定序列所顯著偏好或不偏好的核苷酸間轉(zhuǎn)移作為它們的序列組成特征,并通過將所有可能的轉(zhuǎn)移映射到一個完整四叉樹來研究所選序列特征在特征空間中的分布是否具有非平凡性。通過將該流程應用于人基因組中已知的數(shù)百個PRC2結(jié)合lncRNA,該研究系統(tǒng)分析了這些lncRNA的序列特征,發(fā)現(xiàn)其偏好的序列特征傾向在四叉樹上組成連續(xù)偏好路徑,并且這些連續(xù)路徑上的序列特征傾向于同時被人和小鼠基因組中的PRC2結(jié)合lncRNA所偏好。
受此啟發(fā),該研究整合小鼠胚胎干細胞中兩組已發(fā)表的RIP-seq和CLIP-seq數(shù)據(jù),定義了一組高可信度的小鼠PRC2結(jié)合lncRNA,發(fā)現(xiàn)這些lncRNA能夠被人基因組中已知PRC2結(jié)合lncRNA所具有的序列特征較好地預測。這些研究發(fā)現(xiàn)表明高等動物中PRC2與lncRNA結(jié)合具有序列特異性,并且其特異性具有較高的跨物種保守性。此外,該研究還通過發(fā)展一個局域打分模型,發(fā)現(xiàn)PRC2結(jié)合lncRNA的序列特征在lncRNA上的分布表現(xiàn)出明顯的非隨機性。進一步研究發(fā)現(xiàn),每個lncRNA上PRC2與lncRNA結(jié)合所偏好序列特征最富集的小片段(定義為PRC2偏好片段),相對lncRNA其它部分具有顯著更高的進化保守性和RIP-seq信號強度(如圖),說明這些序列特征的局域富集具有明確的功能意義。
該項研究在研究員邵振指導下,由計算生物學研究所博士研究生涂世奇完成,并得到了中科院和上海市科委的經(jīng)費支持,以及美國哈佛醫(yī)學院教授袁國丞的指導和協(xié)助。