Nature子刊新工具:蛋白與lncRNAs相互作用定量預測
日期:2017-03-02 08:54:28
為了更全面的了解人類基因功能,而不僅僅只是從已測序的基因組中簡單的讀取信息,研究員們希望能掌握這些精細的調控原件的各個元素的來龍去脈。許多實驗室、聯營機構以及項目組都致力于在整體上獲得基因組各區域功能以及究竟是在何種細胞內是激活狀態的。
眾所周知,蛋白質是組成細胞的基石。然而,有趣的是,只有一小部分的人類基因組(大約2%)含有蛋白質編碼基因。其余98%的基因主要負責調控,即參與控制基因們何時何地表達和激活。這部分龐大的基因組產出RNA分子,其大小、結構以及功能都有所不同,它們被稱作非編碼RNA。不同類型的非編碼RNA與蛋白質相互作用的方式也不相同,因此,很多機構投入了大量的人力物力在此項研究中。至今,仍沒有合適的計算方法來處理極長的RNA序列(長鏈非編碼RNA),并且僅通過實驗手段來研究它們的結構和功能在如今也是一項巨大的挑戰。
近期發表在Nature Methods 上的文章介紹了一種新型的計算方法,預測蛋白質和長鏈非編碼RNA之間的相互作用,并且通過了先進實驗技術的確認和驗證。該篇文章由西班牙的Centre for Genomic Regulation in Barcelona(CRG) ,意大利的EMBLs site in Monterotondo 以及美國California Institute of Technology 共同合作完成。
長鏈非編碼RNA作用于多種蛋白質,介導重要的細胞功能。CRG的ICREA研究所教授,同時也是該篇文章的主要研究員之一的Gian Gaetano Tartaglia解釋:“為了了解它們在正常細胞和患病細胞內的功能,通過鑒定它們與蛋白質相互作用的方式將是一個很好的起點。”
這項新型的計算方法被稱作Global Score(整體打分),它能夠幫助科學家預測非編碼RNA與蛋白質的物理結合位點。該算法將從全局上評估蛋白質與特定RNA結合的潛在可能性,并且預測該結合位點的局部特征。另外本文的第一作者,CRG的博士后Davide Cirillo補充道:“RNA的結構對預測蛋白質相互作用十分重要。在尋找蛋白質伴侶的過程中,我們過去曾面臨的主要挑戰是有些RNA序列的長度是否能夠被直觀地看清其結構特性。
Davide 總結道:“這種算法集成了這些信息以后,使我們不僅能夠預測蛋白質伴侶,還能夠劃分優先級對它們進行實驗驗證。”
這項工作再次強調了在先進科學研究領域,生物信息學和計算生物學的相關貢獻以及這些學科對生命科學的促進和推進作用。
上一篇: Neuron:大腦何時表達媽媽的基因,何時表達爸爸的
下一篇: 脂肪酸合成代謝研究取得新進展