增強子—啟動子RNA鏈接圖 薛愿超供圖
人類基因組計劃研究表明,人類基因組中只有不到2%的蛋白質編碼序列,而剩余98%為非編碼核酸序列。這些非編碼序列可能有功能,也可能僅僅是副產物,曾被稱為“垃圾DNA”或者“暗物質”。
隨著認識的深入,人們意識到,非編碼序列經過廣泛轉錄后生成的大量非編碼RNA在個體生命中具有重要的生理調控功能。非編碼RNA有著怎樣的結構?如何發揮功能?認識這些,對于理解生命健康過程至關重要。
5月6日,《自然》刊發了中國科學院生物物理研究所研究員薛愿超團隊的最新成果。他們建立了能夠捕獲RNA原位高級結構和作用靶標的RIC-seq新技術,并利用該技術首次在細胞內全景式地捕獲RNA的高級結構以及各種類型非編碼RNA的作用靶標,為RNA領域發展提供了全新的實驗工具。
“高級”RNA有“魔力”
非編碼RNA在細胞中數量眾多、無處不在。如今諸多研究表明,它不再是無用的“垃圾”,反而處處“刷存在感”。
已有相關研究表明,非編碼RNA參與了胚胎發育、細胞增殖、分化、凋亡、感染以及免疫應答等幾乎所有生理或病理過程的調控,與惡性腫瘤、心血管系統疾病、神經系統疾病、代謝疾病等相關的突變約90%定位在非編碼區。
論文通訊作者薛愿超告訴《中國科學報》,與編碼蛋白質的mRNA不同,雖然非編碼RNA也攜帶遺傳密碼,但是它們往往不具有蛋白質編碼潛能。非編碼RNA的調控功能主要是通過形成高級結構,并在RNA結合蛋白的介導下與其他mRNA或者非編碼RNA相互作用而實現。因此,解析細胞內RNA的原位高級結構及相互作用靶標是探究非編碼RNA功能機制的關鍵。
所謂高級結構,是指三級及以上的結構。“過去,可能很多人認為RNA僅僅是由A/U/C/G四種堿基所組成的線性序列,它的外觀是像意大利面一樣的條狀分子。”薛愿超說。
事實上,RNA在細胞內通過A—U、C—G或G—U配對先形成二級結構,進而在RNA結合蛋白的協助下折疊成復雜的三級結構。
而特定的RNA分子在形成復雜的三級結構后便具有了神奇的“魔力”,比如可以像蛋白質一樣具有酶的催化活性。
上世紀80年代初,美國科學家托馬斯·切赫和西德尼·奧爾特曼正是因為發現具有催化活性的RNA分子而獲得1989年諾貝爾化學獎。
然而,在整個轉錄組范圍內研究RNA的三級結構是RNA領域的世界性難題,難就難在利用現有的酶學和化學方法不能準確解析遠距離的、非互補配對的RNA—RNA相互作用。
此外,非編碼RNA發揮功能需要跟其他的RNA分子互作,這些互作被稱為“靶標”。而只有準確地鑒定靶標才能推導非編碼RNA跟其他RNA分子作用的規律,以及作用后如何影響靶標RNA的穩定性、翻譯和定位等。
薛愿超表示,過去,我國在RNA結構及相互作用的技術研發原創性方面有所欠缺,現有技術也存在一定的局限性,比如得到的單鏈和雙鏈信息不完整、在體外做近端連接假陽性率高等。
2015年,從美國加州大學圣地亞哥分校博士后出站,薛愿超入職中國科學院生物物理研究所并建立實驗室。那時,他開始思考,是否能開發新技術來系統性地研究非編碼RNA的高級結構和作用靶標。
新技術實現“一網打盡”
2015年9月,薛愿超的第一位博士生、該研究的第一作者蔡兆奎進入課題組,年輕的“師徒”開始攜手構建理想中的新技術。
考慮到RNA結構在細胞內和細胞外存在一定的差別,他們在對RIC-seq技術進行原理性設計時,重點突出了“原位”的概念。
“原位是指在保持細胞完整性的前提下,對所有空間上鄰近的RNA進行近端連接、篩選和測序。”薛愿超說。
任何新技術誕生后都需要做大量驗證以確定其準確度、可重復性和假陽性率。研究人員首先評估了RIC-seq技術的相關指標,比較和實驗驗證表明,與現有非編碼RNA二級結構和三級結構相比,RIC-seq技術均表現得更好。
此外,它還可“一網打盡”看清細胞內各種RNA—RNA空間相互作用,包括以前看不到的RNA三級空間鄰近相互作用。
基于此,研究人員構建了RNA三維作用圖譜,通過解析發現了非編碼RNA在細胞內的拓撲結構域和反式作用規律。
研究人員并未就此止步。“我們想嘗試用RIC-seq技術來看看啟動子RNA和增強子RNA之間是否存在互作。”薛愿超說。
基因什么時候表達、在什么組織里表達,均由增強子和啟動子控制。在一個細胞里,大概有5萬個啟動子,而增強子至少有10萬個,它們之間的對應調控關系是現代生物學研究的熱點和難點。
同時,由于啟動子和增強子區都可轉錄產生RNA,且增強子和啟動子在空間上鄰近配對后才能激活轉錄,這使得新開發的RIC-seq技術能夠派上用場。
令他們意外的是,研究表明,啟動子RNA和增強子RNA之間確實存在相互作用。“90%左右可以利用實驗進行驗證,有意思的是,我們進一步證明了增強子和啟動子RNA之間的相互作用,這對染色質構象的形成和基因的激活很重要。”蔡兆奎說。
這也在國際上率先證明了啟動子和增強子非編碼RNA之間的互作可用于推導其調控網絡。RIC-seq技術被認為是RNA結構和靶標研究方面的一個飛躍。“如果說RNA二級結構研究方面我們處于跟跑狀態,那么這次在RNA高級結構和靶標研究方面,我們在國際上應該算是處在領跑位置。”薛愿超說。
診療病毒新“利器”
艾滋病病毒、埃博拉病毒、禽流感病毒等均屬于RNA病毒,它們帶來的疾病正在全球肆虐,威脅人類健康。
薛愿超指出,利用RIC-seq技術能夠在病毒侵入人體細胞的過程中解析病毒RNA的結構和靶標,這將有助于理解RNA病毒的致病機制。同時,根據解析的結構,還可設計出更為有效的小干擾RNA來切割病毒,達到治療的效果。
此外,利用RIC-seq技術還可系統分析重大疾病相關突變對RNA高級結構和作用靶標的影響,這將有望揭示非編碼區突變的致病機理,并為臨床診斷和治療奠定基礎。
不過,新技術應用仍面臨諸多挑戰。薛愿超表示,把RIC-seq技術得到的RNA空間位置信息轉變為可視化的RNA高級結構是當前最大的挑戰。
“解決這一問題,需要與計算模擬和算法開發的專業團隊合作。當然,我們自己也在做各種嘗試,希望近幾年會有成果。”薛愿超說。
下一步,他們希望從RNA結構和相互作用的角度入手,探究非編碼區的疾病相關突變的致病機理,并對RNA拓撲結構域的功能機制等RIC-seq技術引出的科學問題進行探索。