格里菲斯大學(Griffith University)的研究人員在世界上首屈一指,已使用人工智能方法更好地預測RNA二級結構,希望可以將其開發成為更好地了解RNA如何與多種疾病(例如癌癥)相關的工具。周耀奇教授,庫爾迪普·帕利瓦爾教授,博士 格里菲斯糖業研究所和信號處理實驗室的學生Jaswinder Singh和Jack Hanson博士領導了這項研究,該研究已在《自然通訊》上發表。
在所有生命形式中,核糖核酸(RNA)對于基因的編碼,解碼,調節和表達都是必不可少的。RNA和DNA是生命形式中的四個主要大分子。該團隊利用深度學習(一種人工智能的子集,用于創建復雜的數字函數,無需明確的人工指導即可自動逼近特定任務)來構建RNA序列與結構之間關系的更準確模型。這項進展是在先前的預測RNA結構的方法停滯了十多年之后做出的。
周教授希望這種新方法對設計具有治療潛力的新RNA分子有用。周教授說:“想象一下蛋白質和RNA是否是兩個人,蛋白質站在RNA的前面-我們的重點自然是蛋白質。”“因此,盡管事實是蛋白質的數量比RNA的數量多10倍,但我們對這些RNA在人體中的用途一無所知。“這就是我們開發該工具的原因:提供一些結構線索。獲取線索非常重要,因為越來越多的RNA與包括多種癌癥在內的更多疾病有關。
“最令人振奮的方面是,我們現在可以更好地將測序信息與結構聯系起來。我們的序列被編碼在我們的基因組中,但是它們如何通過結構與其功能相關尚不清楚。“使用這種深度學習技術,我們可以更好地將序列連接到結構上,并更好地了解它們的功能。一旦我們了解了序列如何編碼結構并因此起作用,我們就可以設計RNA來完成特定目的,例如新藥或分子傳感器。”
為了開發該方法,團隊必須通過采購近似的計算數據來擴展已知RNA結構的現有數據集,然后使用精確的數據完善自動訓練方法。帕利瓦爾教授說,只有大約3000萬未知基因中只有不到250種非冗余的已知RNA結構可訪問,這是一個挑戰,只有使用其深度學習方法才能解決。
帕利瓦爾教授說:“在這項研究中,通過深度學習來模擬RNA核苷酸序列與這些核苷酸堿基在其功能結構中的配對之間的基本關系。”“這是一個非常復雜的功能,因為從理論上講,核苷酸可以與RNA中的任何其他堿基配對,因此深度學習神經網絡的工作是找出哪些核苷酸配對在一起。“更重要的是,這些算法必須通用并且可用于數百萬個獨特的RNA序列。
“在我們的工作之前,大多數以前的研究都依賴于基于RNA生物學家族的比較方案或基于統計的手工評分算法。這些方法可以某種程度地模擬將RNA核苷酸序列與其配對結構聯系起來的極其復雜的功能,但是已經達到了堿基對預測的準確度停滯在80%左右。“利用深度學習,我們能夠克服所有這些缺點,為所有RNA結構提供一攬子解決方案,同時打破了已有十多年的性能上限,堿基對準確性達到93%。”
研究小組表示,將深度學習用于RNA堿基對的預測是一種可行的工具,并且是世界首創,與以前的嘗試相比,它幾乎在所有方面都具有出色的性能。糖業研究所的創始人兼所長Mark von Itzstein AO教授說:“這一發現為其他計算研究小組為該問題的未來研究開辟了道路,同時為從事生物醫學,藥物研究的實驗實驗室提供了更準確的工具。發現和分子生物學。”
“ 使用二維深度神經網絡和傳遞學習的集成進行RNA二級結構預測”的研究已發表在《自然通訊》上。