1. AlphaFold之后:蛋白質折疊大賽尋求下一個重大突破

      【字體: 時間:2022年12月16日 來源:nature

      編輯推薦:

        在DeepMind革命性的人工智能橫掃蛋白質結構預測競賽兩年后,研究人員正在利用AlphaFold的成功。

        
      Protein structure model of DNA polymerase I. An enzyme that participates in the DNA replication          

      蛋白質的功能是由它的三維形狀決定的。

      “在某種意義上,問題已經解決了,”計算生物學家John Moult在2020年底宣布?偛课挥趥惗氐腄eepMind公司剛剛在一場由Moult聯合創辦的兩年一度的比賽中大獲成功,該比賽用其革命性的人工智能(AI)工具AlphaFold測試團隊預測蛋白質結構的能力——這是生物學最艱巨的挑戰之一。

      兩年后,Moult的競爭對手,結構預測關鍵評估(CASP),仍然走在AlphaFold的長長的陰影中。本周末在土耳其安塔利亞的一次會議上公布的今年版本(CASP15)的結果顯示,從氨基酸序列預測蛋白質結構的最成功方法包含了AlphaFold,它依賴于一種稱為深度學習的人工智能方法!懊總人都在使用AlphaFold,”密歇根大學安娜堡分校(University of Michigan in Ann Arbor)的計算生物學家Yang Zhang說。

      然而,AlphaFold的進展為蛋白質結構預測的新挑戰打開了閘門——其中一些包括在今年的CASP中——這些挑戰可能需要新的方法和更多的時間來完全解決。紐約哥倫比亞大學的計算生物學家Mohammed AlQuraishi說:“唾手可得的果實已經被摘走了。接下來的一些問題會更難!

      CASP成立于1994年,旨在提高蛋白質結構預測領域的精確性——這方面的進展將加速人們對細胞組成部分的理解,并推動藥物的發現。在比賽的一年中,各團隊的任務是使用計算工具來預測蛋白質的結構,這些結構已經通過x射線晶體學和冷凍電子顯微鏡等實驗方法確定,但尚未公布。

      條目是根據整個蛋白質的預測,或稱為結構域的獨立折疊亞基與實驗結構的匹配程度進行評估的。AlphaFold在CASP14上的一些預測與實驗模型或多或少沒有什么區別——這是第一次達到這樣的準確性。

      自從在CASP14上亮相以來,AlphaFold已經在生命科學研究中無處不在。DeepMind在2021年發布了該軟件的底層代碼,以便任何人都可以運行該程序,今年更新的AlphaFold數據庫包含了基因組數據庫中所代表的所有生物中幾乎所有蛋白質的預測結構(質量各異),總共超過2億種蛋白質。

      AlphaFold的成功和新發現的無處不在對正在馬里蘭大學羅克維爾分校(University of Maryland, Rockville)工作的Moult和他的同事們提出了挑戰,他們正在計劃今年的CASP!叭藗冋f,‘哦,我們不再需要CASP了,問題已經解決了!艺J為這完全是錯誤的!

      在CASP15上,最成功的團隊是那些以各種方式適應和構建AlphaFold的團隊,在預測單個蛋白質和結構域的形狀方面取得了適度的進展。Moult說:“精確度已經很高了,很難再提高了!

      蛋白復合物

      為了讓比賽在后Alphafold時代更有意義,Moult和他的團隊增加了新的挑戰,并對一些現有的挑戰進行了調整。新的測試包括確定蛋白質如何與其他分子(如藥物)相互作用,以及預測一些蛋白質可以呈現的多種形狀。在過去的十年中,CASP包括了多種相互作用蛋白質的“復合物”,Moult說,但準確預測這些分子的結構在今年得到了更多的重視。

      “這是正確的事情,”Zhang說,因為預測單個蛋白質或結構域的結構在很大程度上已經被AlphaFold解決了。斯德哥爾摩大學的蛋白質生物信息學家Arne Elofsson說,特別是確定蛋白質復合物的形狀,對該領域來說是一個重要的新挑戰,因為還有很大的改進空間。

      AlphaFold最初被設計用來預測單個蛋白質的形狀。但是,在它公開發布的幾天內,其他科學家表示,該軟件可以被“黑”來模擬多種蛋白質的相互作用。在那之后的幾個月里,研究人員想出了無數種方法來提高AlphaFold處理復合物的能力。為了實現這一目標,DeepMind甚至發布了一個名為AlphaFold-Multimer的更新。

      這樣的努力似乎得到了回報,因為與之前的比賽相比,CASP15的精確復合體數量顯著增加,這主要是因為采用了適應AlphaFold的方法!皩ξ覀儊碚f,這是一個接近實驗準確度的新游戲。Moult說!拔覀円灿幸恍┦!

      例如,研究小組對一種功能未知的病毒分子做出了驚人的準確預測,這種病毒分子由兩個相同的相互纏繞的蛋白質組成。土耳其伊茲密爾生物醫學和基因組中心的計算結構生物學家Ezgi Karaca評估了這種復雜的預測,他說,這種形狀迷惑了AlphaFold之前的工具。Karaca補充說,AlphaFold的標準版本未能準確地模擬一個巨大的20鏈細菌酶的形狀,但一些團隊通過對網絡應用額外的黑客來預測蛋白質的結構。

      與此同時,研究團隊努力預測涉及被稱為抗體的免疫分子的復合物——包括幾個附著在SARS-CoV-2蛋白質上的抗體——以及被稱為納米體的相關分子。但Karaca說,在一些團隊的預測中有一些成功的跡象,這表明入侵AlphaFold將有助于預測這些醫學上重要分子的形狀。

      今年的CASP也因DeepMind的缺席而引人注目。該公司沒有說明不參加的原因,但在CASP15期間發布了一份簡短的聲明,祝賀參加的團隊。(與此同時,它還對AlphaFold進行了更新,以幫助研究人員將他們的進展與該網絡進行比較。)

      其他研究人員表示,競爭需要投入相當多的時間,公司可能會覺得把這些時間花在其他挑戰上更好。Moult說:“如果他們能參與進來,對我們來說就太好了!钡a充說,“因為這些方法太好了,他們不可能再實現一次大飛躍”。

      研究人員表示,對AlphaFold進行重大改進需要時間,而且可能需要在機器學習和蛋白質結構預測方面進行新的創新。正在開發的一個領域是“語言模型”的應用,例如在預測文本工具中使用的“語言模型”,用于預測蛋白質結構。但這些方法——包括社交網絡巨頭Meta開發的一種方法——在CASP15上的表現遠不如基于AlphaFold的工具。

      然而,這些工具可能有助于預測突變如何改變蛋白質結構——這是AlphaFold成功后蛋白質結構預測中出現的幾個關鍵挑戰之一。AlQuraishi說,由于這一點,該領域不再專注于一個單一的目標!坝幸淮蠖堰@樣的問題!


      相關新聞
      生物通微信公眾號
      微信
      新浪微博
      • 搜索
      • 國際
      • 國內
      • 人物
      • 產業
      • 熱點
      • 科普
      • 急聘職位
      • 高薪職位

      知名企業招聘

      熱點排行

        今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 儀器云展臺 | 實驗云展廳 | 云講堂直播 | 會展中心 | 特價專欄 | 免費試用 | 有獎調研

        版權所有 生物通

        Copyright© eBiotrade.com, All Rights Reserved

        聯系信箱:

        粵ICP備09063491號

        CHINESEFREEXXXX中国偷拍