国产精品视频一区二区三区w,强伦轩人妻一区二区电影,99久久久无码国产精品性男同,周星驰电影

技術文獻

新的深度學習方法從氨基酸序列預測蛋白質結構 遠慕新聞√
閱讀次數:650 發布時間:2019/4/25 10:20:07
分享到:

生命所必需的幾乎所有基本生物過程都是由蛋白質完成的。它們創造并保持細胞和組織的形狀;構成催化維持生命的化學反應的酶;充當分子工廠,運輸工具和電機;用作蜂窩通信的信號和接收器;以及更多。

蛋白質由長鏈氨基酸組成,通過將自身折疊成精確的3D結構來控制它們與其他分子的相互作用,從而完成這些無數的任務。由于蛋白質的形狀決定了它的功能及其在疾病中的功能障礙程度,因此闡明蛋白質結構的努力是所有分子生物學的核心 - 特別是治療科學以及拯救生命和改變生命的藥物的發展。

近年來,計算方法在基于其氨基酸序列的知識預測蛋白質如何折疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和范圍方面受到限制。

現在,哈佛醫學院的一位科學家使用了一種稱為深度學習的人工智能來預測基于其氨基酸序列的任何蛋白質的三維結構。

系統生物學家Mohammed AlQuraishi于4月17日在Cell Systems上在線報道,詳細介紹了一種計算確定蛋白質結構的新方法 - 實現與當前方法相當的精確度,但速度提高了一百萬倍。

“在過去的半個世紀里,蛋白質折疊一直是生物化學家*重要的問題,這種方法代表了應對這一挑戰的一種全新方式,”AlQuraishi說,他是HMS Blavatnik研究所系統生物學講師,同時也是系統藥理學實驗室。“我們現在有一個全新的遠景來探索蛋白質折疊,我想我們剛剛開始劃傷表面。”

容易說明

雖然非常成功,但使用物理工具識別蛋白質結構的過程既昂貴又耗時,即使使用低溫電子顯微鏡等現代技術也是如此。因此,絕大多數蛋白質結構 - 以及引起疾病的突變對這些結構的影響 - 仍然在很大程度上是未知的。

計算蛋白質折疊方式的計算方法有可能顯著降低確定結構所需的成本和時間。但是,經過近四十年的緊張努力,這個問題很難解決。

蛋白質由20種不同氨基酸的文庫構建。這些行為像字母表中的字母,組合成單詞,句子和段落,以產生天文數字的可能文本。然而,與字母不同,氨基酸是位于3D空間中的物理對象。通常,蛋白質的部分將在物理上接近,但在序列方面間隔很遠,因為其氨基酸鏈形成環,螺旋,片和扭曲。

“這個問題引人注目的是它很容易陳述:采取一個序列并找出形狀,”AlQuraishi說。“一種蛋白質起源于一種非結構化的細胞系,必須具有三維形狀,一根細繩可以折疊成可能形狀的形狀是巨大的。許多蛋白質長達數千個氨基酸,并且復雜性很快超過了人類直覺甚至是*強大的計算機。“

很難解決

為了應對這一挑戰,科學家利用氨基酸根據物理定律相互作用的事實,尋找能量有利的狀態,如滾球下坡到山谷底部。

的算法通過在超級計算機上運行來計算蛋白質結構 - 或者在Rosetta @ Home和Folding @ Home等項目中利用眾包計算能力來模擬氨基酸相互作用的復雜物理通過蠻力。為了減少大量的計算需求,這些項目依賴于將新序列映射到預定義的模板上,這些模板是先前通過實驗確定的蛋白質結構。

其他項目,如谷歌的AlphaFold,通過利用人工智能的進步來預測蛋白質的結構,*近產生了巨大的興奮。為此,這些方法解析了大量的基因組數據,其中包含蛋白質序列的藍圖。他們尋找可能一起進化的許多物種的序列,使用這樣的序列作為與指導結構組件緊密物理接近的指示物。

然而,這些AI方法不能僅基于蛋白質的氨基酸序列預測結構。因此,它們對于沒有先驗知識的蛋白質,進化獨特蛋白質或人類設計的新蛋白質具有有限的功效。

深入培訓

為了開發新方法,AlQuraishi應用了所謂的端到端可微分深度學習。人工智能的這一分支極大地降低了解決圖像和語音識別等問題所需的計算能力和時間,從而實現了Apple的Siri和Google Translate等應用程序。

本質上,可微分學習涉及單一的,巨大的數學函數 - 高中微積分方程的更復雜版本 - 被安排為神經網絡,網絡的每個組成部分向前和向后饋送信息。

該功能可以在難以想象的復雜程度上反復調整和調整自身,以便“精確地”學習蛋白質序列在數學上與其結構的關系。

AlQuraishi開發了一種深度學習模型,稱為復發幾何網絡,側重于蛋白質折疊的關鍵特征。但在它可以進行新的預測之前,必須使用先前確定的序列和結構進行訓練。

對于每種氨基酸,該模型預測將氨基酸與其鄰居連接的化學鍵的*可能角度。它還預測圍繞這些鍵的旋轉角度,這會影響蛋白質的任何局部區域與整個結構的幾何關系。

這是重復進行的,每次計算都通過每個其他氨基酸的相對位置進行通知和改進。一旦整個結構完成,模型通過將其與蛋白質的“基礎事實”結構進行比較來檢查其預測的準確性。

對于數千種已知蛋白質,重復整個過程,模型學習并在每次迭代時提高其準確性。

新的遠景

一旦他的模型被訓練,AlQuraishi測試了它的預測能力。他將其性能與*近幾年蛋白質結構預測的關鍵評估中的其他方法進行了比較 - 這是一項年度實驗,測試計算方法是否能夠使用已經確定但未公開發布的蛋白質結構進行預測。

他發現新模型在預測蛋白質結構方面優于所有其他方法,其中沒有預先存在的模板,包括使用共同進化數據的方法。當預先存在的模板可用于進行預測時,它也優于除*佳方法之外的所有方法。

雖然這些準確度的提高相對較小,但AlQuraishi指出,這些測試端的任何改進都難以實現。并且因為這種方法代表了一種全新的蛋白質折疊方法,它可以補充現有的計算和物理方法,以確定比以前更廣泛的結構。

引人注目的是,新模型的預測速度比現有的計算方法快6到7個數量級。訓練模型可能需要數月,但一旦訓練,它可以在幾毫秒內進行預測,與使用其他方法所花費的時間相比。這種顯著的改進部分是由于它所基于的單一數學函數,只需要幾千行計算機代碼而不是數百萬。

AlQuraishi說,這種模型預測的快速速度使得以前緩慢或難以實現的新應用成為可能,例如預測蛋白質在與其他分子相互作用時如何改變其形狀。

“深度學習方法,不僅僅是我的方法,將繼續增強其預測能力和普及性,因為它們代表了一種簡單,簡單的范例,可以比現有的復雜模型更容易地整合新思想,”他補充道。

AlQuraishi說,新模型還沒有立即用于藥物發現或設計,因為它的準確度目前大約在6埃左右 - 距離解決完整原子結構所需的1到2埃還有一段距離。一種蛋白質。但他說,有很多機會可以優化這種方法,包括進一步整合化學和物理學的規則。

“準確有效地預測蛋白質折疊一直是該領域的圣杯,我希望并期望這種方法與已開發的所有其他卓越方法相結合,能夠在不久的將來實現這一目標, “AlQuraishi說。“我們很快就可以解決這個問題,而且我認為五年前沒有人會這么說。這是非常令人興奮的,同時也是令人震驚的。”

為了幫助其他人參與方法開發,AlQuraishi通過GitHub軟件共享平臺免費提供他的軟件和結果。

“AlQuraishi工作的一個顯著特點是,嵌入哈佛醫學院和波士頓生物醫學界豐富的研究生態系統的單一研究人員可以與谷歌等公司在計算機科學*熱門的領域競爭,”彼得說。 Sorger,HMS Otto Krayer HMS Blavatnik研究所系統藥理學教授,HMS系統藥理學實驗室主任和AlQuraishi的學術導師。

“低估像AlQuraishi這樣的優秀研究員在公共領域使用開源軟件的破壞性影響是不明智的,”Sorger說。

原創作者:上海遠慕生物科技有限公司

產品搜索

請輸入要搜索的關鍵詞

聯系我們
  • 公司名稱:上海遠慕生物科技有限公司
  • 公司地址:上海市嘉定區曹安公路5588號
  • 公司電話:021-58999639
  • 公司傳真:021-58999639
  • 聯系人:俞燕熙
  • 手機:13310162040
  • 網址:www.yuanmubio.com

上海遠慕生物科技有限公司:細胞凍存液,氨芐青霉素溶液,人白介素ELISA試劑盒,大鼠ELISA試劑盒,小鼠ELISA試劑盒,顯色試劑盒,新生牛血清,標準胎牛血清,牛血清白蛋白溶液,小鼠血漿,雞紅細胞,透明質酸酶溶液,微生物培養基,胰蛋白酶儲存液,兩性霉素B溶液,LB冷凍緩沖液,ABTS試劑,磷酸酶抑制劑,EB緩沖液,熒光染色試劑盒,肥大細胞染色液,人源基因質粒,胡蔓藤堿乙標準品,番茄紅素標準品,Pd-C-II標準品,知母皂苷E標準品,穿刺培養基,puc19質粒,CPD抗凝劑,熒光抗體稀釋液
地址:上海市嘉定區曹安公路5588號 電話:021-58999639 傳真:021-58999639 技術支持:阿儀網 總訪問量:7508884

在線客服
熱線電話

02158999639

13310162040

工作時間:8:30-18:00

13

阿儀網推薦收藏該企業網站