九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
龔海鵬:AlphaFold2與結(jié)構(gòu)生物學(xué)

近年來,受益于人工智能和深度學(xué)習(xí)技術(shù)的快速發(fā)展以及結(jié)構(gòu)生物學(xué)數(shù)據(jù)的大量積累,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的方法學(xué)取得了突破性的進(jìn)展。2020年舉辦的第14屆蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽CASP14中,Google DeepMind團(tuán)隊(duì)開發(fā)出的人工智能算法AlphaFold2(簡(jiǎn)稱AF2)震驚了世界,對(duì)競(jìng)賽的目標(biāo)蛋白的預(yù)測(cè)精度GDT_TS分?jǐn)?shù)超過了90%,意味著對(duì)其中很多蛋白所預(yù)測(cè)的結(jié)構(gòu)與實(shí)驗(yàn)結(jié)構(gòu)非常接近,RMSD在1-2埃以內(nèi)。2021年7月15日,DeepMind團(tuán)隊(duì)在Nature雜志發(fā)表論文,詳細(xì)描述了AF2的設(shè)計(jì)思路,并提供了可運(yùn)行的開源代碼。同一天,David Baker 團(tuán)隊(duì)在Science雜志發(fā)表論文,提出了采用類似設(shè)計(jì)思路的RoseTTAFold算法及其開源代碼。隨后,DeepMind團(tuán)隊(duì)使用AF2預(yù)測(cè)了多個(gè)物種中共30余萬個(gè)無實(shí)驗(yàn)結(jié)構(gòu)的蛋白質(zhì)的結(jié)構(gòu)模型,并聯(lián)手EBI建立了結(jié)構(gòu)預(yù)測(cè)數(shù)據(jù)庫AFDB。這一系列成果的出現(xiàn)吸引了科學(xué)界的大量關(guān)注,大家眾說紛紜。一方面,施一公教授等頂級(jí)結(jié)構(gòu)生物學(xué)家甚至宣稱AF2本世紀(jì)最重要的科學(xué)突破;另一方面,也有科學(xué)家對(duì)AF2預(yù)測(cè)的精度提出質(zhì)疑。此外,有很多人認(rèn)為實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)會(huì)成為昨日黃花,逐漸退出歷史舞臺(tái)。本文中對(duì)此現(xiàn)象做出一些個(gè)人解讀。

撰文 | 龔海鵬(清華大學(xué)生命科學(xué)學(xué)院副教授、博士生導(dǎo)師、北京結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心研究員)

01 AF2的重要性和創(chuàng)新性

根據(jù)Anfinsen法則,蛋白質(zhì)的氨基酸序列決定其三維結(jié)構(gòu),同時(shí)三維結(jié)構(gòu)又是蛋白質(zhì)行使其生物學(xué)功能的基礎(chǔ)。因此,研究蛋白質(zhì)序列和結(jié)構(gòu)間關(guān)系的蛋白質(zhì)折疊問題是生物物理領(lǐng)域最重要的基礎(chǔ)問題之一,困擾了科學(xué)界50年之久。由于蛋白質(zhì)序列和結(jié)構(gòu)之間屬于高維到高維的映射關(guān)系,傳統(tǒng)上采用數(shù)學(xué)或物理的方法都無法解決這一問題。近年來,隨實(shí)驗(yàn)技術(shù)的進(jìn)步,通過新一代測(cè)序技術(shù)和蛋白質(zhì)晶體學(xué)以及冷凍電鏡等結(jié)構(gòu)生物學(xué)方法,積累了大量的蛋白質(zhì)序列和結(jié)構(gòu)信息,為使用人工智能技術(shù)研究序列-結(jié)構(gòu)間關(guān)系打下了良好基礎(chǔ)。從2016年舉辦的CASP12競(jìng)賽開始,各種深度學(xué)習(xí)技術(shù)廣泛應(yīng)用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域,引發(fā)了結(jié)構(gòu)預(yù)測(cè)準(zhǔn)確度的快速提升。AF2是其中的集大成者,采用了不同于以往方法的全新算法設(shè)計(jì),具有極高的創(chuàng)新性。從生物物理角度看,AF2設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)架構(gòu),特別是Evoformer架構(gòu)中序列信息與氨基酸殘基相互作用圖譜間的迭代優(yōu)化,與蛋白質(zhì)折疊的物理機(jī)理隱隱吻合。同時(shí),模型第一次成功地實(shí)現(xiàn)了端對(duì)端的精準(zhǔn)結(jié)構(gòu)預(yù)測(cè),以序列比對(duì)為輸入,不經(jīng)過中間步驟,直接預(yù)測(cè)三維結(jié)構(gòu)坐標(biāo)。此外,能顯著提高預(yù)測(cè)水平的recycling和self-distillation等技術(shù)也是首次應(yīng)用于結(jié)構(gòu)預(yù)測(cè)領(lǐng)域,體現(xiàn)了工程設(shè)計(jì)優(yōu)化對(duì)方法學(xué)發(fā)展的重要性。因此,無論是從方法設(shè)計(jì)的角度還是從性能的角度看,AF2都體現(xiàn)了人工智能方法和生物物理思想的完美結(jié)合,不失為近年來最重要的科學(xué)突破之一。

02 AF2的局限性

受限于算法和硬件,AF2在實(shí)用中還有一定的局限性。首先,DeepMind團(tuán)隊(duì)使用AF2算法對(duì)近期(2018年4月30日至2021年2月15日)新解析出的一萬余條蛋白質(zhì)序列進(jìn)行了結(jié)構(gòu)預(yù)測(cè)。雖然其中近一半的蛋白預(yù)測(cè)精度較高,RMSD95(覆蓋95%殘基的RMSD)在2埃以內(nèi),但是仍有許多蛋白的預(yù)測(cè)結(jié)果不佳,比如近20%的蛋白其RMSD95超過8埃。眾所周知,依托結(jié)構(gòu)的機(jī)理研究和藥物開發(fā)等往往需要高精度的結(jié)構(gòu)模型,誤差在2埃以上的預(yù)測(cè)模型對(duì)真實(shí)應(yīng)用沒有指導(dǎo)作用。因此,針對(duì)這些蛋白,仍然需要采用實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)方法進(jìn)行結(jié)構(gòu)解析。其次,AF2在預(yù)測(cè)時(shí)嚴(yán)重依賴GPU顯存,即使使用目前市面上最好的A100顯卡,在進(jìn)行單卡預(yù)測(cè)時(shí)該算法也僅能處理2500殘基以內(nèi)的蛋白序列。如果使用CPU進(jìn)行預(yù)測(cè)則會(huì)嚴(yán)重影響算法的運(yùn)行效率,而且隨蛋白殘基數(shù)越多,對(duì)內(nèi)存的壓力越大。當(dāng)前的AF2程序還無法像單顆粒冷凍電鏡一樣解析出超大型復(fù)合體的結(jié)構(gòu)。第三,AF2的輸入信息來源于多重序列比對(duì)(MSA),而非單純的氨基酸序列。多重序列比對(duì)相當(dāng)于自然界以進(jìn)化的方式做的實(shí)驗(yàn),其中含有許多額外的信息。根據(jù)測(cè)算,當(dāng)不使用MSA而僅使用目標(biāo)蛋白的單序列信息時(shí),AF2的預(yù)測(cè)精度大幅度下滑。因此AF2還不能算是完全解決了序列和結(jié)構(gòu)間的映射關(guān)系。最后,AF2等結(jié)構(gòu)預(yù)測(cè)方法目前僅能預(yù)測(cè)特定氨基酸序列的一種構(gòu)象。蛋白質(zhì)在行使生物學(xué)功能時(shí)往往需要發(fā)生構(gòu)象變化。比如酶從失活狀態(tài)轉(zhuǎn)變?yōu)榛钚誀顟B(tài)、膜轉(zhuǎn)運(yùn)蛋白需要通過構(gòu)象變化交替接觸膜兩側(cè)的溶液、蛋白和配體結(jié)合時(shí)發(fā)生構(gòu)象變化等等。在實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)方法中,冷凍電鏡、核磁共振、小角散射和單分子等技術(shù)都可以在一定程度上捕捉結(jié)構(gòu)的動(dòng)態(tài)特征,揭示構(gòu)象變化過程。目前的AF2還不具有這樣的能力??梢钥吹?,由于以上局限性,AF2至少在目前階段還無法取代實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)的地位。

03 AF2為新一代結(jié)構(gòu)生物學(xué)的發(fā)展提供契機(jī)

即便有以上的局限性,AF2的提出仍屬于重要的科學(xué)突破。同時(shí)AF2將會(huì)成為實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)的重要工具,并推動(dòng)相關(guān)領(lǐng)域的進(jìn)一步發(fā)展。首先,冷凍電鏡等實(shí)驗(yàn)生物學(xué)研究的前提是目標(biāo)蛋白的表達(dá)和提純,因此往往在天然蛋白質(zhì)序列中引入點(diǎn)突變,以穩(wěn)定蛋白的結(jié)構(gòu)(比如把目標(biāo)蛋白鎖定在一種主要構(gòu)象中)。在缺乏結(jié)構(gòu)信息時(shí),突變位點(diǎn)的設(shè)計(jì)往往以經(jīng)驗(yàn)為主,費(fèi)時(shí)費(fèi)力。AF2可以快速預(yù)測(cè)蛋白的結(jié)構(gòu),為突變位點(diǎn)的設(shè)計(jì)提供重要的結(jié)構(gòu)信息作為參考?;诮Y(jié)構(gòu)的突變位點(diǎn)設(shè)計(jì)顯然更有針對(duì)性,比如相對(duì)于蛋白結(jié)構(gòu)的內(nèi)部殘基,表面的殘基的突變往往不容易破壞結(jié)構(gòu)的穩(wěn)定性。其次,AF2預(yù)測(cè)的結(jié)構(gòu)可以作為實(shí)驗(yàn)結(jié)構(gòu)生物學(xué)的初始結(jié)構(gòu)模型,輔助最終的結(jié)構(gòu)建模。比如,X射線晶體衍射實(shí)驗(yàn)往往由于缺乏相位信息無法建立結(jié)構(gòu)模型,已有研究表明,AF2預(yù)測(cè)的結(jié)構(gòu)可以提供重要的相位信息,從而有效輔助蛋白質(zhì)晶體學(xué)家快速解析結(jié)構(gòu)。再比如,單顆粒冷凍電鏡結(jié)構(gòu)解析中二維圖像的分類對(duì)最終模型的建立至關(guān)重要,但是目前的算法要先依賴經(jīng)驗(yàn)進(jìn)行初始分類再迭代優(yōu)化。AF2預(yù)測(cè)的結(jié)構(gòu)顯然可以對(duì)二維圖像的分類提供重要的理論指導(dǎo),從而進(jìn)一步優(yōu)化電鏡結(jié)構(gòu)模型的建模。第三,AF2預(yù)測(cè)的結(jié)構(gòu)可以提供初始坐標(biāo)作為蛋白質(zhì)結(jié)構(gòu)動(dòng)態(tài)研究的基礎(chǔ)。冷凍電鏡斷層掃描、核磁共振、小角散射以及單分子熒光等實(shí)驗(yàn)可以快速獲取蛋白質(zhì)的部分結(jié)構(gòu)特征用于表征或描述蛋白質(zhì)的結(jié)構(gòu)動(dòng)態(tài)變化,但是這些方法或者只能得到低分辨率的結(jié)構(gòu)信息(如冷凍電鏡斷層掃描),或者完全缺失結(jié)構(gòu)細(xì)節(jié)(如小角散射和單分子熒光),或者需要復(fù)雜冗長(zhǎng)的實(shí)驗(yàn)流程才能得到結(jié)構(gòu)細(xì)節(jié)(如核磁共振)。顯然,AF2預(yù)測(cè)的結(jié)構(gòu)可以為這些方法補(bǔ)充缺失的結(jié)構(gòu)信息。最后,有了AF2預(yù)測(cè)的結(jié)構(gòu),分子動(dòng)力學(xué)模擬等計(jì)算化學(xué)方法也會(huì)有更廣泛的應(yīng)用。傳統(tǒng)的分子動(dòng)力學(xué)模擬計(jì)算需要以可靠的結(jié)構(gòu)作為模擬起始點(diǎn),因此很難用于研究未知結(jié)構(gòu)蛋白。AF2則大大擴(kuò)展了分子動(dòng)力學(xué)模擬計(jì)算的研究范圍,從而對(duì)分子機(jī)理的研究、蛋白質(zhì)設(shè)計(jì)和藥物設(shè)計(jì)等提供重要的輔助作用。

綜上所述,以AF2為代表的新一代蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法將會(huì)成為結(jié)構(gòu)生物學(xué)的重要補(bǔ)充,并推動(dòng)整個(gè)結(jié)構(gòu)生物學(xué)領(lǐng)域的進(jìn)一步發(fā)展。在新的形式下,需要充分利用蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法提供的信息對(duì)結(jié)構(gòu)生物學(xué)的研究模式進(jìn)行新的探索。

作者簡(jiǎn)介

龔海鵬博士分別于1997年和2000年于清華大學(xué)生物科學(xué)與技術(shù)系(后改為生命科學(xué)學(xué)院)獲得學(xué)士以及碩士學(xué)位,后前往美國(guó)約翰霍普金斯大學(xué)攻讀博士學(xué)位,師從George Rose教授,并于 2007年獲得生物物理學(xué)博士學(xué)位。隨后,其加入芝加哥大學(xué)Tobin Sosnick教授實(shí)驗(yàn)室從事博士后研究。2009年,其返回清華大學(xué)任教至今,現(xiàn)為清華大學(xué)生命科學(xué)學(xué)院副教授、博士生導(dǎo)師、北京結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心研究員。其實(shí)驗(yàn)室專注于與蛋白質(zhì)結(jié)構(gòu)相關(guān)的計(jì)算研究和方法開發(fā),包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、定量分析生物大分子的大尺度構(gòu)象變化等研究。

本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號(hào)“結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心”。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
AlphaFold2的原理和架構(gòu)及其在生物學(xué)和醫(yī)學(xué)領(lǐng)域的應(yīng)用
顏寧點(diǎn)評(píng)AlphaFold2 + 外行買家秀:蛋白結(jié)構(gòu)預(yù)測(cè)神器初體驗(yàn)
解決生物學(xué)50年來的重大挑戰(zhàn)!生物界“AlphaGo”精準(zhǔn)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)
AlphaFold預(yù)測(cè)出35萬個(gè)蛋白結(jié)構(gòu)?“狂歡” 之余還需冷靜
AlphaFold數(shù)據(jù)庫的沖擊浪潮
Nat.Commun | 應(yīng)用AlphaFold2進(jìn)行多肽-蛋白質(zhì)對(duì)接
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服