相比現有方案,Colossal-AI 團隊聯合百圖生科的這項研究,推理速度最高提升約 11 倍!
近日,Colossal-AI 團隊聯合百圖生科成功加速蛋白質單體與復合物的結構預測,行業(yè)內最前沿的同時支持蛋白質單體(Monomer)與復合物(Multimer)結構預測的 xTrimo Multimer 模型已免費開源,相比現有方案,推理速度最高提升約 11 倍!
本次解決方案背后優(yōu)化加速技術來自 Colossal-AI,這是一個旨在全面助力 AI 大模型工業(yè)化應用的通用深度學習系統(tǒng)。xTrimo Multimer 開源版模型通過引入 Colossal-AI 的大模型優(yōu)化技術,顯著降低蛋白質結構預測模型訓練和推理的時間和經濟成本,提高蛋白質結構預測模型領域的設計和部署效率,是 Colossal-AI 系統(tǒng)在 AI 大模型 & 生物醫(yī)藥領域落地應用的重要實踐,使得在該領域訓練和使用更大的模型成為可能。
該項目已在 GitHub 上免費開源
Colossal-AI 是一個面向大模型時代的通用深度學習系統(tǒng)。自開源以來,Colossal-AI 不僅在數個月內獲得近五千顆 Github Star,多次登上 GitHub Trending 榜首,相關解決方案也已成功在生物醫(yī)藥、自動駕駛、云計算、零售、芯片等行業(yè)知名廠商落地應用,廣受好評。此次攜手百圖生科,利用雙方在高性能計算和生物計算領域上前沿的技術積淀,提出蛋白質單體與復合物的結構預測加速方案,進一步共同打造繁榮的生物計算生態(tài),精準高效地探尋癌癥、衰老等疾病的免疫規(guī)律,逐一攻破 AI 技術在靶點挖掘、創(chuàng)新藥物設計落地應用上的難關,讓更多疾病可預警、可控制、可治愈。
眾所周知,蛋白質結構預測是結構生物學領域最為重要的課題之一,也是我們理解基因翻譯和蛋白質功能的重要手段。蛋白質之間的相互作用,是蛋白質發(fā)揮生物學功能的重要結構基礎。但是由于蛋白質的多級結構和復雜的相互作用,使得精確預測三維結構這一關鍵問題十分有挑戰(zhàn)性。
近年來,深度神經網絡的成功使得人工智能在各個領域得到了廣泛的應用。自 DeepMind 發(fā)布的 AlphaFold 能夠實現根據氨基酸序列精準預測蛋白質結構以來,生命科學領域掀起了使用人工智能預測蛋白結構的熱潮。
AlphaFold 能夠實現端到端的從序列直接預測單體蛋白質三維結構,但在生物體內,多數蛋白質是以復合體的形式來發(fā)揮功能的。因此,為了打破 AlphaFold 僅在預測單體蛋白方面表現優(yōu)異的局限,DeepMind 后來也發(fā)布了用于預測蛋白復合體結構的 AlphaFold-Multimer 模型。
早在 2022 年 3 月,Colossal-AI 團隊曾推出蛋白質結構預測模型 AlphaFold 的訓練推理加速方案 FastFold,用更低的成本將總體訓練時間從 11 天減少到 67 小時,在長序列推理應用中實現超 11 倍的提升。以此為起點,Colossal-AI 團隊在蛋白質結構預測領域的技術革命正在延續(xù)。
針對蛋白質單體 (Monomer) 與復合物 (Multimer) 結構預測的難題,本次 Colossal-AI 團隊聯合百圖生科提出行業(yè)內最新解決方案 xTrimo Multimer 開源版模型,能夠更好地理解蛋白互作關系,從而提升藥物研發(fā)平臺中靶點分析、蛋白質結構預測和模擬以及高精準抗體設計等方面的能力。
此外,推理階段昂貴的經濟和時間成本使得 AlphaFold 模型相關的研究和開發(fā)十分困難,尤其是面對長序列推理時,計算復雜度和內存消耗都面臨著巨大挑戰(zhàn)。xTrimo Multimer 開源版模型針對 AlphaFold-Multimer 模型中的計算特性,進行了針對性的 CUDA 優(yōu)化,并且進行了 Kernel Fusion。相較于 AlphaFold2 和哥倫比亞大學的 OpenFold,xTrimo Multimer 開源版模型在單卡推理上性能有明顯提升 ,推理速度分別提高 1.58~2.14 倍和 1.14~2.23 倍。
xTrimo Multimer 開源版模型還支持超長序列的分布式推理。由于使用了動態(tài)軸并行(Dynamic Axial Parallelism)技術,xTrimo Multimer 可以高效地將計算和部分顯存分配到不同的設備上,從而解決超長序列面臨的計算和內存挑戰(zhàn)。在 2K 到 3K 的序列長度下,xTrimo Multimer 使用多卡進行推理,相對于 OpenFold 和 AlphaFold 2 推理速度最高提升 8.47 倍和 11.15 倍,對比 Uni-Fold2.0 速度最高提升 4.45 倍。xTrimo Multimer 可以支持長達 4K 的序列推理,此時 OpenFold 和 AlphaFold 2 受限于顯存無法完成推理,而 xTrimo Multimer 可以在 20 分鐘左右完成。
百圖生科首席 AI 科學家宋樂表示:“從對單個蛋白質結構的模擬,到對不同蛋白質之間的相互作用的識別,再到對蛋白質復合物的繪制,百圖生科致力于解碼、建模復雜人體免疫系統(tǒng),開發(fā)突破創(chuàng)新藥物,編程免疫系統(tǒng),治愈多種免疫相關疾病。此次 xTrimo Multimer 開源版模型的發(fā)布,是我們攜手潞晨科技 Colossal-AI 團隊,借助其在高性能計算上的優(yōu)勢以及百圖生科生物計算領域前沿的技術積淀,朝著百圖生科 xTrimo 多模態(tài)生物計算大模型體系邁出的又一步。正如我們一直以來所努力的方向,精準高效地探尋癌癥、衰老等疾病的免疫規(guī)律,逐一攻破 AI 技術在靶點挖掘、創(chuàng)新藥物設計落地應用上的難關,讓更多疾病可預警、可控制、可治愈!”
潞晨科技創(chuàng)始人尤洋教授表示:“ 此次 Colossal-AI 團隊與百圖生科合作的蛋白質單體與復合物結構預測最新方案,是面向大模型時代的通用深度學習系統(tǒng) Colossal-AI 在生物醫(yī)藥領域應用落地的重要進展。未來我們雙方將會繼續(xù)在生物計算大模型上有更深入的合作,助力深度學習在創(chuàng)新藥物研發(fā)上的應用和落地。”
隨著人工智能對各個領域的高度滲透,各行業(yè)的智能化產業(yè)轉型升級都離不開高性能 AI 的加持,潞晨對于 AI 大模型的高效訓練和推理方案是未來 AI 市場的剛需。Colossal-AI 致力于構建針對 AI 大模型的完整生態(tài)系統(tǒng),針對不同行業(yè)的需求提供智能化、一體化的高效靈活解決方案,切實有效解決企業(yè) AI 大模型產品落地的關鍵痛點,為全產業(yè)鏈賦能。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。