日前舉辦的人工智能行業(yè)盛會“2024北京智源大會”上,零一萬物CEO李開復(fù)與清華大學(xué)智能產(chǎn)業(yè)研究院院長、智源學(xué)術(shù)顧問委員張亞勤進(jìn)行了一場尖峰對話。
在對話中,李開復(fù)強調(diào),大模型是AI有史以來最大的革命,人類能夠用更多計算和數(shù)據(jù)不斷讓它增加智慧,目前還在推進(jìn)中,這是令人振奮的事情。當(dāng)然挑戰(zhàn)也非常多,例如當(dāng)前主要靠算力推動,使得掌握GPU資源的國家處在優(yōu)勢地位;再如因為數(shù)據(jù)問題,大模型不知道“最近一年發(fā)生了什么”。當(dāng)然,隨著人類社會加大研究,李開復(fù)對大模型的未來十分樂觀。
張亞勤則談到,大模型做對了三件事,還需三大改進(jìn)。
做對了哪三件事?一是規(guī)模法則(Scaling Law),得益于對海量數(shù)據(jù)的利用以及算力的顯著提升,再加上現(xiàn)在的Diffusion和Transformer架構(gòu)能夠高效地利用算力和數(shù)據(jù),使得“飛輪效應(yīng)”得以正循環(huán)。盡管有人質(zhì)疑Scaling Law在2~3年后是否仍然有效,但至少在未來5年里,它仍將是大模型發(fā)展的主要方向。
二是“Token Beist”。在大模型中,“Token”是一個基本元素,無論是文本、語音、圖像、視頻、自動駕駛,甚至是生物領(lǐng)域的蛋白質(zhì)和細(xì)胞,最終都可以抽象為一個Token。Token之間的訓(xùn)練、學(xué)習(xí)和生成是核心環(huán)節(jié),這與人類大腦中的神經(jīng)元工作原理相似,無論執(zhí)行何種任務(wù),其基礎(chǔ)機制都是相同的。
三是通用性。通用性不僅體現(xiàn)在文本處理上,還擴展到了多模態(tài)領(lǐng)域,甚至可以生成如蛋白質(zhì)等復(fù)雜結(jié)構(gòu)。此外,它在物理世界(如具身智能)和生物世界(如生物智能)中也有著廣泛的應(yīng)用前景。
此外大模型還需要做三大改進(jìn)。一是效率,人類大腦擁有860億個神經(jīng)元,每個神經(jīng)元又有數(shù)千個突觸連接,卻只需要20瓦的能量,重量還不到三斤;而大模型還依靠大量堆積GPU,需要建立真正的商業(yè)模式,大幅度提升效率。
二是大模型沒有真正理解物理世界。當(dāng)前做的再好的大模型,在生成式和對世界真實的表述之間存在矛盾,人類需要探索如何將生成式的概率大模型與現(xiàn)有的“第一性原理”或真實模型、知識圖譜相結(jié)合。張亞勤認(rèn)為,未來 5年會有全新的架構(gòu)替代現(xiàn)在的Transformer和Diffusion模型。
三是欠缺邊界。大模型現(xiàn)在不明白“我不知道什么”,需要業(yè)界解決這個難題。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。