張亞勤：大模型做對(duì)了三件事，還需三大改進(jìn)

2024年06月17日 14:01:14 來源：C114通信網(wǎng)

　　日前舉辦的人工智能行業(yè)盛會(huì)“2024北京智源大會(huì)”上，零一萬物CEO李開復(fù)與清華大學(xué)智能產(chǎn)業(yè)研究院院長(zhǎng)、智源學(xué)術(shù)顧問委員張亞勤進(jìn)行了一場(chǎng)尖峰對(duì)話。

　　在對(duì)話中，李開復(fù)強(qiáng)調(diào)，大模型是AI有史以來最大的革命，人類能夠用更多計(jì)算和數(shù)據(jù)不斷讓它增加智慧，目前還在推進(jìn)中，這是令人振奮的事情。當(dāng)然挑戰(zhàn)也非常多，例如當(dāng)前主要靠算力推動(dòng)，使得掌握GPU資源的國(guó)家處在優(yōu)勢(shì)地位;再如因?yàn)閿?shù)據(jù)問題，大模型不知道“最近一年發(fā)生了什么”。當(dāng)然，隨著人類社會(huì)加大研究，李開復(fù)對(duì)大模型的未來十分樂觀。

　　張亞勤則談到，大模型做對(duì)了三件事，還需三大改進(jìn)。

　　做對(duì)了哪三件事?一是規(guī)模法則(Scaling Law)，得益于對(duì)海量數(shù)據(jù)的利用以及算力的顯著提升，再加上現(xiàn)在的Diffusion和Transformer架構(gòu)能夠高效地利用算力和數(shù)據(jù)，使得“飛輪效應(yīng)”得以正循環(huán)。盡管有人質(zhì)疑Scaling Law在2~3年后是否仍然有效，但至少在未來5年里，它仍將是大模型發(fā)展的主要方向。

　　二是“Token Beist”。在大模型中，“Token”是一個(gè)基本元素，無論是文本、語音、圖像、視頻、自動(dòng)駕駛，甚至是生物領(lǐng)域的蛋白質(zhì)和細(xì)胞，最終都可以抽象為一個(gè)Token。Token之間的訓(xùn)練、學(xué)習(xí)和生成是核心環(huán)節(jié)，這與人類大腦中的神經(jīng)元工作原理相似，無論執(zhí)行何種任務(wù)，其基礎(chǔ)機(jī)制都是相同的。

　　三是通用性。通用性不僅體現(xiàn)在文本處理上，還擴(kuò)展到了多模態(tài)領(lǐng)域，甚至可以生成如蛋白質(zhì)等復(fù)雜結(jié)構(gòu)。此外，它在物理世界(如具身智能)和生物世界(如生物智能)中也有著廣泛的應(yīng)用前景。

　　此外大模型還需要做三大改進(jìn)。一是效率，人類大腦擁有860億個(gè)神經(jīng)元，每個(gè)神經(jīng)元又有數(shù)千個(gè)突觸連接，卻只需要20瓦的能量，重量還不到三斤;而大模型還依靠大量堆積GPU，需要建立真正的商業(yè)模式，大幅度提升效率。

　　二是大模型沒有真正理解物理世界。當(dāng)前做的再好的大模型，在生成式和對(duì)世界真實(shí)的表述之間存在矛盾，人類需要探索如何將生成式的概率大模型與現(xiàn)有的“第一性原理”或真實(shí)模型、知識(shí)圖譜相結(jié)合。張亞勤認(rèn)為，未來 5年會(huì)有全新的架構(gòu)替代現(xiàn)在的Transformer和Diffusion模型。

　　三是欠缺邊界。大模型現(xiàn)在不明白“我不知道什么”，需要業(yè)界解決這個(gè)難題。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信