年輕人要的情緒價(jià)值,被這座城市承包了停更1217天!李子柒回歸,全網(wǎng)震動(dòng)!百度沈抖:AI應(yīng)用在B端率先爆發(fā)雙十一百吋巨幕電視之爭(zhēng),為何98吋更受追捧更值得買?華為、OPPO、vivo、小米共同打造統(tǒng)一鏈接平臺(tái):打破壁壘,App 一鍵下載AI公司開(kāi)始“卷”智能體:OpenAI計(jì)劃明年1月發(fā)布 能控制計(jì)算機(jī)并獨(dú)立執(zhí)行任務(wù)Oura CEO堅(jiān)信蘋(píng)果不會(huì)開(kāi)發(fā)智能戒指,因?yàn)闀?huì)削弱Apple Watch銷量淘寶接入微信支付互聯(lián)互通 騰訊:做了很多努力 效果非常滿意vivo X200 Ultra影像細(xì)節(jié)曝光:搭載全高規(guī)格三攝三星Galaxy S25全球標(biāo)配驍龍8至尊版:或因Exynos 2500良率太低江波龍拓展全球汽車與工業(yè)存儲(chǔ)市場(chǎng)智能化,比亞迪到了不得不突圍的時(shí)候完美無(wú)孔屏、全面超越iPhone!努比亞Z70 Ultra定檔11月21日以高品質(zhì)助力用戶換新!海爾智家拿下雙11全網(wǎng)第一Switch 2沒(méi)等來(lái),任天堂先搞了個(gè)音樂(lè)APP淘寶直播救不了美特斯邦威“雙11”多方搏殺,拼多多求勝邏輯在哪?汽車之家利潤(rùn)大降:逆風(fēng)時(shí)代遇上保守職業(yè)經(jīng)理人中國(guó)智算建設(shè)潮背后,誰(shuí)在推動(dòng)十萬(wàn)卡集群閑魚(yú)無(wú)限生長(zhǎng)
  • 首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 業(yè)界新聞

    網(wǎng)易有道CEO周楓談大語(yǔ)言模型:三項(xiàng)根本性新能力最為關(guān)鍵

    2023年04月24日 11:27:19   來(lái)源:網(wǎng)易科技

      近日,網(wǎng)易有道CEO周楓在個(gè)人公眾號(hào)發(fā)文,探討大語(yǔ)言模型技術(shù)帶來(lái)的三項(xiàng)根本性新能力。他指出,在大模型帶來(lái)的新能力中,涌現(xiàn)能力、作為基座模型支持多元應(yīng)用的能力和支持對(duì)話作為統(tǒng)一入口的能力最為關(guān)鍵,可能給業(yè)界和產(chǎn)品帶來(lái)長(zhǎng)期影響,值得重點(diǎn)關(guān)注。

      以下為內(nèi)容全文:

      基于大語(yǔ)言模型技術(shù)的ChatGPT推出已經(jīng)有4個(gè)月了,更多同類產(chǎn)品還在快速出現(xiàn)。比如,前天谷歌更新了Bard,將輔助編程能力支持的語(yǔ)言數(shù)量擴(kuò)展到20種。

      然而,對(duì)大模型技術(shù)的重要性也出現(xiàn)了質(zhì)疑,前段時(shí)間,吳軍老師就評(píng)價(jià)ChatGPT不算新技術(shù)革命,帶不來(lái)什么新的機(jī)會(huì),他認(rèn)為大模型仍然存在很多限制,不像大家追捧的那樣有吸引力。這篇文章發(fā)布后,網(wǎng)上也出現(xiàn)了多篇反駁文章。我不太關(guān)注這些爭(zhēng)論,但我認(rèn)為有一個(gè)問(wèn)題沒(méi)有被充分討論,那就是大模型帶來(lái)的新能力中,哪些是最為關(guān)鍵的,最有可能帶來(lái)長(zhǎng)期影響的。

      我認(rèn)為,與之前眾多的自然語(yǔ)言處理技術(shù)相比,大語(yǔ)言模型至少具有三項(xiàng)根本性新能力,這些新能力在學(xué)術(shù)界已經(jīng)被廣泛討論,甚至被視為常識(shí),但是在產(chǎn)業(yè)界和產(chǎn)品團(tuán)隊(duì)中卻缺乏足夠的關(guān)注。實(shí)際上,這些大模型技術(shù)的特點(diǎn)已經(jīng)改變了我們對(duì)業(yè)務(wù)和產(chǎn)品規(guī)劃的思考方式,也會(huì)改變很多產(chǎn)品的經(jīng)濟(jì)模型。因此,產(chǎn)品經(jīng)理和業(yè)務(wù)負(fù)責(zé)人需要更多地關(guān)注和深入思考這些新能力的應(yīng)用場(chǎng)景。

      能力一:涌現(xiàn)能力(emergent abilities)

      涌現(xiàn)能力指的是在小型模型中并不存在,但在大模型中“突然出現(xiàn)”的能力,其中包括常識(shí)推理、問(wèn)答、翻譯、數(shù)學(xué)、摘要等(詳見(jiàn)下圖)。如果僅依靠小型模型的能力做線性外推,往往無(wú)法預(yù)測(cè)出涌現(xiàn)能力的出現(xiàn)和其強(qiáng)度。OpenAI的首席技術(shù)官Ilya Sutskever在接受采訪時(shí)反復(fù)強(qiáng)調(diào),盡管表面上看來(lái),語(yǔ)言模型只是在預(yù)測(cè)下一個(gè)詞元(token),但當(dāng)模型足夠大,transformer技術(shù)的建模能力足夠強(qiáng)時(shí),基于內(nèi)部表示的推理能力就會(huì)出現(xiàn)。因此,模型會(huì)呈現(xiàn)出與規(guī)模較小時(shí)完全不同的行為,涌現(xiàn)全新的能力。

      隨著語(yǔ)言模型參數(shù)數(shù)量增加,新的能力逐步涌現(xiàn)且質(zhì)量快速提升。

      涌現(xiàn)能力之所以重要,不僅因?yàn)樗鼈兪谴竽P统霈F(xiàn)后才有的新能力,而且由大模型涌現(xiàn)出來(lái)的多數(shù)是非常重要的能力。例如,常識(shí)推理能力一直是AI領(lǐng)域的重大難題,而大模型的出現(xiàn)使得常識(shí)推理取得了重大進(jìn)展。此外,大模型還有機(jī)會(huì)進(jìn)一步獲得更多能力。例如,一旦“推理”能力涌現(xiàn),“思維鏈提示”(Chain of Thought Prompting)策略就可以用來(lái)解決多步推理的難題。因此,涌現(xiàn)能力的出現(xiàn),是大模型帶來(lái)的一項(xiàng)根本性變化。

      能力二:作為基座模型支持多元應(yīng)用的能力

      在2021年,斯坦福大學(xué)等多所高校的研究人員提出了基座模型(foundation model)的概念,這更清晰地描述了之前學(xué)界所稱的預(yù)訓(xùn)練模型的作用。這是一種全新的AI技術(shù)范式,借助于海量無(wú)標(biāo)注數(shù)據(jù)的訓(xùn)練,獲得可以適用于大量下游任務(wù)的大模型(單模態(tài)或者多模態(tài))。這樣,多個(gè)應(yīng)用可以只依賴于一個(gè)或少數(shù)幾個(gè)大模型進(jìn)行統(tǒng)一建設(shè)。

      上圖展示了基座模型的結(jié)構(gòu),基座模型集中化了多模態(tài)數(shù)據(jù),并且可以適配多元化的下游任務(wù)。

      大語(yǔ)言模型是這個(gè)新模式的典型例子,使用統(tǒng)一的大模型可以極大地提高研發(fā)效率,相比于分散的模型開(kāi)發(fā)方式,這是一項(xiàng)本質(zhì)上的進(jìn)步。大型模型不僅可以縮短每個(gè)具體應(yīng)用的開(kāi)發(fā)周期,減少所需人力投入,也可以基于大模型的推理、常識(shí)和寫(xiě)作能力,獲得更好的應(yīng)用效果。因此,大模型可以成為AI應(yīng)用開(kāi)發(fā)的大一統(tǒng)基座模型,這是一個(gè)一舉多得、全新的范式,值得大力推廣。

      能力三:支持對(duì)話作為統(tǒng)一入口的能力

      讓大語(yǔ)言模型真正火爆的契機(jī),是基于對(duì)話聊天的ChatGPT。事實(shí)上,業(yè)界很早就發(fā)現(xiàn)了用戶對(duì)于對(duì)話交互的特殊偏好,陸奇在微軟期間2016年就推進(jìn)“對(duì)話即平臺(tái)(conversation as a platform)”的戰(zhàn)略。此外,蘋(píng)果Siri、亞馬遜Echo等基于語(yǔ)音對(duì)話的產(chǎn)品也非常受歡迎,反映出互聯(lián)網(wǎng)用戶對(duì)于聊天和對(duì)話這種交互模式的偏好。雖然之前的聊天機(jī)器人存在各種問(wèn)題,但大型語(yǔ)言模型的出現(xiàn)再次讓聊天機(jī)器人這種交互模式可以重新想像。用戶愈發(fā)期待像鋼鐵俠中“賈維斯”一樣的人工智能,無(wú)所不能、無(wú)所不知。這引發(fā)我們對(duì)于智能體(Agent)類型應(yīng)用前景的思考,Auto-GPT、微軟Jarvis等項(xiàng)目已經(jīng)出現(xiàn)并受到關(guān)注,相信未來(lái)會(huì)涌現(xiàn)出很多類似的以對(duì)話形態(tài)讓助手完成各種具體工作的項(xiàng)目。

      圖為微軟最新項(xiàng)目Jarvis的工作流程,Jarvis將通過(guò)任務(wù)規(guī)劃、模型選擇、任務(wù)執(zhí)行、生成響應(yīng)四個(gè)步驟,結(jié)合HuggingFace上的眾多模型,完成多模態(tài)的復(fù)雜AI任務(wù)。

      隨著大型語(yǔ)言模型技術(shù)越來(lái)越受歡迎,我們可以期待它帶來(lái)更多的驚喜,特別是考慮到上面討論的這些大型模型帶來(lái)的關(guān)鍵新能力,周明等人所預(yù)測(cè)的語(yǔ)言智能黃金十年(2020-2030)很可能會(huì)成為現(xiàn)實(shí),這正是一個(gè)令人興奮的時(shí)代。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    唯品會(huì)雙11銷量前十品牌中有7個(gè)國(guó)貨品牌

    11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(tái)(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費(fèi)前列,女士夾克銷量同比增長(zhǎng)72%,女士棉衣、女士羊毛衫銷量同比增長(zhǎng)50%以上。男士外套銷量同比增長(zhǎng)30%以上。

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。