1元鎖定早鳥權(quán)益包解鎖實在好禮 CES 2025新品可在京東搶先預約聯(lián)發(fā)科技攜手Cocos共建端側(cè)生成式AI游戲開發(fā)生態(tài),推動行業(yè)升級阿里 無憂傳媒等聯(lián)合發(fā)起杭州市生產(chǎn)性服務業(yè)促進會智能駕駛的中場戰(zhàn)事,如何降本增效穿越周期?多款產(chǎn)品燃爆CES 2025,透視涂鴉的長期主義價值淘寶又來微信挖流量了世界經(jīng)濟論壇研究:企業(yè)更傾向于 AI 培訓而非裁員 ​TECNO攬獲CES 2024-2025 年度全球智能手機領先品牌TOP10及兩項產(chǎn)品創(chuàng)新大獎英偉達發(fā)布Groot Teleop 技術(shù) 允許通過Apple Vision Pro來訓練機器人2024胡潤中國人工智能企業(yè)50強榜單:科大訊飛第二、商湯科技第三Stability AI 推出 SPAR3D:單圖像生成3D 對象一秒鐘搞定水軍黑產(chǎn)瞄上了視頻創(chuàng)作者 抖音提醒:謹慎甄別“詐騙廣告”字節(jié)聯(lián)合高校出品!STAR 模型:提升視頻清晰度和分辨率Adobe 的 TransPixar將煙霧、反射等透明效果無縫融入場景810 億元,財政部已預下達 2025 年消費品以舊換新資金全新視頻修復技術(shù) SeedVR:模糊變高清,可處理任意長度視頻微軟正式開源超強小模型Phi-4通義萬相推2.1視頻模型 大幅提升復雜運動能力保險極客受邀出席2025年分子保險科技節(jié),暢談團險全流程數(shù)智升級2nm 半導體爭奪戰(zhàn):日本 Rapidus 試制博通芯片,計劃 6 月交付
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 業(yè)界新聞

    谷歌組建新AI團隊開發(fā)“世界模型”:通往AGI的關(guān)鍵路徑

    2025年01月08日 14:18:56   來源:極客網(wǎng)

      最近谷歌組建一個新團隊,專門開發(fā)可以用來模擬物理世界的AI模型,也就是所謂的“世界模型”(World Models)。

      蒂姆·布魯克斯(Tim Brooks)原本是OpenAI的一名高管,也是視頻生成工具Sora的主要開發(fā)者之一。去年10月,他加入谷歌DeepMind,成為新領導之一。模擬物理世界的AI模型團隊是谷歌DeepMind的一部分。

      布魯克斯說:“DeepMind有著宏大的計劃,它準備開發(fā)巨大的生成式模型,可以模擬物理世界。我受聘之后將會成為新團隊的一員,努力幫公司達成新使命。”

      新團隊將會與谷歌Gemini、Veo、Genie團隊合作,努力解決關(guān)鍵性新問題。Veo是谷歌自己的視頻生成模型;Gemini相當于谷歌的旗艦AI模型,它可以分析圖片,生成文本,可以模擬游戲、3D環(huán)境;最新的Genie版本于去年12月揭開面紗,它已經(jīng)可以生成巨大多變的可玩性3D世界。

      “世界模型”是通往AGI的關(guān)鍵路徑

      在新團隊招聘信息中能看到這樣的話:“我們相信在視頻、多模態(tài)方面擴大AI訓練規(guī)模是通往AGI的關(guān)鍵路徑。”

      AGI是頂尖AI企業(yè)共同追求的目標,它指的是AI可以像人一樣完成任何任務。

      AI行業(yè)人士認為,世界模型就是AI的下一個大事件。“世界模型”這個術(shù)語實際上是從人類心智派生出來的,它是人類自然進化而來。

      人類大腦會從感官中抽象一些表征,從而加深對周圍世界的理解,形成所謂的“模型”,大腦會根據(jù)這些模型進行預測,繼而影響人對世界的感知。

      棒球手打球時,只需要幾毫秒就能判斷如何擊球,耗費的時間比視頻信號傳到大腦還要短。人類之所以能擊中時速達到100公里的棒球,主要是因為我們能憑直覺判斷球的運動方向。

      一些科學家認為,人類之所以擁有超常智力,主要是能夠在潛意識推理,這些推理是以世界模型作為基礎的。

      一旦技術(shù)取得突破,世界模型將會為多個領域賦能,比如視覺推理、模擬、嵌入式智能體規(guī)劃、實時娛樂交互。

      按照描述,新團隊將會開發(fā)實時交互生成工具,它以谷歌之前開發(fā)的模型作為基礎,新團隊開發(fā)的模型會考慮如何與現(xiàn)有多模態(tài)模型整合,比如與Gemini整合。

      不少AI公司都在布局“世界模型”

      很多創(chuàng)業(yè)公司和科技巨頭正在努力開發(fā)世界模型,比如李飛飛創(chuàng)建的World Labs,以色列Decart、Odyssey。大家相信,一旦世界模型獲得成功,可以創(chuàng)建交互性媒體內(nèi)容,比如游戲、電影,還可以為機器人搭建逼真的模擬環(huán)境。

      對于這樣的新技術(shù),創(chuàng)意界意見不統(tǒng)一。比如,動視暴雪積極進入AI工具,提高生產(chǎn)力,結(jié)果導致部分員工被裁。Animation Guild不久前發(fā)布的報告稱,在2026年之前,由于AI的應用,美國會有超過10萬個電影、電視、動畫職位被摧毀。

      在“世界模型”開發(fā)領域,Odyssey算是新手,它宣稱要與創(chuàng)意專業(yè)人士一起開發(fā),并無替代創(chuàng)意人士的計劃。谷歌的物理世界模擬AI會不會替代創(chuàng)意人士?還有待觀察。

      在版權(quán)方面,開發(fā)世界模型也存在障礙。有一些世界模型是根據(jù)視頻游戲片段訓練的,訓練時并沒有拿到版權(quán),可能會引發(fā)糾紛。

      谷歌是YouTube的所有者,它已經(jīng)獲得許可,準備用YouTube視頻訓練模型,只是現(xiàn)在還不知道具體會用到哪些視頻。

      當然,除了這些問題,世界模型還有很多技術(shù)難題沒有解決,即使是谷歌,離成功也有不小的距離。

      和所有AI模型一樣,世界模型也存在“幻覺”。如果用歐洲城市數(shù)據(jù)訓練模型,城市的天氣一直晴朗,可能無法理解下雪的亞洲城市。沒有充分的數(shù)據(jù),模型不可能深刻理解世界。

      Runway的CEO Cristóbal Valenzuela不久前說,由于數(shù)據(jù)和工程方面的問題,想精準捕捉世界上的“居民”(比如動物和人)存在巨大挑戰(zhàn)。模型要為環(huán)境生成一致的地圖,要在環(huán)境中導航、交互。

      雖然存在巨大挑戰(zhàn),不過如果問題得到解決,世界模型可以讓AI與真實世界更好聯(lián)系在一起,到時不只虛擬世界生成工具會取得突破,機器人、AI決策也會地大踏步前進。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。