上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁 > 云計(jì)算頻道 > 大模型

    谷歌硬剛GPT-4o,60秒視頻生成模型雖遲但到,還把上下文窗口卷到了200萬

    2024年05月15日 09:46:51   來源:量子位公眾號(hào)

      OpenAI出手再次驚艷世界,谷歌果然坐不住了。

      GPT-4o掀起的一片“AGI已至”的驚呼聲中,剛剛,GoogleDeepMind首席執(zhí)行官哈薩比斯親自攜谷歌版《Her》登場(chǎng):

      同樣能會(huì)還有,不僅能幾乎沒有延遲地和人類流暢交流,通過攝像頭,這個(gè)名為Project Astra的AI助手甚至能直接幫忙讀代碼

      谷歌還祭出了自己的硬件優(yōu)勢(shì),帶來一波AR和大模型的夢(mèng)幻聯(lián)動(dòng)。

      一邊擼狗一邊玩轉(zhuǎn)大模型已經(jīng)成為現(xiàn)實(shí)(手動(dòng)狗頭)。

      這一波操作下來,戰(zhàn)果如何尚未可知,網(wǎng)友們反正是興奮了起來:

      而正面硬剛GPT-4o,還只是谷歌鉚足了勁,在I/O大會(huì)上釋出的冰山一角。

      兩個(gè)小時(shí)的主題演講里,AI被提及了121次,CEO劈柴哥還猶嫌不足。

      于是,對(duì)標(biāo)Sora能生成一分鐘長視頻的視頻生成模型Veo來了:

      Gemini1.5Pro不僅面向所有人開放,上下文窗口還從100萬token直接一步邁向200萬,一口氣能讀1500頁P(yáng)DF。

      連Android,現(xiàn)在也緊緊跟谷歌大模型Gemini綁定,搖身一變成為以AI為內(nèi)核的操作系統(tǒng)。

      總之,信息量多到爆炸

      ,相比之下,OpenAI不到半個(gè)小時(shí)的發(fā)布真的很隨性了。

      谷歌版《Her》登場(chǎng)

      第一時(shí)間引發(fā)最多討論的,當(dāng)然是谷歌版《Her》——Project Astra。

      Project Astra基于Gemini系列模型打造,谷歌表示,研究人員們希望這樣的智能助手,能真正在人們的日常生活中提供幫助。

      有意思的是,OpenAI總裁哥Brockman昨天在場(chǎng)外補(bǔ)充了有關(guān)GPT-4o多模態(tài)能力的更詳細(xì)視頻,而谷歌這邊,哈薩比斯也是第一時(shí)間在X上更新了與這樣一個(gè)智能助手的互動(dòng)。

      看樣子,Ta不僅能完成幫忙找眼鏡這樣的基礎(chǔ)工作。

      幫忙搞點(diǎn)文藝創(chuàng)作,解答一下專業(yè)書上看不懂的內(nèi)容,也都是信手拈來。

      還有Google DeepMind的工作人員干脆和Project Astra一起看起了I/O大會(huì)直播:

      不少網(wǎng)友都認(rèn)為,這是谷歌對(duì)OpenAI的GPT-4o的正面回應(yīng)

      不過嘛,網(wǎng)友們也關(guān)注到了不少問題,比如,Project Astra的延遲似乎還是比GPT-4o長,谷歌的演示中也沒有體現(xiàn)是否能打斷智能助手說話。

      值得關(guān)注的是,Project Astra背后,是Gemini系列模型的進(jìn)一步升級(jí)迭代。

      比如,Gemini1.5Pro的上下文窗口來到了驚人的200萬token。

      谷歌還最新推出了Gemini1.5Flash這一輕量級(jí)模型,并開源了27B的Gemma2和視覺語言模型PailGemma。

      60秒長視頻生成

      你可能已經(jīng)默默在心里比較了一番Project Astra和GPT-4o的高下。

      但橋豆麻袋,說起來,谷歌被OpenAI突然狙擊,可不止這一回。

      還記得在春節(jié)期間搶盡谷歌風(fēng)頭的Sora嗎?

      谷歌的回應(yīng),雖遲但到——

      谷歌最強(qiáng)視頻生成模型Veo來了。

      Veo可以生成1080p的高質(zhì)量視頻,生成視頻的長度也看齊Sora:最長超過1分鐘。

      谷歌還強(qiáng)調(diào),Veo生成的畫面一致性出色,并且可以hold住各種風(fēng)格。比如“延時(shí)拍攝”和“航拍”這種術(shù)語,直接寫在提示詞里,Veo都能get。

      目前,谷歌已經(jīng)和電影制作者展開了合作,在電影項(xiàng)目中探索Veo的應(yīng)用。

      與此同時(shí),谷歌的圖片生成模型Imagen也迎來更新,Imagen3發(fā)布。

      官方提到,與此前的模型相比,Imagen3的視覺偽影更少,生成的圖像細(xì)節(jié)拉滿,并且在生成文字方面效果也很好。

      △提示詞:一張莊嚴(yán)的圖書館入口的照片,刻有“中央圖書館”字樣

      另外,谷歌此次還推出了音樂生成模型Lyria。

      Gemini進(jìn)入全線產(chǎn)品

      在這些跟OpenAI叫板的“肌肉”展示之外,谷歌對(duì)大模型應(yīng)用的看重,也在此次I/O大會(huì)中盡顯。

      英偉達(dá)科學(xué)家Jim Fan就他的I/O觀后感中表示:

      谷歌做對(duì)的一件事是:他們終于開始努力把AI集成到搜索框中。

      還不止是搜索,這一次,谷歌可以說是把Gemini塞進(jìn)了全線產(chǎn)品中,包括谷歌搜索、Android,以及谷歌郵箱、谷歌Photos等。下面我們劃劃重點(diǎn)。

      1、谷歌搜索

      基于Gemini,谷歌搜索推出AI概述(AI Overview)新功能,徹底化身AI搜索。

      用戶在搜索框輸入問題,馬上就能得到一個(gè)AI總結(jié)的答案,包括相關(guān)鏈接。

      而且是超長問題都能處理的那種,比如:

      查找波士頓最好的瑜伽或普拉提工作室,并提供他們的入門優(yōu)惠詳情以及從燈塔山步行所需時(shí)間。

      AI Overview秒秒鐘就會(huì)列出五星好評(píng)且距離燈塔山近的店,并附帶課程標(biāo)價(jià),連店在地圖上的位置都標(biāo)記了出來:

      對(duì)于這種復(fù)雜問題的搜索,谷歌表示采用了多步推理技術(shù),可以將復(fù)雜問題拆解成一個(gè)個(gè)小問題,然后自動(dòng)對(duì)問題進(jìn)行排序回答。

      多步推理加持下,AI Overview已經(jīng)脫離了純粹的搜索——把制定計(jì)劃一并搬進(jìn)了搜索引擎里。

      比如直接讓它為一個(gè)團(tuán)體制定一個(gè)為期三天的易于執(zhí)行的餐飲計(jì)劃。

      AI Overview一鍵給出了方案,每個(gè)方案都可以點(diǎn)擊修改,下方還可以一鍵將食材加入購物車:

      還沒完,當(dāng)你沒有想法、問的問題比較籠統(tǒng)時(shí),谷歌搜索還會(huì)AI自動(dòng)將搜索結(jié)果整理成一個(gè)個(gè)“群組”,為你提供建議。

      比如問:在達(dá)拉斯找一個(gè)餐廳慶祝周年紀(jì)念日。

      搜索出的結(jié)果會(huì)按照音樂餐廳、具有歷史魅力的餐廳等一鍵分組。再往下翻,頁面會(huì)從餐飲逐漸擴(kuò)展到電影、酒店、購物等。

      此外,谷歌搜索還支持視頻搜索了。

      演示中,唱片機(jī)出故障,只需一邊錄制視頻一邊說出疑問,谷歌AI Overview就會(huì)立刻分析故障原因,并給出處理建議。

      谷歌搜索AI Overview功能將在本周開始在美國推出,后面將陸續(xù)推至其他國家。

      2、Android15

      谷歌把Gemini也帶到了安卓系統(tǒng)中。

      憑借直接內(nèi)置的Circle to Search功能,用戶使用簡(jiǎn)單的手勢(shì)“圈”一下手機(jī)上看到的任何內(nèi)容,就能進(jìn)行搜索。

      比如圈出練習(xí)題,就能一鍵獲取答案。

      目前這一功能,已在Pixel和三星的部分設(shè)備上使用。

      此外,還可以在一個(gè)應(yīng)用之上隨時(shí)調(diào)出Gemini助手層,隨時(shí)使用。你還可以將Gemini生成的圖片直接拖到Gmail等應(yīng)用中,直接詢問某個(gè)視頻中的具體信息,不用滑動(dòng)翻文檔詢問某個(gè)PDF中的信息……

      甚至連電話反詐,都用上Gemini了:聽到關(guān)鍵字“把錢轉(zhuǎn)到安全賬號(hào)”,馬上就能給出警報(bào)。

      總之,官方強(qiáng)調(diào),現(xiàn)在,Gemini在手機(jī)上現(xiàn)在不止是一個(gè)App,更是安卓體驗(yàn)的基礎(chǔ)。

      3、谷歌Photos

      谷歌Photos基于Gemini也推出了新功能——Ask Photos,可以一鍵從圖庫中幫你找到想要的照片和視頻。

      比如你想知道自己的baby是什么時(shí)候?qū)W會(huì)游泳的,Ask Photos會(huì)從你在谷歌Photos中存儲(chǔ)的成百上千張照片中查找出含游泳、游泳證書等相關(guān)圖片,最后總結(jié)給出回復(fù):

      Ask Photos這一功能將在今年夏天推出。

      4、谷歌Workspace

      Gemini也接入到了谷歌Workspace提供的一套生產(chǎn)力和協(xié)作工具中,包括谷歌郵箱、谷歌Docs、谷歌Calendar等。

      這使得在這些工具間進(jìn)行跨應(yīng)用工作變得更加容易。

      例如在谷歌郵箱中自動(dòng)分析郵件以及附件,識(shí)別整理好收據(jù),然后一鍵在Drive和Sheets中處理。

      5、NotebookLM

      谷歌AI筆記應(yīng)用NotebookLM也大升級(jí)。

      如下圖所示,當(dāng)你提出一個(gè)問題后,背后的Gemini模型就會(huì)結(jié)合NotebookLM中的筆記內(nèi)容,進(jìn)行多模態(tài)的語音對(duì)話式回答。

      也就是說,所有筆記都可以變成交互式教材。

      第六代TPU

      最后,在硬件部分,谷歌也帶來了新消息:

      第六代TPU Trillium將在今年向云客戶提供。

      與TPU v5e,Trillium的峰值計(jì)算性能提高4.7倍,HBM和帶寬增加了1倍,芯片間互聯(lián)(ICI)帶寬也增加了1倍。另外,Trillium的能效比TPU v5e高出了67%以上。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。