一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務(wù)實現(xiàn)盈利,退市裁員重組后終于賺錢真我14 Pro+開始提上日程:1.5K等深四微曲屏+潛望長焦穩(wěn)了消息稱本田和日產(chǎn)計劃明年6月前敲定合并協(xié)議 2026年8月成立控股公司凱迪拉克最新版OTA開啟推送,新增百度語音大模型和QQ音樂等應(yīng)用中國聯(lián)通11月5G套餐用戶凈增127.8萬戶5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準(zhǔn)識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車 GOVY AirJet:最高飛行速度可達(dá) 250km/h清華大學(xué)聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent
  • 首頁 > 云計算頻道 > 大模型

    大模型“聚會”:國內(nèi)卷價格,國外卷能力

      在中美AI大模型的競爭上,正衍生出兩種不同的路徑。

      繼北京時間5月14日凌晨OpenAI春季發(fā)布會上,OpenAI推出兼具聽、看、說能力的GPT-4o后。北京時間5月15日凌晨谷歌I/O開發(fā)者大會上,谷歌CEO桑達(dá)爾·皮查伊發(fā)布數(shù)十款Google和AI 結(jié)合產(chǎn)品,堪稱“全家桶”級別,全面圍剿Open AI。

      其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash,對標(biāo)Sora的Veo,開源模型Gemma 2,支持生成式搜索的AI Overviews、第六代TPU等。

      整場開發(fā)者大會最大的看點為,谷歌推出的AI語音助手——Astra,它能夠通過攝像頭識別物體、代碼和各種東西,F(xiàn)場演示視頻中,用戶要求Astra在看到發(fā)出聲音的東西時告訴她,助手回答說,它可以看到一個發(fā)出聲音的揚聲器。對于一閃而過的蘋果,Astra居然也能夠準(zhǔn)確回答出在眼鏡旁邊。

      除Astra外,谷歌還推出基于Gemini的多款通用AI Agent子系列產(chǎn)品。如音頻的NotebookLM、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3,直接對標(biāo)OpenAI發(fā)布的GPT-4o、Dall-E和Sora。

      和谷歌、OpenAI圍繞技術(shù)之爭不同的是,國內(nèi)大模型或?qū)⒂瓉韮r格戰(zhàn)時代。在5月15日字節(jié)舉辦2024春季火山引擎Force原動力大會上,字節(jié)推出3款A(yù)I產(chǎn)品,包括AI生圖產(chǎn)品 PicPic、AI 教育產(chǎn)品河馬愛學(xué)、AI 劇情互動產(chǎn)品貓箱。

      除這三款產(chǎn)品外,字節(jié)面向TOC端的產(chǎn)品還包括定位AI教育的Gauth,定位AI對話的豆包和CiCi;定位AI工具的小悟空ChitChop;定位Al Bot創(chuàng)建平臺的Coze和扣子;定位AI互動劇情的BagelBel等。

      但字節(jié)率先啟動行業(yè)價格戰(zhàn),火山引擎總裁譚待表示,豆包大模型將開啟付費商業(yè)化,且定價遠(yuǎn)低于行業(yè)價格。以豆包通用模pro-32k版為例,模型推理輸入價格僅為0.0008元/千Tokens。市面上同規(guī)格模型的定價一般為0.12元/千Tokens,是豆包模型價格的150倍。

      字節(jié)本輪降價后,后續(xù)國內(nèi)其他大模型廠商或?qū)⒏S。但降價能否幫助國內(nèi)大模型廠商帶來更多新增用戶和付費用戶,仍值得商榷。

      GPT-4o和谷歌Gemini不斷宣傳現(xiàn)階段AI能力大幅度提高,兩家誰的大模型能力更強呢?基于此,我們也對GPT-4o和Gemini展開了多維度的測試。

      一、文本輸出:Gemini和GPT-4o愈發(fā)接近,部分能力已趕超

      因GPT-4o和Gemini均屬于世界TOP級的大模型,在測試兩家大模型的文本輸出能力上,我們直接將難度升級。

      為什么很多國家仍以油車為主?你覺得影響新能源汽車海外滲透率提高的因素有哪些?我們將這一問題同時給到GPT-4o和Gemini,二者均指出充電基礎(chǔ)設(shè)施建設(shè)、購置成本、技術(shù)進(jìn)步、政策支持、消費者文化習(xí)慣是很多國家仍以燃油車為主的原因。

      但相較于GPT-4o,Gemini不僅識別到我們提問的是兩個問題,且均給出答案,也回答出GPT-4o沒有指出的車企方面、宣傳教育方面的問題。也就是說,Gemini的回答可能更為完整。

      圖源:基于Gemini和GPT-4o生成內(nèi)容整理 DoNews制圖

      我們繼續(xù)追問要求兩個大模型同時給我們撰寫一份10000字全球新能源汽車報告,并要求報告中需要包括行業(yè)價格戰(zhàn)、電池技術(shù)、未來發(fā)展方向、產(chǎn)業(yè)趨勢。

      但此時兩個大模型的表現(xiàn)已經(jīng)出現(xiàn)明顯差異,GPT-4o給我們生成七大章節(jié)的框架,每個框架下也要對應(yīng)的小框架。但就是不輸出我們要求的內(nèi)容,這或許和當(dāng)前GPT-4o在長文本能力上的欠佳有關(guān)。

      圖源:GPT-4o官網(wǎng)

      Gemini雖給我們具體的文本內(nèi)容,但全文1679字和我們要求的萬字報告差距較大。內(nèi)容被大幅度壓縮后,整個內(nèi)容質(zhì)量也相對欠佳。

      如在提到新能源汽車產(chǎn)業(yè)趨勢發(fā)展上,Gemini給出的內(nèi)容為產(chǎn)業(yè)鏈整合、跨界合作、國際化競爭,每條內(nèi)容僅有一句話進(jìn)行概括。換言之,在真正涉及行業(yè)專業(yè)性問題上,Gemini和GPT-4o均存在不同程度的短板。

      圖源:Gemini官網(wǎng)

      當(dāng)我們將難度繼續(xù)提高后,詢問為什么今年以來全球大宗商品價格持續(xù)上漲?這種漲幅帶來的影響有哪些?未來價格是否會回落?在首問中GPT-4o和Gemini給出的答案有所相同,均指出和供應(yīng)鏈、地緣沖突、全球經(jīng)濟等因素有關(guān)。且在未來價格走勢預(yù)測中,兩者給到的答案也基本相同。

      但在漲幅所帶來的影響上,Gemini給出的答案可能更為完整。尤其是在金融、企業(yè)利潤、社會等方面的影響,GPT-4o并未指出。

      圖源:基于Gemini和GPT-4o生成內(nèi)容整理 DoNews制圖

      在文本內(nèi)容快速分析上,我們讓兩款大模型同時給我們分析安克創(chuàng)新2024年Q1財報中存在的風(fēng)險點,GPT-4o生成的風(fēng)險點包括現(xiàn)金流減少、高額的銷售費用和管理費用、財務(wù)費用大幅度波動、公允價值帶來損失這四點。

      圖源:GPT-4o官網(wǎng)

      但Gemini給出的內(nèi)容卻包括營收增速放緩、經(jīng)營活動大幅度下降、銷售費用和管理費用大幅度增加、存貨跌價損失增加、匯兌大幅度增加、對政府補助依賴這六點。這也不能看出,Gemini的回答更為完整。

      圖源:Gemini官網(wǎng)

      而當(dāng)我們要求兩款大模型同時以如何幫助失戀的人走出陰影,寫一篇2000字的文章。要求文章有觀點,并且文章內(nèi)需要配上對應(yīng)的圖片和音頻,Gemini的表現(xiàn)可以說完全吊打GPT-4o。

      在文章開頭,Gemini直接放入一曲舒緩的音樂,且這個音樂也支持播放。每個細(xì)分章節(jié)下,Gemini直接從網(wǎng)站上檢索到和內(nèi)容相關(guān)的圖片,實現(xiàn)OpenAI提到的文本、音頻、圖像的任意組合。

      圖源:Gemini官網(wǎng)

      對比之下,GPT-4o給到的內(nèi)容就有些遜色。除文章開始處能看到圖片外,其余正文處均未看到任何和內(nèi)容相關(guān)的圖片,且全文中也看不到音頻。

      圖源:GPT-4o官網(wǎng)

      整體測試下來后我們發(fā)現(xiàn),谷歌在生成式AI領(lǐng)域尤其在文本能力輸出上已經(jīng)從“落后”到追趕,甚至內(nèi)容質(zhì)量上、內(nèi)容組合等能力上已經(jīng)超過GPT-4o。

      二、對比之下,Gemini綜合能力不容忽視

      在測試過程中,我們發(fā)現(xiàn)Gemini不僅支持文本內(nèi)容提問,且也支持語音提問。但因國內(nèi)網(wǎng)絡(luò)受限,暫無法對語音功能進(jìn)行測試,也無法判斷這是否為谷歌發(fā)布會上提到的Astra。相較于谷歌的快速,GPT-4o目前仍是支持單一的文本內(nèi)容提問。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。