2024 vivo開發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄
  • 首頁 > 云計(jì)算頻道 > 大模型

    半年大模型 還在天上飛

    2023年08月04日 14:42:33   來源:光子星球公眾號(hào)

      本文來自于微信公眾號(hào) 光子星球(ID:TMTweb),作者:吳坤諺。

      大模型的火,已經(jīng)在這片土地上燒了半年。隨著華為、京東、攜程三家發(fā)布會(huì)趕上晚集,按互聯(lián)網(wǎng)一貫的范式,國產(chǎn)大模型這個(gè)“新東西”也迎來了自己的半年考。

      只是跟其他業(yè)務(wù)的半年考有所不同,像新能源車、手機(jī)、電商平臺(tái)等業(yè)務(wù)形態(tài)的半年考,都有足夠的公開數(shù)據(jù)信息為支撐,便于考據(jù)分析,而大模型到現(xiàn)在都還處一個(gè)“黑盒子”的狀態(tài),沒能跑出一個(gè)清晰的商業(yè)模式,所謂數(shù)據(jù)信息等論據(jù)也就無從談起。

      頗為戲謔的是,即使是從產(chǎn)品功能角度出發(fā),大模型也未曾誕生通用的評(píng)測(cè)手段。面向AGI這一終極目標(biāo),評(píng)測(cè)方法自然五花八門,例如國內(nèi)C端用戶賴以“測(cè)評(píng)”大模型的典中典——“松鼠鱖魚法”。

      或因如此,國內(nèi)大廠大多未能像OpenAI一般將自家大模型開放使用,而是實(shí)行內(nèi)測(cè)機(jī)制。

      而大模型更多的落地探索向B端與G端傾斜,例如騰訊先聲奪人的行業(yè)大模型以及華為的盤古3.0、京東靈犀等。作為目前頭部玩家聚焦的賽道,其大模型偏重盡可能展現(xiàn)成熟的產(chǎn)品形態(tài),以商業(yè)化落地為基本目標(biāo)。例如這一類大模型為了快速向下普及推動(dòng)商業(yè)化,除卻業(yè)務(wù)落地導(dǎo)向外, 本地化部署能力也成為重要的參考指標(biāo)。

      即使如此,在業(yè)內(nèi)人士看來已經(jīng)是“把碗送到面前”的行業(yè)大模型仍缺少買賬的企業(yè),行業(yè)模型的風(fēng)自6月起已經(jīng)吹了一個(gè)月,至今未曾出現(xiàn)較大規(guī)模的商業(yè)合作。

      因此我們也不難看到,在如今的投資市場(chǎng)中,與大模型相關(guān)的投資集中于二級(jí)市場(chǎng)而非一級(jí)市場(chǎng)。即使是王慧文這個(gè)級(jí)別的大牛入場(chǎng),公開消息稱其A輪融資遠(yuǎn)高于2.3億美元,其融資能力相較時(shí)不時(shí)接收微軟百億美元投喂的OpenAI不可同日而語。

      投資市場(chǎng)是合格的晴雨表。顯然,國內(nèi)大模型在半年考的時(shí)間節(jié)點(diǎn)所提交的答卷不盡如人意,還需要一段時(shí)間的蟄伏與打磨,才能讓“故事”成真。

      大模型沒有商業(yè)模式?

      在國內(nèi)的大模型需要回應(yīng)市場(chǎng)的質(zhì)疑中,商業(yè)模式應(yīng)該擺在首位。

      ChatGPT這位早已占據(jù)用戶心智的頭把交椅出現(xiàn)熱度的明顯下降,國內(nèi)最早發(fā)布通用大模型百度與阿里兩家也在一眾玩家跟進(jìn)后陷入“沉寂”。究其原因,在于通用大模型的商業(yè)模式未能跑通。即使在輿論場(chǎng)上獲得了用戶的認(rèn)可,但商業(yè)閉環(huán)始終未能出現(xiàn)。

      以測(cè)試范圍較廣泛的百度大模型為例,其商業(yè)化應(yīng)用文心千帆的付費(fèi)模式是以調(diào)用生成的 token 數(shù)量收費(fèi),標(biāo)準(zhǔn)為0.012元/千 tokens,輸出千字文稿需花費(fèi)0.12元。

      撇開其回收成本的速度不談,0.012元/千 tokens的收費(fèi)看看似便宜,但文本生成往往需要多次交互后才能獲取理想結(jié)果,多次交互prompt將會(huì)無限量增加隱性成本,畢竟文心千帆可不是揮之即來的員工們。

      與之相似的場(chǎng)景是問答社區(qū),學(xué)界人士孫權(quán)(化名)告訴光子星球,模型應(yīng)用的使用體驗(yàn)與問答社區(qū)中搜尋高質(zhì)量答案相似,其用戶思維是問題粒度,而付費(fèi)意愿往往只會(huì)在找到高質(zhì)量回答之后才會(huì)產(chǎn)生。因此百度選擇了推理文本數(shù)為付費(fèi)標(biāo)準(zhǔn),只是目前還無法cover商用隱性成本。

      如果采用B端喜聞樂見的月度付費(fèi),那也只是將成本支出方從用戶轉(zhuǎn)為自己,顯然不是長(zhǎng)久之計(jì)。ChatGPT面對(duì)C端用戶20美元/月的定價(jià)之下,尚且存在偷工減料之嫌便是最佳佐證。

      當(dāng)下,通用大模型的商業(yè)化無論是走B端還是C端都難以做到盈虧平衡,同時(shí)還很可能遭遇諸如AI倫理、監(jiān)管等合規(guī)性風(fēng)險(xiǎn)。因此,大模型的行業(yè)化、垂直化成為落地需求下的范式轉(zhuǎn)變。

      反觀行業(yè)大模型,雖說其產(chǎn)品形態(tài)始于落地需求,但是在實(shí)際落地中出現(xiàn)的問題卻也有待解決。

      一類值得參考的案例是依托自身產(chǎn)品生態(tài)而打造的垂類to C模型,例如知乎早早宣布于產(chǎn)品內(nèi)進(jìn)行內(nèi)測(cè)的知海圖AI以及前不久才發(fā)布的攜程問道。

      兩者切入大模型賽道的優(yōu)勢(shì)并無二致,在于自有的社區(qū)生態(tài)和以此為基礎(chǔ)衍生的高質(zhì)量社區(qū)內(nèi)容。而內(nèi)容作為行業(yè)數(shù)據(jù),在簡(jiǎn)單清洗后便可成為大模型的訓(xùn)練語料。兩者的細(xì)微差別則是知乎自始便是內(nèi)容社區(qū),而攜程則是近年才開始發(fā)力做內(nèi)容。

      可是就目前來看,無論是知乎還是攜程,其大模型的產(chǎn)品形態(tài)似乎都未能切中用戶痛點(diǎn),亦未能對(duì)既有功能有足夠的提升。

      知海圖AI目前已公布的產(chǎn)品“熱榜摘要”是通過AI抓取優(yōu)質(zhì)問答并潤(rùn)色改寫出梗概呈現(xiàn)給用戶,而另一項(xiàng)應(yīng)用“搜索聚合”則是自回答中聚合觀點(diǎn),提高用戶獲取信息、形成決策的效率。

      本身推薦、熱榜一類聚合功能便是知乎“傳統(tǒng)藝能”,大模型賦能后的表現(xiàn)在用戶層面并未掀起水花。況且,AI改寫潤(rùn)色的流程也將熱門答案的個(gè)性化特征覆蓋,于用戶而言,這項(xiàng)應(yīng)用的功能僅在于快速了解信息,這與內(nèi)容社區(qū)所倡導(dǎo)的差異化、個(gè)性化交流背道而馳。

      而立足OTA的攜程問道,在攜程董事局主席梁建章看來是一個(gè)旅游業(yè)的“可靠答案庫”。其產(chǎn)品成效如何還需時(shí)間檢驗(yàn),但自定位來看,同樣有“舍本逐末”之嫌。

      旅游在年輕用戶眼中本就不存在標(biāo)準(zhǔn)答案,“特種兵式”、“打卡式”、“沉浸式”等多樣化旅游形式的出現(xiàn)證明了這一點(diǎn)。如假設(shè)大量用戶通過AI制定旅游路線規(guī)劃,千篇一律的路線規(guī)劃反而會(huì)影響社區(qū)交流與氛圍,甚至遭致用戶停留時(shí)間的下降。

      大體看來,垂直模型在C端的落地嘗試算不上順利,甚至有成為“沉沒成本”的可能。或許受到大模型本身“提高效率”神話的影響,產(chǎn)品定位也大多囿于“效率”二字,只是效率僅僅是用戶體驗(yàn)中一個(gè)不算核心的維度。

      相同的范式在to B領(lǐng)域也有所展現(xiàn),而在追求效率的B端,行業(yè)大模型的商業(yè)模式與落地問題得到了更深刻的展現(xiàn)。

      摸不清的黑匣子

      “AI不是物理,很少有理論上的重大技術(shù)突破,更多的是在模型結(jié)構(gòu)、數(shù)據(jù)質(zhì)量等維度做微調(diào)和小優(yōu)化,甚至很多時(shí)候模型輸出更好了,團(tuán)隊(duì)卻找不到原因。”

      在一位業(yè)內(nèi)人士看來,大模型在業(yè)內(nèi)外存在巨大的認(rèn)知偏差,而原因則在于大模型訓(xùn)練以及AI行業(yè)對(duì)于外界而言是一個(gè)不折不扣的“黑匣子”,很難審視大模型產(chǎn)生輸出結(jié)果的推理過程,它看不見摸不著。

      這導(dǎo)致外界在度過ChatGPT帶來的狂熱期后,一旦冷靜下來,便會(huì)對(duì)大模型這個(gè)“黑匣子”持審慎態(tài)度。這將導(dǎo)致大模型在落地上的困境,而這一現(xiàn)象在如今向to B路線轉(zhuǎn)變的過程中更為明顯。

      以如今已明確to B路線的大廠出品為例,包括騰訊云推出的MaaS技術(shù)方案、華為云推出的盤古大模型等,依靠自身云計(jì)算生態(tài),均稱其大模型服務(wù)支持多樣化部署,包括云端部署、本地化快速部署等。在交互、操作、后續(xù)加入新的行業(yè)數(shù)據(jù)迭代優(yōu)化等方面也有建樹,可以說是為了落地,把大模型的門檻降到了極低。

      但“審慎”帶來的認(rèn)知墻還是沒有打破,即使ChatGPT的風(fēng)吹了半年,許多企業(yè)沒有動(dòng)力也沒有興趣去研究如何導(dǎo)入大模型。

      數(shù)年前的云計(jì)算行業(yè)可以看到因循的相似邏輯。云計(jì)算是在認(rèn)識(shí)到數(shù)據(jù)價(jià)值后,以此為基礎(chǔ)的服務(wù)和衍生,至于大模型于企業(yè)的價(jià)值,相對(duì)而言更是數(shù)據(jù)價(jià)值的躍升。同樣是企業(yè)客戶缺乏的技術(shù)能力,連云計(jì)算在國內(nèi)企業(yè)的普及之路都距終點(diǎn)尚遠(yuǎn),大模型自不必說。

      行業(yè)大模型究竟好用與否,其實(shí)已經(jīng)并不重要了,畢竟商品的使用價(jià)值最終還需使用者來挖掘。更有甚者,外界會(huì)粗暴通過某些測(cè)試、表現(xiàn)來衡量模型水平,例如“松鼠鱖魚法”或近來因預(yù)測(cè)特大臺(tái)風(fēng)“杜蘇芮”的登陸地點(diǎn)與強(qiáng)度有錯(cuò)誤現(xiàn)象而遭受質(zhì)疑的華為盤古氣象大模型。

      或許正因如此,于近期發(fā)布的京東靈犀大模型選擇優(yōu)先跑通自家業(yè)務(wù)場(chǎng)景,預(yù)計(jì)于明年初方對(duì)“外部嚴(yán)肅商業(yè)場(chǎng)景”開放。

      更值一提的是,“行業(yè)成風(fēng)”之下,商業(yè)化導(dǎo)向下的所謂行業(yè)模型在取代大模型原本的“通用”敘事的同時(shí),也遭致不少人的“迷失”。

      所謂行業(yè)大模型的定義存在模糊不清。大模型(Foundation Model)的內(nèi)涵不在于參數(shù)量多少而在于使用通用數(shù)據(jù)訓(xùn)練而涌現(xiàn)出的通用能力。如采用同樣的模型架構(gòu),但在數(shù)據(jù)上使用單一領(lǐng)域數(shù)據(jù),不僅喪失了通用能力,甚至?xí)捎谟楷F(xiàn)的折扣導(dǎo)致領(lǐng)域問題也無法解決。

      如在原大模型基礎(chǔ)上使用行業(yè)數(shù)據(jù)做二次預(yù)訓(xùn)練,相當(dāng)于微調(diào)了原模型,那么即產(chǎn)品本身仍處于模型層,可以被稱作行業(yè)大模型;如通過prompt或外掛數(shù)據(jù)庫的方式加入領(lǐng)域知識(shí),那便僅是對(duì)原模型能力的激發(fā),產(chǎn)品也應(yīng)歸屬至模型之上的應(yīng)用層,稱之為行業(yè)大模型言過其實(shí)。

      目前大廠中發(fā)力行業(yè)大模型的絕大多數(shù)均是前者,如騰訊、京東、華為等。后者則由于更輕的投入與快速提高模型能力的表現(xiàn),更多會(huì)出現(xiàn)在開源社區(qū)中,例如前段時(shí)間引發(fā)熱議的法律大模型ChatLaw。

      “相比前者,后者在產(chǎn)品形態(tài)上更為成熟,便于快速構(gòu)建模型能力,但后者在完成灌輸領(lǐng)域知識(shí)的流程后,往往上限會(huì)更高”,一位業(yè)內(nèi)人士稱。

      開源威脅

      近日,Meta在開放商用許可下免費(fèi)提供其最新開源大模型Llama2,并將其引入微軟的Azure平臺(tái),此舉被譽(yù)為開源LLM的重要里程碑,甚至開始威脅閉源的頭部廠商OpenAI的地位。

      通過微軟這個(gè)大模型金主,Meta以更開放的姿態(tài)挑戰(zhàn)OpenAI。

      實(shí)際上,“開源派”早在此前便以第三方的身份悄然崛起。“我們沒有護(hù)城河,OpenAI 也沒有。”這句話出自5月谷歌意外泄露的一份內(nèi)部文件。其內(nèi)容大意是表面上, OpenAI 和谷歌在大模型上你追我趕,但真正的贏家未必會(huì)從這兩家中產(chǎn)生,下此判斷的原因便在于愈加豐富的開源生態(tài)。

      開源生態(tài)愈發(fā)活躍,乃至于出現(xiàn)了模型能力的代表Llama2以及Finetune(模型微調(diào))范式的代表技術(shù)LORA,這一切都讓閉源爭(zhēng)取“大力出奇跡”的巨頭廠商感受到明顯寒意。

      開源的技術(shù)分享以及人才流轉(zhuǎn)等因素,也在讓大模型的黑匣子愈發(fā)“玻璃化”,缺少壁壘的必然結(jié)果是大廠在巨量資金、時(shí)間的投入下的Konw How輕易為開源社區(qū)所傾覆。

      國內(nèi)頭部大廠對(duì)此的應(yīng)對(duì)大多是“兩手抓”。左手“關(guān)門造車”,以小規(guī)模內(nèi)測(cè)形式不斷打磨產(chǎn)品形態(tài)與能力,右手“集思廣益”,以云端開發(fā)者生態(tài)為基礎(chǔ)打造生態(tài)內(nèi)的開源社區(qū),但這剛需廠商自算力層、模型層到應(yīng)用層的全棧布局。阿里云推出了大模型開源社區(qū)魔搭GPT,華為云、百度云、騰訊云也都有所布局。

      總體來看,無論是行業(yè)還是通用,to C還是to B,大模型的半年考給予我們的直接感覺是:落地困難,盈利預(yù)期不斷后移;風(fēng)險(xiǎn)漸強(qiáng),難言技術(shù)壁壘。那么,當(dāng)下的破局之路在哪?

      目前而言,有兩個(gè)有意思的方向。其一是被譽(yù)為“ AI 時(shí)代的Memory”的向量數(shù)據(jù)庫,其二是模型智能賦予下的智能硬件。

      所謂向量,即是可以代表任何東西的多維數(shù)據(jù),包括如今LLM訓(xùn)練最為重視的文本,以及圖像、視頻、音聲等。這些形式的內(nèi)容會(huì)在數(shù)據(jù)庫中清晰表示,并且支持語義檢索,即通過相似性檢索,例如男人與男孩。換句話說,于大模型而言,向量檢索就是大模型的SEO。

      如上文所述,領(lǐng)域知識(shí)可以通過向量數(shù)據(jù)庫能力,或是精調(diào)或是外掛來提高行業(yè)模型的建構(gòu)和使用,于大廠而言自然是下一階段的發(fā)力點(diǎn)所在。自5月起,資本便不斷涌入向量數(shù)據(jù)相關(guān)賽道,作為前景更為確定的應(yīng)用層產(chǎn)品,向量數(shù)據(jù)也收獲了一眾VC的密切關(guān)注。

      至于智能硬件內(nèi)置模型,則是相對(duì)曾經(jīng)的“siri”、“小愛”等智能助手的能力躍升,也是對(duì)真正的智能設(shè)備(手機(jī)、電腦)的外延拓展。開源社區(qū)內(nèi)早有將大參數(shù)模型內(nèi)置MAC的嘗試,而大廠則是在過去的移動(dòng)互聯(lián)網(wǎng)時(shí)代便積累了一定硬件生產(chǎn)能力,相對(duì)而言其先發(fā)優(yōu)勢(shì)更為明顯。

      少了PR式的春秋筆法,落地成為核心需求的大模型不再神秘,故事也越來越少,開始“深潛”的賽道玩家們?nèi)栽诎l(fā)力。行業(yè)需要下一個(gè)“ChatGPT”時(shí)刻,我們方能見到潛水者浮出水面,正面對(duì)抗。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。