正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛(ài)“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開(kāi)店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報(bào)到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢(shì)也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級(jí),核心場(chǎng)景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)App兼容測(cè)試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個(gè)月內(nèi)開(kāi)放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實(shí)現(xiàn)營(yíng)收5970億元,同比增長(zhǎng)13.53%傳三星計(jì)劃2025年推出卷軸屏手機(jī)蘋果新專利探索折疊iPhone未來(lái),任意表面實(shí)現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機(jī)今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實(shí)力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開(kāi)了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    對(duì)話百度侯震宇:大模型的成本門檻,還能怎么砍?

    2023年12月22日 12:42:02   來(lái)源:創(chuàng)業(yè)最前線

      上線15年,蘋果應(yīng)用商店的App數(shù)量達(dá)到180萬(wàn)個(gè)。繁榮的應(yīng)用生態(tài),直接為蘋果帶來(lái)的運(yùn)營(yíng)利潤(rùn)率據(jù)信超過(guò)70%。

      生成式AI的熱浪涌動(dòng)以來(lái),構(gòu)建一個(gè)繁榮的應(yīng)用生態(tài)、成為下一個(gè)App Store甚至iOS成為眾多科技巨頭追求的目標(biāo)。不過(guò)從目前進(jìn)展來(lái)看,從基礎(chǔ)大模型走向AI原生應(yīng)用的爆發(fā),這個(gè)過(guò)程障礙重重。

      底層IT基礎(chǔ)設(shè)施重構(gòu)、大模型使用成本、應(yīng)用研發(fā)范式,環(huán)環(huán)皆門檻。

      在AI原生時(shí)代的「憤怒的小鳥」出現(xiàn)之前,位于變革底層的云計(jì)算產(chǎn)業(yè)以及云服務(wù)商應(yīng)該如何自我重構(gòu)、如何磨平大模型的準(zhǔn)入門檻去加速AI原生應(yīng)用生態(tài)的繁榮?面對(duì)大模型浪潮,企業(yè)客戶訴求又發(fā)生了哪些變化?

      在2023百度云智大會(huì)·智算大會(huì)期間,《降噪NoNoise》對(duì)話了百度集團(tuán)副總裁侯震宇。

      在國(guó)內(nèi)云計(jì)算廠商中,百度智能云是最早進(jìn)行大模型「適配」的一家。今年3月27日,百度智能云基于剛上線的文心一言,推出面向企業(yè)客戶的千帆大模型平臺(tái);8月31日,千帆平臺(tái)全面開(kāi)放,近4個(gè)月內(nèi)的大模型日調(diào)用量增長(zhǎng)了10倍。

      作為百度智能云事業(yè)群云計(jì)算產(chǎn)研以基礎(chǔ)技術(shù)工程團(tuán)隊(duì)的負(fù)責(zé)人,侯震宇向我們分享了百度智能云的最新業(yè)務(wù)布局,以及百度內(nèi)部對(duì)于行業(yè)發(fā)展趨勢(shì)的最新判斷和思考。

      01

      降模型成本

      2024年非常關(guān)鍵的事

      今年以來(lái),算力已經(jīng)被公認(rèn)為是大模型競(jìng)爭(zhēng)的「軍火庫(kù)」。這不僅讓英偉達(dá)的市值超過(guò)英特爾,也讓其財(cái)報(bào)中的GPU收入超過(guò)了手機(jī)芯片之王高通。

      但算力的另一面是GPU供應(yīng)緊張、價(jià)格昂貴。成本壓力是會(huì)層層傳導(dǎo)的。

      比如AWS首席執(zhí)行官Adam Selipsky前不久在談到整個(gè)行業(yè)時(shí)曾直言:「我接觸過(guò)的很多客戶都對(duì)運(yùn)行其中一些模型的成本感到不滿!

      在這個(gè)問(wèn)題上,中美企業(yè)所面臨的挑戰(zhàn)并無(wú)不同。在同《降噪NoNoise》交流時(shí),侯震宇提到他的一個(gè)判斷——預(yù)計(jì)2024年整體算力資源供應(yīng)的不確定性或者說(shuō)緊張程度仍然比較大,所以云計(jì)算廠商面臨的共性問(wèn)題是如何更高效地使用算力資源。

      其實(shí)不僅是算力資源昂貴,目前人力資源、數(shù)據(jù)資源(如數(shù)據(jù)標(biāo)注),本身成本也很高!复_保大家用足夠少的錢能訓(xùn)練出來(lái)想要的模型,以及用一個(gè)客戶可接受的成本使其真的把AI大模型用起來(lái),這些會(huì)是2024年非常關(guān)鍵的事!

      目前,國(guó)內(nèi)云計(jì)算廠商的思路大多是在保證同等效果前提下,通過(guò)推理優(yōu)化、模型訓(xùn)練工具鏈優(yōu)化等,以縮短算力使用時(shí)間。

      以百度智能云為例,其主要通過(guò)基礎(chǔ)設(shè)施層的異構(gòu)計(jì)算平臺(tái)「百舸」、大模型平臺(tái)層的「千帆」互相打配合,以實(shí)現(xiàn)算力性價(jià)比。

      追求算力性價(jià)比的方向無(wú)非兩個(gè):一是提高GPU利用率,縮短使用時(shí)間。比如在大模型訓(xùn)練環(huán)節(jié),百度通過(guò)分布式并行訓(xùn)練策略和微秒級(jí)互聯(lián),讓萬(wàn)卡規(guī)模集群訓(xùn)練的加速比達(dá)到95%、萬(wàn)卡集群有效訓(xùn)練時(shí)間占比達(dá)到98%。

      「百舸」升級(jí)到3.0版本后,訓(xùn)練和推理場(chǎng)景的吞吐量據(jù)稱可提高30%-60%,這些意味著原來(lái)要用100天的訓(xùn)練,現(xiàn)在可能只用70天,節(jié)約時(shí)間等于間接省錢。

      二是適配成本更低的AI芯片,除英偉達(dá)外,千帆平臺(tái)還兼容昆侖芯、昇騰、海光DCU、英特爾等國(guó)內(nèi)外主流AI芯片。畢竟不是所有訓(xùn)練都需要?jiǎng)佑肏800這種頂格待遇。

      通過(guò)組合選項(xiàng),理論上客戶可以用最小的切換成本完成算力適配。這種屬于直接省錢。

      不過(guò)再怎么省錢,前提還是要保證AI模型的效果。若達(dá)不到客戶的預(yù)期效果,云服務(wù)商對(duì)算力資源「算計(jì)」再多,也是沒(méi)有意義的。

      02

      AI原生應(yīng)用生態(tài),需要先“松土”

      今年下半年以來(lái),李彥宏在多次在公開(kāi)場(chǎng)合奮力疾呼:別再卷基礎(chǔ)大模型了,跑偏了,現(xiàn)在應(yīng)該去卷AI原生應(yīng)用。

      對(duì)于李彥宏所提建議,外界并不意外。AI原生應(yīng)用是構(gòu)建大模型生態(tài)繁榮的重中之重,也是百度等AI巨頭在大模型商業(yè)變現(xiàn)路上的核心變量。

      未來(lái)的大模型變現(xiàn),一部分將通過(guò)模型生產(chǎn)獲取收益,更多還是通過(guò)原生應(yīng)用調(diào)用模型API帶來(lái)的算力消費(fèi),這部分將會(huì)是規(guī)模更大的收入來(lái)源。所以說(shuō),僅有算力未必能搞定一切,孵化生態(tài)更為重要。

      反映到百度智能云,一是千帆平臺(tái)的「既要又要」——作為大模型層平臺(tái),千帆上不僅有百度「文心大模型4.0」,還先后上架了50多個(gè)第三方基礎(chǔ)大模型和行業(yè)大模型,相當(dāng)于搞了個(gè)「大模型商店」;二是「賣鏟子」——為企業(yè)提供大模型開(kāi)發(fā)的全流程工具鏈和整套環(huán)境。

      在AI原生應(yīng)用層,為降低開(kāi)發(fā)門檻,百度智能云宣布AI原生應(yīng)用開(kāi)發(fā)工作臺(tái)——「千帆AppBuilder」全面開(kāi)放,將開(kāi)發(fā)大模型應(yīng)用的常見(jiàn)模式、工具、流程,沉淀成一個(gè)工作臺(tái)。通過(guò)上面的應(yīng)用組件和應(yīng)用框架,開(kāi)發(fā)者、企業(yè)可以快速搭建AI原生應(yīng)用。

      這就好比一名想要出租房屋的房東,他不僅要把毛坯變成精裝,還要提供床、沙發(fā)等生活基本套件,最好能做到租客拎包入住,只有這樣,房屋的出租、流轉(zhuǎn)效率才有可能提高。

      我們從交流中獲悉,百度智能云早期并沒(méi)有意識(shí)到一個(gè)問(wèn)題——許多開(kāi)發(fā)者還不擅長(zhǎng)使用大模型做應(yīng)用開(kāi)發(fā)。

      他們?cè)L問(wèn)了一批開(kāi)發(fā)者,想要知道當(dāng)這些人想到了一個(gè)檢索增強(qiáng)的框架、希望用一個(gè)Agent的時(shí)候,自己知不知道一個(gè)Agent該怎么搭建?

      結(jié)果發(fā)現(xiàn),很多人真的以為只用大模型Prompt接口,就可以完成應(yīng)用開(kāi)發(fā)。

      這也說(shuō)明,要構(gòu)建一個(gè)百萬(wàn)級(jí)的原生應(yīng)用生態(tài),平臺(tái)需要率先為開(kāi)發(fā)者松松「土壤」、掃除各種障礙,而不是等后者直接被研發(fā)新范式「勸退」。

      畢竟開(kāi)發(fā)者是應(yīng)用爆發(fā)的主要推動(dòng)力量。

      「如果沒(méi)有應(yīng)用調(diào)用,意味著你做出來(lái)這個(gè)模型效果不夠好或者大家用不起,意味著這個(gè)產(chǎn)業(yè)就有問(wèn)題!购钫鹩钐嵝,只有行業(yè)客戶的場(chǎng)景里有更多的AI原生應(yīng)用落地,構(gòu)建出新的應(yīng)用生態(tài),才能真正實(shí)現(xiàn)大模型的價(jià)值。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。