上線15年,蘋果應(yīng)用商店的App數(shù)量達(dá)到180萬個。繁榮的應(yīng)用生態(tài),直接為蘋果帶來的運(yùn)營利潤率據(jù)信超過70%。
生成式AI的熱浪涌動以來,構(gòu)建一個繁榮的應(yīng)用生態(tài)、成為下一個App Store甚至iOS成為眾多科技巨頭追求的目標(biāo)。不過從目前進(jìn)展來看,從基礎(chǔ)大模型走向AI原生應(yīng)用的爆發(fā),這個過程障礙重重。
底層IT基礎(chǔ)設(shè)施重構(gòu)、大模型使用成本、應(yīng)用研發(fā)范式,環(huán)環(huán)皆門檻。
在AI原生時代的「憤怒的小鳥」出現(xiàn)之前,位于變革底層的云計算產(chǎn)業(yè)以及云服務(wù)商應(yīng)該如何自我重構(gòu)、如何磨平大模型的準(zhǔn)入門檻去加速AI原生應(yīng)用生態(tài)的繁榮?面對大模型浪潮,企業(yè)客戶訴求又發(fā)生了哪些變化?
在2023百度云智大會·智算大會期間,《降噪NoNoise》對話了百度集團(tuán)副總裁侯震宇。
在國內(nèi)云計算廠商中,百度智能云是最早進(jìn)行大模型「適配」的一家。今年3月27日,百度智能云基于剛上線的文心一言,推出面向企業(yè)客戶的千帆大模型平臺;8月31日,千帆平臺全面開放,近4個月內(nèi)的大模型日調(diào)用量增長了10倍。
作為百度智能云事業(yè)群云計算產(chǎn)研以基礎(chǔ)技術(shù)工程團(tuán)隊的負(fù)責(zé)人,侯震宇向我們分享了百度智能云的最新業(yè)務(wù)布局,以及百度內(nèi)部對于行業(yè)發(fā)展趨勢的最新判斷和思考。
01
降模型成本
2024年非常關(guān)鍵的事
今年以來,算力已經(jīng)被公認(rèn)為是大模型競爭的「軍火庫」。這不僅讓英偉達(dá)的市值超過英特爾,也讓其財報中的GPU收入超過了手機(jī)芯片之王高通。
但算力的另一面是GPU供應(yīng)緊張、價格昂貴。成本壓力是會層層傳導(dǎo)的。
比如AWS首席執(zhí)行官Adam Selipsky前不久在談到整個行業(yè)時曾直言:「我接觸過的很多客戶都對運(yùn)行其中一些模型的成本感到不滿。」
在這個問題上,中美企業(yè)所面臨的挑戰(zhàn)并無不同。在同《降噪NoNoise》交流時,侯震宇提到他的一個判斷——預(yù)計2024年整體算力資源供應(yīng)的不確定性或者說緊張程度仍然比較大,所以云計算廠商面臨的共性問題是如何更高效地使用算力資源。
其實(shí)不僅是算力資源昂貴,目前人力資源、數(shù)據(jù)資源(如數(shù)據(jù)標(biāo)注),本身成本也很高!复_保大家用足夠少的錢能訓(xùn)練出來想要的模型,以及用一個客戶可接受的成本使其真的把AI大模型用起來,這些會是2024年非常關(guān)鍵的事。」
目前,國內(nèi)云計算廠商的思路大多是在保證同等效果前提下,通過推理優(yōu)化、模型訓(xùn)練工具鏈優(yōu)化等,以縮短算力使用時間。
以百度智能云為例,其主要通過基礎(chǔ)設(shè)施層的異構(gòu)計算平臺「百舸」、大模型平臺層的「千帆」互相打配合,以實(shí)現(xiàn)算力性價比。
追求算力性價比的方向無非兩個:一是提高GPU利用率,縮短使用時間。比如在大模型訓(xùn)練環(huán)節(jié),百度通過分布式并行訓(xùn)練策略和微秒級互聯(lián),讓萬卡規(guī)模集群訓(xùn)練的加速比達(dá)到95%、萬卡集群有效訓(xùn)練時間占比達(dá)到98%。
「百舸」升級到3.0版本后,訓(xùn)練和推理場景的吞吐量據(jù)稱可提高30%-60%,這些意味著原來要用100天的訓(xùn)練,現(xiàn)在可能只用70天,節(jié)約時間等于間接省錢。
二是適配成本更低的AI芯片,除英偉達(dá)外,千帆平臺還兼容昆侖芯、昇騰、海光DCU、英特爾等國內(nèi)外主流AI芯片。畢竟不是所有訓(xùn)練都需要動用H800這種頂格待遇。
通過組合選項,理論上客戶可以用最小的切換成本完成算力適配。這種屬于直接省錢。
不過再怎么省錢,前提還是要保證AI模型的效果。若達(dá)不到客戶的預(yù)期效果,云服務(wù)商對算力資源「算計」再多,也是沒有意義的。
02
AI原生應(yīng)用生態(tài),需要先“松土”
今年下半年以來,李彥宏在多次在公開場合奮力疾呼:別再卷基礎(chǔ)大模型了,跑偏了,現(xiàn)在應(yīng)該去卷AI原生應(yīng)用。
對于李彥宏所提建議,外界并不意外。AI原生應(yīng)用是構(gòu)建大模型生態(tài)繁榮的重中之重,也是百度等AI巨頭在大模型商業(yè)變現(xiàn)路上的核心變量。
未來的大模型變現(xiàn),一部分將通過模型生產(chǎn)獲取收益,更多還是通過原生應(yīng)用調(diào)用模型API帶來的算力消費(fèi),這部分將會是規(guī)模更大的收入來源。所以說,僅有算力未必能搞定一切,孵化生態(tài)更為重要。
反映到百度智能云,一是千帆平臺的「既要又要」——作為大模型層平臺,千帆上不僅有百度「文心大模型4.0」,還先后上架了50多個第三方基礎(chǔ)大模型和行業(yè)大模型,相當(dāng)于搞了個「大模型商店」;二是「賣鏟子」——為企業(yè)提供大模型開發(fā)的全流程工具鏈和整套環(huán)境。
在AI原生應(yīng)用層,為降低開發(fā)門檻,百度智能云宣布AI原生應(yīng)用開發(fā)工作臺——「千帆AppBuilder」全面開放,將開發(fā)大模型應(yīng)用的常見模式、工具、流程,沉淀成一個工作臺。通過上面的應(yīng)用組件和應(yīng)用框架,開發(fā)者、企業(yè)可以快速搭建AI原生應(yīng)用。
這就好比一名想要出租房屋的房東,他不僅要把毛坯變成精裝,還要提供床、沙發(fā)等生活基本套件,最好能做到租客拎包入住,只有這樣,房屋的出租、流轉(zhuǎn)效率才有可能提高。
我們從交流中獲悉,百度智能云早期并沒有意識到一個問題——許多開發(fā)者還不擅長使用大模型做應(yīng)用開發(fā)。
他們訪問了一批開發(fā)者,想要知道當(dāng)這些人想到了一個檢索增強(qiáng)的框架、希望用一個Agent的時候,自己知不知道一個Agent該怎么搭建?
結(jié)果發(fā)現(xiàn),很多人真的以為只用大模型Prompt接口,就可以完成應(yīng)用開發(fā)。
這也說明,要構(gòu)建一個百萬級的原生應(yīng)用生態(tài),平臺需要率先為開發(fā)者松松「土壤」、掃除各種障礙,而不是等后者直接被研發(fā)新范式「勸退」。
畢竟開發(fā)者是應(yīng)用爆發(fā)的主要推動力量。
「如果沒有應(yīng)用調(diào)用,意味著你做出來這個模型效果不夠好或者大家用不起,意味著這個產(chǎn)業(yè)就有問題!购钫鹩钐嵝,只有行業(yè)客戶的場景里有更多的AI原生應(yīng)用落地,構(gòu)建出新的應(yīng)用生態(tài),才能真正實(shí)現(xiàn)大模型的價值。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。