烏鎮(zhèn)峰會十年 “槳”聲“心”影里的百度AI

2023年11月13日 17:00:11 羅超來源：微信公眾號羅超Pro

　　本文來自于微信公眾號羅超Pro(ID：uochaotmt)，作者：羅超。

　　11月8日，2023年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會開幕。世界互聯(lián)網(wǎng)大會早已成為國內(nèi)規(guī)格最高的科技盛事，是展現(xiàn)全球數(shù)字經(jīng)濟最新科技成果的舞臺，是觀察數(shù)字經(jīng)濟潮水奔涌方向的瞭望臺，堪稱數(shù)字經(jīng)濟風向標。在生成式人工智能掀起新一輪技術革命的2023年，烏鎮(zhèn)峰會具備承前啟后的獨特意義。

　　大模型成烏鎮(zhèn)峰會關鍵詞

　　隨著ChatGPT、文心一言等產(chǎn)品的爆紅，AI大模型在科技行業(yè)掀起了滔天巨浪。預訓練大模型、生成式人工智能也成了今年烏鎮(zhèn)峰會的核心議題之一。

　　在世界互聯(lián)網(wǎng)大會人工智能工作組與百度聯(lián)合主辦的“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇上，世界互聯(lián)網(wǎng)大會人工智能工作組發(fā)布了由其編寫的研究報告及共識文件，匯總產(chǎn)業(yè)界在金融、交通、教育等14個應用場景的相關案例，提出“發(fā)展負責任的生成式人工智能十條共識”。

　　AI大模型在烏鎮(zhèn)峰會上的強勢存在不只是在論壇上有所體現(xiàn)。作為烏鎮(zhèn)峰會的官方核心活動，“世界互聯(lián)網(wǎng)領先科技成果發(fā)布活動”在7年后全面升級成“世界互聯(lián)網(wǎng)大會領先科技獎”。今年的獲獎項目大都與AI有關，來自互聯(lián)網(wǎng)企業(yè)的兩個獲獎項目均屬于AI范疇:一個是位列“基礎技術組”的“百度知識增強大語言模型關鍵技術”，另一個是屬于“工程研發(fā)組”的“騰訊覓影數(shù)智醫(yī)療影像平臺”，其中百度“知識增強大語言模型關鍵技術”是唯一獲獎的大模型技術。

　　百度“知識增強大語言模型關鍵技術”領先在何處?據(jù)百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在現(xiàn)場介紹，“人工智能正在引領新一輪科技革命和產(chǎn)業(yè)變革，大語言模型讓人們看到了通用人工智能的曙光。知識增強大語言模型關鍵技術，突破知識內(nèi)化和外用技術，具備知識增強、檢索增強和對話增強的獨有技術優(yōu)勢，并通過模型與框架聯(lián)合優(yōu)化，突破了訓練規(guī)模，提高了訓練效率，提升了模型效果。”

　　今年3月百度發(fā)布知識增強大語言模型文心一言，其具備知識增強、檢索增強和對話增強等技術優(yōu)勢。5月文心一言的基礎模型升級至文心大模型3.5。8月31日文心一言率先全面開放。10月的世界大會上百度發(fā)布了文心大模型4.0，在理解、生成、邏輯、記憶四大能力都有顯著提升，綜合能力與GPT-4相比毫不遜色。

　　2023年，除早已入局大模型的百度外，阿里、華為等科技巨頭以及多家創(chuàng)業(yè)公司均跑步入局大模型賽道，“百模大戰(zhàn)”如火如荼。群雄逐鹿下，大模型賽道也出現(xiàn)了一些怪亂象，一些玩家在資本加持下臨時上陣做大模型甚至一股腦“梭哈”，有的實力不濟也做基礎大模型“重復發(fā)明輪子”，有的“渾水摸魚”為了市場炒作強推大模型，更有連核心技術都依靠第三方的“皮包型大模型公司”在湊熱鬧。其實在眾聲喧嘩下，大模型真正重要的只有兩件事:

　　第一件事是基礎大模型的技術提升，說得更直白一點就是要有能擔綱與GPT抗衡的基礎大模型。在科技自主自立的大時代背景下，這一點至關重要;另一件事是大模型的落地，如果不能應用到實際場景中，大模型狂卷參數(shù)“軍備競賽”無意義，畢竟技術只有解決實實在在的問題才有價值。

　　發(fā)展大模型應該基礎技術提升與產(chǎn)業(yè)場景落地并重，這正是百度的“大模型觀”。

　　早在2019年百度就已在積累AI預訓練模型技術并上線文心大模型，當年7月文心大模型升級至2.0，2021年12月正式發(fā)布全球首個知識增強千億大模型鵬城-百度·文心，參數(shù)規(guī)模2600億。

　　在行業(yè)因為ChatGPT關注大模型的前一年，百度就在布局大模型且堅持“不卷參數(shù)卷落地”，腳踏實地地推動大模型的落地且提出建設性方案。2022年5月，在WAVE SUMMIT2022深度學習開發(fā)者峰會上，百度公布飛槳文心大模型最新全景圖，提出支撐大模型產(chǎn)業(yè)落地的3個關鍵路徑并在業(yè)內(nèi)首發(fā)基于文心大模型的行業(yè)大模型，構建了一套適宜產(chǎn)業(yè)應用的大模型體系，同時提供了配套的工具平臺、推動開放生態(tài)促創(chuàng)新。

　　重視場景落地與重視基礎技術并不矛盾，百度深知提升基礎大模型技術水平的重要性。2023年百度文心大模型加快升級步伐，除不斷汲取數(shù)據(jù)與知識提升智能水平外，通過在輸入與輸出環(huán)節(jié)進行知識點增強，在基礎大模型上引入智能體機制等手段，提高模型的效率與效果。文心大模型成唯一斬獲“世界互聯(lián)網(wǎng)大會領先科技獎”的大模型技術也足以表明，百度在基礎大模型技術上的絕對領先性。尤為重點的一點是，更強的文心大模型進步更快，據(jù)王海峰10月發(fā)布文心大模型4.0時介紹，在9月小流量上線后，過去一個多月其效果又提升近30%。

　　基礎大模型能力不斷提升進而呈現(xiàn)越來越強勁的智能涌現(xiàn)，這給大模型落地到更多應用場景、催生出更多創(chuàng)新應用、發(fā)揮出更大的智能價值創(chuàng)造了前提條件。在百度世界大會上，李彥宏提出“AI原生應用”的理念，引導開發(fā)者重新思考人與機器的交互模式并重新設計AI原生應用，突破傳統(tǒng)互聯(lián)網(wǎng)應用的價值邊界，加速大模型在工作、學習、生活、商業(yè)、娛樂等場景的大規(guī)模落地。如同App的應用形態(tài)帶來移動互聯(lián)網(wǎng)的大繁榮一樣，AI原生應用正在催生一個龐大繁榮的AI生態(tài)。

　　正如烏鎮(zhèn)峰會“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇的主題所示，人工智能最終價值是賦能產(chǎn)業(yè)發(fā)展，加速千行百業(yè)的數(shù)字化進程，促進人類社會全面邁向智能化新階段。大模型良性競爭的核心應該回到基礎大模型技術進化與大模型技術落地應用這兩個重點上來。

　　文心加飛槳共赴星河

　　大模型不是AI浪潮的起點，而是AI浪潮的延續(xù)，但不可否認的是，AI浪潮被其推到了全新高度。

　　大模型并非突然出現(xiàn)的顛覆性技術，其更準確地稱呼是“預訓練大模型”，“預訓練”字面意思很容易理解:預先訓練好，其通過堆疊數(shù)據(jù)集“貪婪式”地訓練模式，擁有較強的通用性，理論上可泛化到多種應用場景，而小樣本或零樣本的技術實現(xiàn)，則可讓開發(fā)者可快速基于其構建AI應用，而不再需要從0到1訓練數(shù)據(jù)、建立模型。

　　在大模型技術出現(xiàn)前，AI技術就已出現(xiàn)60余年。10余年來，隨著深度學習技術的高速發(fā)展，AI技術如知識圖譜、機器視覺、語音、自動駕駛等早已被廣泛應用。當AI要實現(xiàn)工業(yè)化大生產(chǎn)時，AI要支撐更加廣泛普適的場景，要支撐更大更復雜的AI計算需求，要實現(xiàn)智能水平的不斷升級，依靠傳統(tǒng)訓練模式已無法滿足，大模型生逢其時。

　　作為深度學習的全新突破，大模型讓AI技術的通用性大幅提升，成為AI從作坊式應用邁向工業(yè)化生產(chǎn)的關鍵。不過，大模型不是平地起高樓，它站在深度學習巨人的肩上，兩者一起驅(qū)動著智能經(jīng)濟的爆發(fā)。

　　在烏鎮(zhèn)峰會“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇上，王海峰在題為《文心加飛槳翩然赴星河》的主題演講中，詮釋了深度學習框架與大模型的關系:“深度學習作為人工智能的核心技術，具有很強的通用性，并具備標準化、自動化和模塊化的工業(yè)大生產(chǎn)特征，而大模型的興起，使得人工智能應用的深度和廣度進一步拓展。人工智能已進入工業(yè)大生產(chǎn)階段。”

　　深度學習與大模型是協(xié)同促進的關系。百度認為，生成式AI和大模型的智能涌現(xiàn)，帶來了全新的計算范式，這使得整個IT的技術棧從原來的三層，變成包括芯片、框架、模型、應用在內(nèi)的四層結(jié)構。

　　在智能時代的四層IT架構中，芯片層，百度有昆侖等面向AI計算的芯片技術布局;框架層，有飛槳深度學習這樣的平臺;在模型層，則有文心大模型家族(包括文心大模型4.0在內(nèi)的自然語言處理方向的基礎大模型，視覺、跨模態(tài)、生物計算等其他方面的大模型，以及眾多的行業(yè)大模型)來克服機器訓練的難題;在應用層，則涌現(xiàn)出智能搜索、智能交通等原生AI應用，互相協(xié)同的四層技術棧構成AI時代的通用計算架構。

　　大模型依賴于軟硬件的協(xié)同，向下離不開框架層與芯片層的支持，向上則要通過AI原生應用落地到千行百業(yè)。深度學習框架飛槳就作為底座支持了文心大模型的訓練、推理與部署。在萬卡算力上運行的飛槳平臺，通過集群基礎設施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化，支持了大模型的穩(wěn)定高效訓練。正是通過飛槳與文心的協(xié)同優(yōu)化，文心大模型周均訓練有效率超過98%，訓練算法效率提升到3月發(fā)布時的3.6倍，推理性能提升50倍，由此可見，文心大模型4.0的強勁表現(xiàn)，離不開飛槳深度學習平臺的底層加持。

　　在大模型加強AI通用性的同時，深度學習在不斷精進，變得越來越標準化、自動化和模塊化，更強大的深度學習平臺驅(qū)動著更強大的大模型，加速AI在千行百業(yè)落地。因此長期來看，“文心+飛槳”這樣的CP式AI組合，才是更適合AI工業(yè)化大生產(chǎn)的解決方案。

　　10年之約，百度準備好了

　　烏鎮(zhèn)峰會第十年。10年來的世界互聯(lián)網(wǎng)大會上，百度出鏡率高，且與其相關的主題有且只有一個:AI。

　　除今年奪得“世界互聯(lián)網(wǎng)大會領先科技獎”的文心大模型4.0以及2019年入選“世界互聯(lián)網(wǎng)大會領先成果”的飛槳深度學習平臺外，百度還有多個項目入選前些年的世界互聯(lián)網(wǎng)大會領先成果:百度大腦、DuerOS(小度助手)對話式人工智能操作系統(tǒng)、Apollo，每一個都屬于AI技術。

　　烏鎮(zhèn)峰會走過的十年，正值數(shù)字經(jīng)濟騰飛的十年。十年間世事變遷，斗轉(zhuǎn)星移。參與烏鎮(zhèn)峰會的數(shù)字經(jīng)濟企業(yè)從2014年的12家增加到2023年的過千家，互聯(lián)網(wǎng)行業(yè)格局早已是滄海桑田，層出不窮的新技術徹底改變了人們的生活乃至世界的面貌，數(shù)字經(jīng)濟重心已從“在線經(jīng)濟”全面轉(zhuǎn)移到“智能經(jīng)濟”。作為烏鎮(zhèn)峰會十年來的重要參與者與親歷者，置身數(shù)字經(jīng)濟中心的百度已從互聯(lián)網(wǎng)企業(yè)蛻變成AI公司，成為中國AI產(chǎn)業(yè)的扛旗者。

　　十年，彈指一揮間，百度AI泛舟已十年，AI信仰不曾改變。

　　不論是布局深度學習還是加碼大模型，百度都不做“追風逐浪”的玩家，它將AI當信仰，對AI的價值十分篤定，對AI的發(fā)展路線從無絲毫動搖，一直在力所能及地推動AI朝著正確的方向發(fā)展，做“造浪者”而不是“逐浪者”。

　　百度AI起步于2010年，經(jīng)過多年的技術積累和市場應用，已經(jīng)取得了令人矚目的成果。2013年百度深度學習實驗室成立，與谷歌開始布局AI的時間一致。百度做AI最初就有很高的起點，2014年就已大舉在全球范圍尋覓頂尖人才。

　　技術的投機主義者會審時度勢，根據(jù)環(huán)境的變化調(diào)整投資策略。百度則是AI技術的信仰型玩家，在AI產(chǎn)業(yè)陷入低潮的2020年前后，李彥宏對AI技術的篤定也未曾動搖，他對AI此志不渝，也將樂觀的情緒傳遞給行業(yè)。在2020年世界人工智能大會上，李彥宏在演講中表示，“當前，人們對人工智能的態(tài)度產(chǎn)生迷茫甚至悲觀，這是顛覆性技術在加速普及前的必經(jīng)階段。迷霧終將散去，智能經(jīng)濟和智能社會終將成為現(xiàn)實，而人類終將掌握自己的命運。”他當時動情地表示:“我對AI的信仰，沒有絲毫改變。”

　　十年，百度AI技術不斷開花結(jié)果，終于登頂“珠峰”。

　　百度AI技術體系在深度學習基礎上延展出自然語言處理、圖像識別、語音識別、知識圖譜等領先的人工智能技術，并積淀形成飛槳深度學習平臺、文心大模型。親自主導和參與這一系列技術體系的王海峰已成百度首席技術官，并繼續(xù)帶領百度科學家與工程師們在深度學習平臺、大模型等自主AI技術上深耕。百度財報顯示從2012年到2022年的十年間其在AI上已投資超過千億，自上而下構建出覆蓋芯片、云計算平臺、飛槳深度學習平臺、大模型以及上層垂直AI技術應用在內(nèi)的全棧AI架構。

　　堅定投資AI是百度攀登技術珠峰的過程，道阻且難且長，十年終于登頂，與全球頂尖AI巨頭們相見于頂峰再論劍。

　　十年，百度做AI都堅持“基礎技術提升與產(chǎn)業(yè)場景落地”并重。

　　在持續(xù)投入深度學習平臺飛槳、基礎大模型文心等AI基礎技術的同時，百度積極地推動AI技術落地。

　　一方面，百度將AI技術應用到每一個業(yè)務的“毛細血管”。除持續(xù)用AI重塑搜索、地圖、文庫、網(wǎng)盤等國民級應用外，還成功開創(chuàng)了小度、Apollo等全新業(yè)務線。

　　另一方面，百度積極構建開放的AI生態(tài)，與社會力量與資源一起推動AI落地。從飛槳深度學習平臺到文心大模型，核心技術成熟一個開放一個。截至目前飛槳和文心生態(tài)已凝聚800萬開發(fā)者，服務22萬家企事業(yè)單位基于飛槳創(chuàng)建了80萬個模型。除技術開放外，百度積極推動AI產(chǎn)學研協(xié)同和人才培養(yǎng)，在2020年提出5年為全社會培養(yǎng)500萬AI人才，現(xiàn)已培養(yǎng)420萬AI人才。在百度世界大會上，百度發(fā)布人才培養(yǎng)星河計劃，計劃再培養(yǎng)500萬大模型人才。

　　在AI工業(yè)化大生產(chǎn)階段，百度的開放只會更加徹底。在烏鎮(zhèn)峰會上，面對大模型產(chǎn)業(yè)化的挑戰(zhàn)，王海峰表示，類似芯片代工廠模式，可采用“集約化生產(chǎn)，平臺化應用”的模式，即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復雜過程封裝起來，通過低門檻、高效率的生產(chǎn)平臺，為千行百業(yè)提供大模型服務，這正是百度在大模型技術開放上努力的方向。

　　十年，AI從實驗室進入到工業(yè)化大生產(chǎn)階段，百度準備好了一切。

　　在繁榮的AI技術生態(tài)基礎上，AI應用早已在全面落地。烏鎮(zhèn)景區(qū)十年的劇變就是AI一日千里的“縮影”。記得在2016年世界互聯(lián)網(wǎng)大會前夕，百度就在烏鎮(zhèn)景區(qū)推出了全球首個無人駕駛體驗站，筆者也有幸成為全球第26名體驗百度無人車的乘客。

　　除無人車這樣的黑科技服務外，烏鎮(zhèn)景區(qū)已實現(xiàn)刷臉進園、掃臉入住、智能布草、智能床墊、語音導覽、智慧停車等智慧景區(qū)服務，居民的生活與游客的體驗因為AI而徹底改變。

　　如果我們將目光從烏鎮(zhèn)放大到中國乃至世界來看，AI應用更是層出不窮地出現(xiàn)在人們的身邊，給生活、學習、工作帶來諸多好處，給人類創(chuàng)造更多的福祉。

　　在烏鎮(zhèn)峰會期間，光明網(wǎng)記者孔繁鑫在《十年之約，烏鎮(zhèn)準備好了》一文中對烏鎮(zhèn)峰會十年進行了生動的復盤。正如他在文中所說，“十年斗轉(zhuǎn)星移，互聯(lián)網(wǎng)的江湖波云詭譎，話題從網(wǎng)絡安全、金融監(jiān)管切換到數(shù)據(jù)治理、人工智能，烏鎮(zhèn)卻總能穩(wěn)穩(wěn)站在時代風口浪尖，把脈前沿業(yè)態(tài)、引領發(fā)展潮流。”烏鎮(zhèn)大會的十年與百度AI的十年的時間線幾乎吻合，這十年百度一直在深耕AI并與時俱進。

　　在今天的烏鎮(zhèn)峰會上，AI接棒互聯(lián)網(wǎng)成為下一個十年的數(shù)字經(jīng)濟之基石。隨著大模型技術的涌現(xiàn)，AI產(chǎn)業(yè)“輕舟已過萬重山”。在全新的AI階段，百度早已做好了準備，文心加飛槳，翩然赴星河。

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信