三大AI開發(fā)神器亮相李彥宏：只要會說話，就可以成為一名開發(fā)者

2024年04月16日 14:45:49 來源：Donews

　　4月16日，百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在Create 2024百度AI開發(fā)者大會上發(fā)表“人人都是開發(fā)者”的主題演講，他指出，“AI正在掀起一場創(chuàng)造力革命，未來開發(fā)應用就像拍個短視頻一樣簡單，人人都是開發(fā)者，人人都是創(chuàng)造者。”

　　他表示，百度作為一家技術公司，定位是盡可能為大家提供所需的開發(fā)工具，提升社會創(chuàng)造力，這包括了1個強大的基礎模型系列和三大AI開發(fā)工具，它們組成了一個工具箱，支持開發(fā)者打包帶走，隨取隨用。

　　強大的基礎模型系列，也就是文心大模型系列，包括了：旗艦版的ERNIE3.5和4.0，和輕量版的ERNIE Speed、Lite、Tiny等;現(xiàn)場，李彥宏還正式發(fā)布了文心大模型4.0的工具版。文心一言發(fā)布一年多以來，用戶數(shù)已經(jīng)突破2億，目前，文心大模型已成為中國最領先、應用最廣泛的AI基礎模型。

　　李彥宏強調(diào)，通過強大的文心4.0降維裁剪出來的更小尺寸模型，要比直接拿開源調(diào)出來的模型，同等尺寸下效果明顯更好，同等效果下，成本明顯更低，“大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。所以開源模型會越來越落后。”

　　同時，百度還為大家做好了“開箱即用”的三大AI開發(fā)工具，包括智能體開發(fā)工具AgentBuilder、AI原生應用開發(fā)工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。“這三個工具，都代表了先進生產(chǎn)力。”

　　會上，李彥宏分享了百度基于大模型開發(fā)AI原生應用的具體思路，指出MoE、小模型和智能體是值得關注的三個方向，“這是我們百度根據(jù)過去一年的實踐，踩了無數(shù)的坑，交了高昂的學費換來的。”

　　以下是李彥宏《人人都是開發(fā)者》主題演講實錄：

　　你只要會說話，就可以成為一名開發(fā)者

　　大家好，歡迎參加Create 2024百度AI開發(fā)者大會，這是Create大會首次在粵港澳大灣區(qū)舉辦。今天現(xiàn)場來了5000多位開發(fā)者和科技愛好者。過去這一年，我跟很多創(chuàng)業(yè)者、開發(fā)者交流，感覺大家都處在一種“FOMO”狀態(tài)，也就是Fear of Missing Out，既興奮、又害怕錯過。確實，大模型和生成式AI，將徹底改變開發(fā)者這個群體。

　　過去，開發(fā)者用代碼改變世界;未來，自然語言將成為新的通用編程語言，你只要會說話，就可以成為一名開發(fā)者，用自己的創(chuàng)造力改變世界。

　　這一天并不遙遠，我們看到，因為有了強大的基礎大模型，有了很多低門檻，甚至零門檻的開發(fā)工具，開發(fā)者的生產(chǎn)力大大提高了。

　　比如，基于文心大模型的智能代碼助手Comate，不僅支持100多種語言和所有主流IDE平臺，可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優(yōu)化方案，還可以深度解讀代碼庫、關聯(lián)私域知識生成新的代碼。上崗一年多，Comate已經(jīng)走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業(yè)，生成的代碼采納率達到了46%，百度每天新增的代碼中，已經(jīng)有27%是由Comate生成的。

　　今天，你不會寫代碼，也可以做出一個AI應用;不用編程，也可以做出一個智能體。AI正在掀起一場創(chuàng)造力革命，未來開發(fā)應用就像拍個短視頻一樣簡單，人人都是開發(fā)者，人人都是創(chuàng)造者。

　　作為一家技術公司，百度的角色定位，就是盡可能地為大家提供所需的開發(fā)工具，不斷提升整個社會的創(chuàng)造力。具體來說，我們提供1個強大的基礎模型系列，就是文心大模型系列，這包括旗艦版的ERNIE3.5， ERNIE4.0，也包括輕量版的ERNIE Speed、Lite、Tiny等等。

　　我們還提供基于大模型來開發(fā)各種應用的工具，包括智能體開發(fā)工具AgentBuilder，AI原生應用開發(fā)工具AppBuilder，以及各種尺寸的模型定制工具ModelBuilder。這三個工具，都代表了先進生產(chǎn)力。下面，我會給大家一一展示。

　　文心一言用戶超2億，文心大模型4.0工具版發(fā)布

　　首先講一下，文心一言和文心大模型的最新進展：

　　文心一言從去年3月16日發(fā)布，到今天是一年零一個月的時間。我們的用戶數(shù)突破了2億，API日均調(diào)用量也突破了2億，服務的客戶數(shù)達到了8.5萬，利用千帆平臺開發(fā)的AI原生應用數(shù)超過了19萬。

　　我們看看，大家都在用文心一言做什么?

　　視頻中的真人真事只是冰山一角。我們可以看到，文心一言正在改變更多人的工作和生活。

　　支撐文心一言的基座模型，就是文心大模型。過去一年，它經(jīng)歷了從3.0版本到3.5，再到4.0版本的進化。文心4.0在理解、生成、邏輯、記憶四大能力方面，均達到了業(yè)界領軍水平。

　　近幾個月來，文心大模型在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面實現(xiàn)了進一步的顯著提升，達到國際領先水平。

　　今天，我們正式發(fā)布文心大模型4.0的工具版，現(xiàn)在，大家可以在工具版上，體驗代碼解釋器功能，通過自然語言交互，就能實現(xiàn)對復雜數(shù)據(jù)和文件的處理與分析，還可以生成圖表或文件，能夠快速洞察數(shù)據(jù)中的特點、分析變化趨勢、為后續(xù)的決策提供高效精準的支撐。

　　文心大模型已經(jīng)成為了中國最領先、應用最廣泛的AI基礎模型。

　　不僅如此，相比一年前，文心大模型的算法訓練效率提升到了原來的5.1倍，周均訓練有效率達到98.8%，推理性能提升了105倍，推理的成本降到了原來的1%。

　　也就是說，客戶原來一天調(diào)用1萬次，同樣成本現(xiàn)在可以調(diào)用100萬次。媒體可能不會因為成本下降99%而興奮。但是企業(yè)也好，開發(fā)者也好，一旦用起來，最關注的就是效果和成本。

　　我們能在提升性能的同時，把推理成本降到1%，正是因為百度在芯片、框架、模型、應用這四層架構上有著全棧的布局，通過端到端優(yōu)化，不斷地把成本打下來，讓更多人都可以高效、低價地用大模型來做AI應用。

　　毫無疑問，大模型相關的話題，在2024年依然會很熱，各類技術突破還會不斷涌現(xiàn)。媒體也會繼續(xù)熱衷于用“震撼發(fā)布”“史詩級更新”這樣的標題進行渲染。但我想強調(diào)的是，大模型本身并不直接創(chuàng)造價值，基于大模型開發(fā)出來的AI應用才能滿足真實的市場需求。

　　分享開發(fā)AI原生應用的具體思路和工具：“踩了無數(shù)的坑，交了高昂學費”

　　今天我想跟大家分享的是一些基于大模型開發(fā)AI原生應用的具體思路和工具。這是我們百度根據(jù)過去一年的實踐，踩了無數(shù)的坑，交了高昂的學費換來的。

　　第一是MoE。未來大型的AI原生應用基本都是MoE架構，這里所說的MoE不是一般的學術概念，而是大小模型的混用，不依賴一個模型來解決所有問題。但什么時候調(diào)用小模型、什么時候調(diào)用大模型、什么時候不調(diào)用模型，這都是有技術含量的，要針對應用的不同場景做匹配。

　　第二是小模型。小模型推理成本低，響應速度快，在一些特定場景中，經(jīng)過SFT精調(diào)后的小模型，它的使用效果可以媲美大模型。這就是我們發(fā)布Speed，Lite、Tiny三個輕量模型的原因。我們通過大模型，壓縮蒸餾出來一個基礎模型，然后再用數(shù)據(jù)去訓練，這比從頭開始訓小模型，效果要好很多，比基于開源模型訓出來的模型效果更好，速度更快，成本更低。

　　第三是智能體。智能體是當下很熱的一個話題，隨著智能體能力的提升，會不斷催生出大量新的應用。智能體機制，包括理解、規(guī)劃、反思和進化，它讓機器像人一樣思考和行動，可以自主完成復雜任務，在環(huán)境中持續(xù)學習、實現(xiàn)自我迭代和進化。在一些復雜系統(tǒng)中，我們還可以讓不同的智能體互動，相互協(xié)作，更高質量地完成任務。這些智能體能力，反思、規(guī)劃、自我計劃的能力，我們已經(jīng)開發(fā)出來了，并且向開發(fā)者全面開放。

　　在MoE、小模型、智能體這三個方向上，百度都已經(jīng)給大家做好了“開箱即用”的工具。下面，我就給大家介紹三種不同的工具，分別是：智能體開發(fā)工具AgentBuilder、AI原生應用開發(fā)工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

　　智能體開發(fā)工具AgentBuilder：

　　智能體是里每個人最近、最主流的大模型使用方式

　　首先是智能體開發(fā)工具AgentBuilder。智能體可能是未來離每個人最近、最主流的大模型使用方式，基于強大的基礎模型，智能體可以批量生成，應用在各種各樣的場景。

　　百度剛剛升級了文心智能體平臺。截至目前，已經(jīng)有3萬多個智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。我們的目標是，讓每個人、每個組織都成為智能體的開發(fā)者，打造國內(nèi)最完整的智能體生態(tài)。

　　那如何實現(xiàn)這個目標呢?就是給大家提供零門檻的智能體開發(fā)工具AgentBuilder。

　　下面我們就先以“新加坡旅游局”為例一起看看，一個智能體是如何做出來的。

　　首先，我們打開文心智能體平臺，創(chuàng)建頁面有著零代碼、低代碼兩種模式，新手可以直接選擇“零代碼模式”，用自然語言，幾句話就能創(chuàng)建一個智能體。

　　我們先給智能體起名叫“新加坡旅游局”，然后在設定里寫明需要打造旅游方案、解答問題，提供酒店門票預訂服務，這些設定都是用來指導智能體的，告訴它都能做什么。

　　如果只需要基礎智能體，平臺會自動完成填寫。但我們希望“新加坡旅游局”是一個專業(yè)的智能體，所以要進行高級配置。我可以把新加坡百科詞條和官網(wǎng)鏈接都添加到知識庫里，讓它每天更新。然后添加一些工具，如酒店查詢、景點門票購買等，增強它的服務能力。目前我們已經(jīng)跟攜程合作，提供了酒店、景點、票務等旅游服務工具。這樣，一個新加坡旅游局的智能體就做好了，可以進一步預覽、調(diào)優(yōu)。

　　現(xiàn)在打開百度APP，搜索“什么時候去新加坡人最少”，因為大家出去旅游都想避開人潮。智能體會綜合多個來源的信息，生成一個答案，“1-3月人最少”。我們還可以點擊智能體，和它進一步互動，比如去新加坡旅游的注意事項，推薦新加坡排名前三的酒店，還能讓它直接預訂新加坡環(huán)球影城的門票，一站式解決需求，大大節(jié)省了用戶時間。

　　除了新加坡之外，大連、沈陽等文旅類智能體也都在文心智能體平臺上線，還有知識類、創(chuàng)作類、學習類、娛樂類等各式各樣的智能體，這些都是用AgentBuilder做出來的。

　　去年文心一言剛發(fā)布的時候，我就說過，文心一言會影響到每一家公司。因為它強大的自然語言理解能力、表達能力、推理能力，可以使任何一個公司都離自己的客戶更近。

　　今天，每一個商家、每一個客戶，都能在百度擁有專屬的智能體。整個過程完全不需要編程，通過類似提示詞的信息輸入，和簡單的幾步操作調(diào)優(yōu)，就能迅速生成一個智能體，成為7X24小時在線的金牌業(yè)務員。

　　我們來看一下，一個商家智能體是怎么做出來的。

　　啟德教育是家知名教育企業(yè)，在全國有60多家分支機構，還有很多海外分公司，覆蓋國家廣，對接待的話術要求很高。如何能全天24小時回復客戶的咨詢，并且提高接待水平、降低經(jīng)營成本呢?

　　啟德教育利用百度的AgentBuilder，打造了專屬的智能體。

　　我們來看看，如何打造一個具備基本能力的智能體。很簡單，在平臺上填寫智能體的頭像、名稱、經(jīng)營業(yè)務范圍和歡迎語，再設置一些需要用戶提供的信息，比如年齡、學歷。5分鐘、零門檻，一個智能體就做好了。

　　啟德教育還希望這個智能體是個懂業(yè)務、懂學生的留學顧問。它可以針對學生的不同情況，比如想去美國還是澳洲、是碩士還是學士、雅思和托�？剂硕嗌俜值鹊龋龀鰧I(yè)分析，給出精準回答。我們可以通過添加知識、角色、工具這幾大模塊，來打造一個更高級的智能體。

　　在知識模塊中，上傳私域知識，讓平臺實時解析，自動生成對話語料;在角色模塊，把一些不在經(jīng)營范圍內(nèi)的留學國家，增加到過濾方案中，可以提高用戶線索的有效率;在工具模塊，加入預約到店等服務。通過這樣幾步簡單操作，一個擁有專業(yè)能力的啟德教育智能體就做好了。

　　現(xiàn)在，我們來搜索“澳洲留學申請條件”，可以看到智能體快速給出了需要的語言能力、專業(yè)選擇等七大必備條件，還給能出相應的留學咨詢方案，對各種難題都有問必答、有求必應。

　　啟德教育智能體非常的受歡迎，上線第一周，就成功分發(fā)了155萬次，與用戶交互了5.8萬次，線索轉化量直線增長、有效線索的轉化成本明顯降低，經(jīng)營效率大幅提升。

　　下面，我再給大家介紹一個家居行業(yè)的智能體。

　　索菲亞是專注全屋定制的家居品牌。就像剛剛展示的，它也可以通過填寫極其簡單的信息，創(chuàng)建出一個基礎的商家智能體。但對于家居行業(yè)，消費者的線下體驗更重要，所以索菲亞希望能在線上打造出一個金牌銷售，還原線下的接待體驗。

　　因此在進一步的設置中，它在角色模塊，選擇了數(shù)字人作為展示方式，然后給數(shù)字人選取了合適的背景和聲音，并且結合平臺的智能解析能力，自動總結了一套銷售話術。最終打造出一位溫柔親切、話術專業(yè)的金牌銷售，她能24小時滿足用戶的各種需求，提供高水準的服務體驗。

　　當百度搜索用戶有裝修訴求時，索菲亞智能體會利用文心大模型的能力，優(yōu)先給出問題的答案。除此之外，她還會主動與客戶確認具體需求，如裝修類型、預算等，并推薦附近的線下門店。

　　索菲亞商家智能體上線以來，有效線索成本下降了30%。也就是說，它獲得一個有效客戶，如果過去的成本是100塊，現(xiàn)在只需要70塊了。

　　目前，已有超過1萬個百度的客戶擁有了商家智能體，涵蓋了教育培訓、房產(chǎn)家居、機械設備、商務服務等超過30個行業(yè)。

　　上面，通過三個Demo，我展示了開發(fā)者和商家，如何利用AgentBuilder，制作不同行業(yè)智能體的過程。

　　現(xiàn)在，制作一個智能體，真的就是分分鐘的事。但問題來了!如果沒流量、沒分發(fā)、找不到、沒人用，那么開發(fā)者和商家就沒有收益，沒有收益就沒有動力。怎么解決這個痛點呢?

　　我們的文心智能體平臺，為開發(fā)者們提供了流量變現(xiàn)的通路。除了百度搜索，百度生態(tài)的其他產(chǎn)品，如小度、地圖、貼吧、車機等，都能接入智能體的相關能力，為開發(fā)者解決流量分發(fā)的后顧之憂，獲得實打實的收益。

　　有分發(fā)，就會有數(shù)據(jù)反饋;有數(shù)據(jù)反饋，飛輪轉起來，智能體就能夠自主迭代，越用越聰明。文心智能體平臺還上線了智能體的數(shù)據(jù)分析和問答調(diào)優(yōu)模塊，不久后還將有更多的新能力上線。文心智能體平臺將通過分發(fā)-診斷-收益的數(shù)據(jù)飛輪，驅動智能體形成質量更優(yōu)、流量更好、收益更大的正循環(huán)。

　　AppBuilder：自然語言三步就能開發(fā)一個應用

　　下面，我給大家介紹第二個開發(fā)工具，AppBuilder。它是目前最好用的AI原生應用開發(fā)工具。在AppBuilder上面，我們提前封裝和預置了開發(fā)AI原生應用所需的各種組件和框架，大幅降低開發(fā)門檻。

　　最快只需三步，開發(fā)者就可以用自然語言開發(fā)出一個AI原生應用，并且能夠便捷地發(fā)布、集成到各種各樣的業(yè)務環(huán)境中。我們來看幾個案例：

　　今年年初，我們搞過一期AI原生應用開發(fā)挑戰(zhàn)賽，賽題是利用AppBuilder打造一款“游樂場排隊規(guī)劃助手”，幫助游客更好地了解游樂場排隊情況，設計個性化的游玩路線，在有限時間內(nèi)獲得最好的游玩體驗。

　　這期比賽的冠軍選手，沒寫一行代碼，就開發(fā)出了應用，拿到了百度提供的10萬元大獎。這個題目如果會寫代碼的話，你寫一個并不難，但是你一行代碼都不寫還能做出來，那還是非常依賴基礎模型和AppBuilder這個工具的能力的。

　　我們來看下，怎么用AppBuilder，把這個AI應用做出來。

　　我們先回顧一下賽題。它假定了“環(huán)球影城”各個項目的排隊時間和刺激指數(shù)，那么在有限的時間內(nèi)獲得刺激指數(shù)最高的體驗，就是這期賽題要解決的問題。

　　首先，打開AppBuilder的開發(fā)界面，給應用起名“游樂場排隊助手”;第二步，我們在角色指令中描述具體要求，包括調(diào)用代碼解釋器、算出在固定時間內(nèi)的最佳組合、輸出結果等;第三步就是到工具組件中，把代碼解釋器添加進來，幫助運算。

　　現(xiàn)在，我們來測下效果，在右側輸入問題“我有3個半小時時間，怎么玩最刺激?”，可以看到，代碼解釋器將這個問題翻譯成了代碼，再調(diào)用數(shù)據(jù)理解工具，對已知條件進行分析。經(jīng)過一系列計算，得出將《哈利波特禁忌之旅》、《侏羅紀大冒險》、《霸天虎過山車》、《大黃蜂回旋機》，這四個項目組合游玩，效果最佳。測試沒問題，點擊發(fā)布，在零代碼的情況下，一個應用就生成了。

　　現(xiàn)在，AppBuilder又進一步升級了，在創(chuàng)建的過程中，全部可以通過“AI優(yōu)化配置”功能，自動幫助開發(fā)者優(yōu)化角色指令、組件配置等環(huán)節(jié)，進一步提高開發(fā)效率。

　　我們再看一個例子。

　　今年年初，華北電力大學提出，希望為全校師生提供智能化的專屬服務�；诎俣鹊腁ppBuilder，我們共同打造了一個華電AI助理，下面，我來給大家展示一下，華電AI助理是怎么做出來的：

　　第一步：打開AppBuilder，進入創(chuàng)建頁面，點擊AI自動生成配置。首先為應用設置名稱、簡介、頭像等基本信息。

　　第二步：通過自然語言在角色指令中描述具體要求，包括任務、組件能力、要求與限制。

　　第三步：插入自定義的圖書借閱查詢、課表查詢、學生成績查詢等組件，讓校園助手能夠具備智能化服務的能力。之后再為校園助手添加一個開場白，這樣應用就配置好了。

　　接下來，我們在預覽界面中，結合用戶提問，對助手進行調(diào)試。比如詢問四六級考試的報名時間，測試各組件自動調(diào)用的效果。

　　大家可以看到，通過這些簡單的操作，這個應用就構建完成了。目前已經(jīng)小規(guī)模測試上線，接入了查制度、查課程，充飯卡、借書籍等高頻場景，服務了學校廣大師生。后續(xù)，我們將與華北電力大學一起，進一步深化應用合作，提供更為豐富便捷的服務。

　　百度在跨模態(tài)方面，也有著多年技術積累。在AppBuilder上面，我們也提供了一定的跨模態(tài)能力，你只需要給一段文字，或者幾句話，就可以快速創(chuàng)建繪畫類的應用，像漫畫、兒童畫本等。

　　過程也很簡單：打開AppBuilder，點擊進入“應用創(chuàng)建”，輸入角色指令，選擇“添加文生圖”組件，再輸入三個推薦問題，就可以點擊發(fā)布了。應用做好后，我們只需要輸入一個大概想要的角色或劇情，AppBuilder就可以自動生成故事、輸出圖畫。

　　百度文庫最新推出的智能漫畫和畫本生成功能，就利用了AppBuilder上提供的這類組件。我們來看看，百度文庫的漫畫生成功能，是如何讓每一個有創(chuàng)想的人，都能做出好作品的。

　　咱們以經(jīng)典的《周處除三害》為例。

　　打開百度文庫，輸入主題《周處除三害》，這在《晉書》和《世說新語》里都有寫到，文庫搜索后，會根據(jù)原文生成故事，我們也可以再對故事內(nèi)容進行修改;然后點擊右側的AI工具欄，開始創(chuàng)建這篇漫畫。

　　進入漫畫制作界面，文庫將根據(jù)故事情節(jié)為我們自動生成漫畫分鏡;然后從光影、寫實、卡通等多種風格中，選擇最貼合故事的漫畫風格;最后根據(jù)角色選擇不同的人物形象，這樣就完成了漫畫的生成。

　　漫畫生成后，我們可以在百度文庫的智能漫畫編輯器里，瀏覽完整的漫畫。同時，文庫支持對每一個畫面進行編輯、修改和精調(diào)，比如，在左側選中畫面“周處與白額虎”，點擊編輯，增加畫面描述“人物面容清晰，畫面明亮”，就能精調(diào)出更符合需求的漫畫。大家看到，百度文庫的漫畫功能在角色和場景的風格一致性方面，都做得非常出色。

　　百度文庫的智能漫畫能力，極大地提高了創(chuàng)作漫畫的效率，降低了漫畫創(chuàng)作的成本和門檻，可以讓更多有想法、有創(chuàng)意的人實現(xiàn)自己的漫畫創(chuàng)作夢。

　　不止生成漫畫，百度文庫現(xiàn)在還可以幫助用戶零門檻的創(chuàng)作畫本。大家可能不知道，中國小孩一年的人均繪本閱讀量只有10本，而歐美國家是50本左右�，F(xiàn)在，AI能夠讓完全沒有繪畫能力的父母，也可以為自己的孩子創(chuàng)作一個專屬的兒童畫本了。下面我們就來看一下這個圖文并茂的有聲畫本吧!

　　從去年開始，我們用AI重構了百度文庫，使它成為用戶“內(nèi)容生產(chǎn)的起點”。如今，在AppBuilder的支持下，百度文庫新推出的智能漫畫和智能畫本功能，更是把場景延伸到了更加有趣的跨模態(tài)創(chuàng)作領域。

　　剛才我用三個案例，展示了如何用百度的AppBuilder，做出AI原生應用。大家應該能夠感受到AppBuilder的兩個明顯優(yōu)勢：

　　一是功能強大。依托文心4.0對指令的理解和遵循能力，我們的AppBuilder，能保證冷啟動就能達到一個不錯的水平，不會因為效果差，再花很長時間去調(diào)優(yōu)，大大降低了開發(fā)門檻。依托檢索增強技術RAG，在知識問答等典型場景，我們的問答準確率和友好回復程度都達到了95%以上，大幅超越其他同類產(chǎn)品。AppBuilder還提供豐富完整的組件工具，包括百度搜索等基于百度多年技術積累的AI能力組件、大模型能力組件，還有百度獨家開放的業(yè)務組件等55個組件。以及一些主流場景的第三方API，比如航班查詢、論文查詢等。我們還剛剛支持了自定義組件，客戶可以直接對接自己專有的任何工具和數(shù)據(jù)。這些豐富的組件，共同支撐起了AI原生應用的高效開發(fā)。

　　二是簡單易用。使用AppBuilder，只需三步即可快速創(chuàng)建應用、一鍵分發(fā)。我們也支持開源的SDK，方便大家進行二次開發(fā)。

　　模型定制工具ModelBuilder：高效低價生產(chǎn)模型

　　下面我再介紹一下更適合專業(yè)開發(fā)者使用的工具，那就是ModelBuilder，它可以根據(jù)開發(fā)者的需求定制任意尺寸的模型，并根據(jù)細分場景對模型進一步精調(diào)SFT，這樣就能達到更好的效果。對開發(fā)者來說，用好大模型很重要的一件事兒，就是掌握模型精調(diào)的方法。

　　我們以教育行業(yè)的作文批改場景來舉例。因為作文批改有明確的評分標準，并且不同年級對作文的要求和打分標準，也是不同的。這就需要模型精調(diào)，讓大模型輸出的結果，更符合特定的要求。

　　我們就來看一下，ModelBuilder是如何實現(xiàn)作文批改的模型精調(diào)的。

　　第一步：創(chuàng)建數(shù)據(jù)集。模型精調(diào)的效果很大程度依賴我們的數(shù)據(jù)質量。在這個案例中，原始數(shù)據(jù)只有180條，質量也不夠高。我們就需要用到三個功能：數(shù)據(jù)清洗、數(shù)據(jù)標注和數(shù)據(jù)增強。數(shù)據(jù)清洗，可以快速去除數(shù)據(jù)的空缺、亂碼等問題。數(shù)據(jù)標注方面，我們對作文增加了更多維度，比如內(nèi)容深度、寫作手法等評價。數(shù)據(jù)增強功能，可以生成同類但不重復的數(shù)據(jù)，進行數(shù)據(jù)擴充。擴充后，ModelBuilder給我們生成了920條高質量數(shù)據(jù)。

　　第二步，就進入模型精調(diào)階段了。首先，我們需要選擇一個進行精調(diào)的基礎模型，這里我們選擇了ERNIE Speed作為基礎模型。然后，我們根據(jù)平臺推薦值來配置參數(shù)，這次數(shù)據(jù)接近1000條，按照推薦的迭代輪次，配置為10輪，然后就可以讓模型開始訓練了。

　　第三步：把模型部署在平臺上，這樣整個精調(diào)過程就完成了。

　　我們來用一篇中學作文，測試下精調(diào)后的模型效果。作文題目是《期待長大》，題材不限，不少于800字。

　　我們將一篇學生的作文及批改格式要求，輸入到精調(diào)前后的兩個模型里。來看下，兩個模型及老師點評三者的對比�？梢钥吹剑{(diào)后的大模型擁有了更加專業(yè)的老師點評思維、更好地做了格式遵循。原本老師需要較長時間才能完成的作文批改任務，現(xiàn)在借助大模型，幾秒鐘就可以快速完成，大大地提升了給學生反饋的速度和效率。目前，這一類精調(diào)后的模型，已經(jīng)在多個教育行業(yè)的頭部企業(yè)中應用起來了。

　　我前面談到大型AI原生應用一般都是MoE。那么，該如何組合使用這些模型，獲得最好的性價比呢?下面，我就用小度來展示一個MoE模型路由的案例。我們首先來看看，有了大模型的加持，小度是不是變得更聰明了：

　　Robin：小度小度

　　小度：在呢

　　Robin：今天有什么新聞?

　　小度：小度播3-5條當日新聞快訊

　　Robin：小度小度。聽說你最近長本事了?

　　小度：我不單能陪你聊天，還能做你的AI日程助手

　　Robin：那我要來考考你了。幫我安排一下日程，今天活動結束后，我會和張總一起用晚餐，之后在酒店有個管理層的會議，大概需要1個半小時，希望10點之前可以結束。明早我準備晨跑，看看天氣如何，然后上午8點有個早會，請幫我安排好日程。

　　小度：根據(jù)您需求，小度給您制定最優(yōu)的日程安排如下

　　您與張總晚餐安排在18：00-19：30，結束后，您將在20：00參加管理層會議，21:30左右結束

　　明早6點鬧鐘將提醒您起床去晨跑，跑步時長控制在1個小時以內(nèi)，確保明早8點早會不遲到

　　明早天氣晴朗，氣溫25度，建議您穿短袖外出，做好防曬

　　您看我能不能當你的秘書，我還有更多新技能呢

　　Robin：挺好的，很棒(向小度豎起大拇指)，把這些日程同步到我的手機上吧。

　　剛剛，我向小度提出了好幾個問題，其中既有簡單的新聞問詢，也有復雜的日程安排需求�？雌饋硎歉粋€小度在交流，其實背后調(diào)用了不同的模型。

　　當它接受到我的問題后，先是由小模型ERNIE Tiny執(zhí)行了“模型路由”的工作;對于天氣問題，它根據(jù)天氣查詢的結果，調(diào)用基于ERNIE Lite打造的精調(diào)模型，也是經(jīng)過SFT的ERNIE Lite，給出了穿衣建議;對于更復雜的日程安排，則調(diào)用了性能最好的大模型——文心4.0，來計算出從今晚到明早的各項事項安排。

　　今天，我們提給小度的每個問題，都會這樣分配給不同模型來執(zhí)行，調(diào)用應用的API接口時，會用ERNIE Functions模型，給孩子講題時，用文心大模型3.5或4.0，智能助理的打造則用了ERNIE Character模型，提高人設一致性、激發(fā)用戶聊天欲望。

　　通過這種大小模型的組合調(diào)度方式，小度不僅順利完成了“換腦行動”，裝上了全新的AI原生操作系統(tǒng)DuerOS X，而且形成了效果、速度和成本的最優(yōu)組合，相比全部使用文心大模型的旗艦版，讓響應速度提升2倍，成本下降了99%。剛才和我對話的這個小度添添AI平板機器人，昨天已經(jīng)在各大平臺全面開售，有興趣的朋友們可以即刻下單體驗了。

　　這幾個關于ModelBuilder的例子，展示的是百度高效低價生產(chǎn)模型的能力。因為有了最強大的基礎模型文心4.0，我們可以根據(jù)需要，兼顧效果、響應速度、推理成本等各種考慮，裁剪出適合各種場景的更小尺寸模型，并且支持精調(diào)和post pretrain。這樣通過降維裁剪出來的模型，比直接拿開源調(diào)出來的模型，同等尺寸下，效果明顯更好，同等效果下，成本明顯更低。大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。所以開源模型會越來越落后。

　　為了方便大家快速上手，ModelBuilder預置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0，這是旗艦版的大模型，它適合通用的復雜場景，能力強大;還有三個輕量級的大模型， ERNIE Speed、Lite、Tiny;另外還有兩個垂直場景的模型，ERNIE Character適合角色扮演;ERNIE Functions適合對話或問答場景中的外部工具使用和業(yè)務函數(shù)調(diào)用。當然ModelBuilder也支持國內(nèi)外第三方主流模型，總數(shù)量達到77個，是國內(nèi)擁有大模型數(shù)量最多的開發(fā)平臺。

　　第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動：設5000萬元特別大獎

　　對于開發(fā)者，我們除了提供這些開發(fā)工具，還提供資金和資源方面的支持。

　　去年5月份，百度啟動了“文心杯”創(chuàng)業(yè)大賽，希望推動大模型生態(tài)繁榮，打造更有活力的生態(tài)系統(tǒng)，幫助創(chuàng)業(yè)者、開發(fā)者開發(fā)各種AI原生應用。第一屆“文心杯”創(chuàng)業(yè)大賽，我們收到了近1000支創(chuàng)業(yè)團隊報名，百度為其中的15支優(yōu)勝團隊，提供了近億元的投資支持，并且在技術、團隊和資源上持續(xù)提供全方位扶持。

　　今天我宣布，第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動。這次我們將擴大項目篩選范圍、設置分賽場，面向全球市場及高校學子，招募創(chuàng)業(yè)創(chuàng)新團隊，只要你的創(chuàng)業(yè)方向是AI原生應用，都可以在大賽官網(wǎng)報名參賽。同時，我們也加大了對創(chuàng)業(yè)者的支持力度，提供更充足的投資資金、更豐富的業(yè)務資源，還首次設立了“特別大獎”，特別優(yōu)秀的項目將有機會獲得最高5000萬人民幣的現(xiàn)金和資源支持。

　　中國的創(chuàng)業(yè)者和開發(fā)者，非常善于利用新技術來開發(fā)應用。我相信，文心大模型將成為中國AI創(chuàng)業(yè)者和開發(fā)者的首選，越來越多的應用會建立在文心大模型之上。我也期待，更多創(chuàng)業(yè)者和開發(fā)者加入我們，一起構建繁榮的AI生態(tài)。

　　視覺大模型最大的應用場景是自動駕駛

　　前面我們談到的這些工具和案例，大部分都是基于大語言模型的。面向未來，我認為多模態(tài)大模型，或者說文字、圖片、語音、視頻等多模態(tài)的融合，是基礎模型非常重要的長期發(fā)展方向，是通往AGI的必經(jīng)之路。百度在這些領域有著長期投入，并將及時更新技術進展。

　　我有一個非常不一樣的判斷：視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的，是自動駕駛的全球領導者，我們不只訓練AI如何生成視頻，更訓練AI理解真實世界發(fā)生的事情并預測未來。

　　基于超過1億公里的、中國復雜城市道路測試里程數(shù)據(jù)，百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。

　　百度地圖也率先將視覺感知大模型應用到了制圖領域�，F(xiàn)在，全球最大規(guī)模的車道級地圖數(shù)據(jù)，已經(jīng)上線全國360座城市。只要百度地圖導航能去的地方，智駕就都能開。

　　今年春節(jié)后，百度的蘿卜快跑實現(xiàn)了萬里長江“第一跨”，我們把服務從長江的北岸延伸到了南岸，在武漢的部分區(qū)域，我們已經(jīng)實現(xiàn)了7X24小時的全天候運營，還計劃年內(nèi)在武漢部署1000臺無人駕駛車輛。

　　這是自動駕駛走向真正商業(yè)化的一個標志性事件，它不再僅僅是區(qū)域性的示范，而是進入到了城市級應用示范的新階段。蘿卜快跑在武漢覆蓋了3000多平方公里、770萬人口，是全球范圍內(nèi)最大規(guī)模的自動駕駛運營區(qū)域。

　　“打包帶走，隨取隨用”

　　剛才，我給大家展示了百度文心大模型系列，以及三個開發(fā)工具——AgentBuilder、AppBuilder、ModelBuilder，他們組成了一個工具箱，你們可以馬上打包帶走，隨取隨用。

　　此時此刻，我站在這里，其實也是一個開發(fā)者、一個創(chuàng)業(yè)者，跟大家一樣興奮。今天的中國，有10億互聯(lián)網(wǎng)用戶，有強大的基礎大模型，有足夠多的AI應用場景，有全球最完備的產(chǎn)業(yè)體系，國家也在大力鼓勵和支持“人工智能+”行動，每一個人，每一家企業(yè)，只需要充分利用這些工具，就可以釋放無限的創(chuàng)造力和生產(chǎn)力。

　　今天，人人都可以成為開發(fā)者。而未來，也必將是一個由開發(fā)者一起創(chuàng)造出來的未來!

　　謝謝大家!

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信