大模型的核心價值,不是聊天,而是生產(chǎn)力。大模型的技術(shù)關(guān)鍵,不是作詩,而是思維鏈。
文|周享玥
靠著顛覆式的“Chat”能力從2023年Q1火到Q2后,大模型的生產(chǎn)力工具屬性正在加速被重視和加強。
4月26日下午,人工智能企業(yè)第四范式展示其大模型產(chǎn)品“式說3.0”。一同被公布的還有這家公司最新提出的AIGS戰(zhàn)略(AI-Generated Software):以生成式AI重構(gòu)企業(yè)軟件。
“從我的視角看,無論中美,并不缺任何一個基于GPT的聊天平臺,如果有,很好;如果沒有,也無所謂。但生產(chǎn)力的平臺是決不能錯過的。”第四范式創(chuàng)始人兼CEO戴文淵說出了他對大模型關(guān)鍵性的思考,在他看來,AI大模型是一個生產(chǎn)力級別的事物,能帶來全社會效率的提升。
此前,國內(nèi)外大廠已開始探索AIGC大模型對生產(chǎn)力的改造。
其中備受關(guān)注的是微軟。從去年開始,微軟宣布了一系列Copilot(副駕駛)產(chǎn)品,將AIGC布局到代碼生成、Office辦公軟件、CRM企業(yè)軟件以及安全等領(lǐng)域。此后,亞馬遜、Salesforce、華為、阿里、字節(jié)跳動也有相關(guān)動作。
第四范式選擇的切入口是嘗試改造B端企業(yè)級軟件,也叫AIGS。戴文淵提到,AIGS的想法源于一個很多人都比較直觀的認知——相比已經(jīng)逼近用戶體驗和效率上限的C端產(chǎn)品,B端的企業(yè)級軟件還處于交互體驗極為復雜、開發(fā)效率極低的階段,這些恰恰為生成式AI留下了足夠大的重構(gòu)和改造空間。
業(yè)界人士將大模型類比于當年第一臺蒸汽機,在新的AIGC時代,“蒸汽機”正在帶來對各行各業(yè)生產(chǎn)效率的提升。
01
大模型的高段位不是聊天,而是思維鏈
第四范式的大模型名為“式說”。與此前公布的多個AI大模型一樣,式說具有多輪對話、圖片理解、寫小說、畫圖、知識庫等多模態(tài)基礎(chǔ)能力。比如,在現(xiàn)場演示中,式說完成了畫“獅子頭”和“紅燒獅子頭”、編寫了《流浪地球3》的劇本,完成“用Python編寫求斐波那契數(shù)列前30項的程序”、“編寫一個隨機數(shù)的游戲程序”等代碼生成。
數(shù)智前線觀察,式說將上述功能歸為“基礎(chǔ)能力”。而把能力重心更多放在Copilot(副駕艙)和思維鏈CoT(chain of thoughts,多步推理)上,二者也是實現(xiàn)AIGS的關(guān)鍵能力。
比如,式說要完成一個更為復雜的物流運輸行業(yè)的“裝箱”操作——將貨物放入集裝箱,如何最大化裝箱效率。現(xiàn)場,戴文淵下達“幫我執(zhí)行一個裝箱任務”的指令后,式說便會推理出接下來一步步要執(zhí)行的子任務:
它先確認“這是一個裝箱任務”,并自動設(shè)定了“任務目標”:分析集裝箱及小箱子的尺寸,設(shè)計裝箱方案。
之后,又把目標拆分成三個具體步驟:主動要求戴文淵分步驟輸入集裝箱尺寸、待裝箱貨物尺寸和數(shù)量,以及其他約束條件。
然后,對不同類型的箱子進行堆疊組合,經(jīng)過多輪嘗試,耗時幾十秒之后,輸出了自己通過思考后在65種裝箱方案中找出的最優(yōu)裝箱結(jié)果。
最后,在交互界面中完整展示出了自己的“思考”過程。
“它干這個事比我厲害,我沒半個小時做不出來。”戴文淵表示,這背后正是思維鏈的能力起了作用。簡單來說,就是在解決多步驟推理問題時,模型可以模仿人類思維過程,將復雜任務拆分,逐步推理并執(zhí)行。
一位互聯(lián)網(wǎng)大廠資深人士告訴數(shù)智前線,業(yè)界現(xiàn)在其實還存在一種意識誤區(qū),“很多人都在強調(diào)Chat,看到大模型熱熱鬧鬧地寫了個作文、作了一首詩,卻很少注重思維鏈,而實際上,思維鏈才是大模型背后真正最核心的東西。”
他舉例稱,最近國內(nèi)某大型金融企業(yè)就推出了一個AI大模型產(chǎn)品,但從命名來看,其去掉了ChatGPT中最重要的GPT,反而保留了相對不那么重要的Chat。
為什么思維鏈遠比Chat重要?這就好像是如果沒有理解和推理能力,就相當于在沙漠中蓋高樓。
戴文淵也強調(diào):“因為思維鏈的能力就是只有當它聰明到一定程度,干別的事也可以。”這正是通用大模型的本質(zhì)。
以企業(yè)軟件為例,在學習企業(yè)軟件大量的數(shù)據(jù)和“套路”后,AI能形成中間的邏輯推理步驟,從而更好地配合人在軟件上執(zhí)行復雜的工作。
“就像是PS一張照片,機器可以做到把圖片調(diào)亮20%、調(diào)一下陰影等單點步驟,但你最終的訴求并不是這些步驟本身,而是把人像修的好看。進化至’把圖P好看’就需要用到思維鏈。思維鏈的能力就像是一個人一直看著別人用PhotoShop,看了幾百遍他就學會了。”
這也是為什么要將思維鏈作為實現(xiàn)AIGS的關(guān)鍵能力的原因。
關(guān)于怎么提高思維鏈的問題,上述大廠資深人士告訴數(shù)智前線,目前大家都在采取各種不同的方式來探索提升思維鏈,比如一些企業(yè)喂給大模型更有邏輯性的語料,以及用到程序、提示學習等方式。
戴文淵稱,對于企業(yè)軟件合作伙伴來說,可以基于范式的大模型能力,在一個個領(lǐng)域里面鉆得足夠深,學習到足夠多的數(shù)據(jù)和攻略,最終形成所在領(lǐng)域的思維鏈,發(fā)展成“領(lǐng)域”大模型。而當思維鏈復雜度到一定程度以后,它的軟件就能夠自動執(zhí)行越來越復雜的功能,最終形成壁壘。
02
如何用生成式AI重構(gòu)企業(yè)軟件?
作為一家人工智能公司,第四范式此前一直與軟件公司互為生態(tài),“范式做軟件里面的AI決策,軟件公司做功能和流程的實現(xiàn)”。但此前他們經(jīng)常遇到一個問題,比如用AI改造供應鏈場景時,模型相關(guān)的工作兩周就能搞定,但整個智慧供應鏈卻往往因為軟件的開發(fā)周期需要做一年,大大拖慢了AI整體的落地速度。
這背后代表的是B端軟件在體驗和開發(fā)效率上的巨大改造空間。戴文淵曾在與合作伙伴交流時發(fā)現(xiàn),對方給他展示行業(yè)內(nèi)所使用的軟件,下拉菜單甚至已經(jīng)超過電腦屏幕的大小。實際上,即便是C端的Office軟件,用戶要真正用好也是有難度的,更何況是CAD、ERP、CRM等面向功能導向、使用門檻更高的B端企業(yè)軟件。
生成式AI的出現(xiàn),帶來了改變這種困境的機會,AI對軟件和產(chǎn)業(yè)的改造從原來的決策部分,進一步擴展至了前端交互。一個AIGS軟件(大概率是一個對話框的形式),有機會創(chuàng)造一個體驗優(yōu)秀、界面極簡、自我迭代的新型軟件工作流。
“之前B端企業(yè)軟件基于菜單式的開發(fā),每次一個功能升級,又要周而復始的經(jīng)歷原型圖、設(shè)計、開發(fā)等,至少是月級別的開發(fā)時間。”戴文淵稱,但隨著大模型帶來的“對話框”式固定界面出現(xiàn),現(xiàn)在功能和邏輯只需在數(shù)據(jù)、API和內(nèi)容層面下功夫即可,可以提速到以天為級別的開發(fā)效率。
一家國內(nèi)航空制造企業(yè)當日演示了與第四范式在CAD工業(yè)軟件上的共創(chuàng)情況。這也是一個功能菜單遠超屏幕大小的軟件,在軟件庫中,自研零部件幾十萬,型號上百萬,更別說外采零部件的信息(描述、標簽、屬性、參數(shù))等,一般來說,廠商會投入大量時間和精力在“三維數(shù)模”的搜索、聚類、生成等設(shè)計過程中。
在探索引入大模型后,該企業(yè)相關(guān)負責人現(xiàn)場直接用語音提問,「幫我找類似的零件」,「給出這兩個零件的裝配方案」,這樣的自然語言,就能在 CAD 系統(tǒng)的龐大工程中,找到所有與之類似的三維數(shù)模零件,給出多種數(shù)模組裝方案。
“AIGS 的一小步,對我們來說已經(jīng)是邁出了一大步。這些功能對于動輒需要幾百萬個零部件的飛機制造來說,將帶來巨大的生產(chǎn)力提升。”相關(guān)負責人表示。
實際上,這樣的創(chuàng)新符合國內(nèi)制造龍頭在工業(yè)軟件上的創(chuàng)新趨勢。數(shù)智前線此前了解到諸如造船業(yè)要涉及幾乎80%的工業(yè)門類,使用幾十種工業(yè)軟件,這些軟件主要來自國外不同供應商,他們都是封閉的,導致數(shù)據(jù)在設(shè)計、制造、采購、維修等流程中無法流轉(zhuǎn)。國內(nèi)已有龍頭企業(yè)對工業(yè)軟件從底座上進行改變,以提升效率。而AIGS對數(shù)據(jù)流轉(zhuǎn)和傳統(tǒng)軟件開發(fā)應用將帶來巨大變革。
03
AIGS在行業(yè)中的共創(chuàng)
在提出AIGS理念并迭代相關(guān)技術(shù)的同時,第四范式已將其帶入行業(yè),在場景中與行業(yè)龍頭進行聯(lián)合創(chuàng)新。
4月26日當天,一批來自金融、醫(yī)療、航空制造等領(lǐng)域的企業(yè),也在現(xiàn)場分享了他們有關(guān)大模型的思考和實踐。
一家醫(yī)療企業(yè)已經(jīng)開始探索將式說大模型引入到患者關(guān)懷、醫(yī)生提效、業(yè)務助力等關(guān)鍵場景中。比如基于專業(yè)知識,用生成式AI為患者提供更加專業(yè)、真實、符合個人情況的關(guān)懷。比如幫助醫(yī)生提醒沒有按時隨訪、且指標有可能存在異常的患者。比如通過模型思維鏈能力,賦能醫(yī)藥代表如何一步步解答醫(yī)生疑慮,更好地完成業(yè)務目標。
不過,通過生成式大模型改造生產(chǎn)力的過程并非一蹴而就,戴文淵總結(jié)為三個階段:
1.0階段是以Copilot將企業(yè)軟件改造成自然語言的交互形式,背后是企業(yè)內(nèi)部應用庫、私有數(shù)據(jù)之間的“聯(lián)網(wǎng)”;
2.0則在這個基礎(chǔ)上,基于Copilot不停地豐富對話框的能力,并且積累企業(yè)用戶的行為數(shù)據(jù)來形成基于企業(yè)規(guī)則的“知識庫”,這個“知識庫”可以作為AI一次次執(zhí)行復雜工作的“攻略”;
最終的3.0,具有推理能力的大模型會自己形成中間步驟,從而替人來拆分并執(zhí)行復雜工作。
但這個跨越需要建立在大量數(shù)據(jù)以及行為數(shù)據(jù)的積累之上。“通常絕大多數(shù)企業(yè)會直接從AIGS的1.0階段快速進入到2.0,而3.0是需要一定的時間去進行數(shù)據(jù)積累的。”戴文淵說。但他也表示,隨著大模型能力的加強,3.0并不像以前那樣需要積累幾百萬、上千萬的樣本才能做。
第四范式主任科學家涂威威介紹,目前已搭建了一個在AIGS領(lǐng)域的四層布局,分別是底層的式說大模型,能力層的思維鏈CoT、Copilot、知識庫,平臺層的開發(fā)平臺,以及基于上面這三層,在金融、零售、醫(yī)療、制造、能源、交運領(lǐng)域開發(fā)的企業(yè)級應用。
一家金融企業(yè)的人士現(xiàn)場表示,他們在感受到ChatGPT帶來的沖擊后,就第一時間聯(lián)系了國內(nèi)能做這方面能力的企業(yè)咨詢相關(guān)事宜。“這是我們必須面對的挑戰(zhàn)和做出的變化,不能逃避。”該人士表示。最終,他們選擇了第四范式,因為它是第一家向他們承諾能私有化部署的企業(yè)。
大模型的私有化部署的確已經(jīng)成為一些國內(nèi)企業(yè)的迫切需求。"像金融行業(yè)相對是比較敏感的,當然也有些行業(yè)其實不那么敏感。”戴文淵表示。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。