文|光錐智能,作者|郝鑫,編輯|王一粟
“世界上最高的山是什么山?”
云知聲創(chuàng)始人兼CEO黃偉仍清楚地記得,十年前他用語音提出的第一個問題。答案播放出來的那一刻,黃偉第一次體會到創(chuàng)業(yè)的成就感。
今年2月底,山海大模型雛形初現(xiàn),用同樣的問題測試,黃偉一瞬間感覺好像穿越回了十年前,那座“最高的山”正在招手呼喚他。
“去年12月第一次看到ChatGPT,正是我創(chuàng)業(yè)十年最灰暗的時刻。而現(xiàn)在站在發(fā)布會舞臺上,剩下的只有緊張、興奮和自豪。”黃偉慶幸,自己再次搭上了AI下個十年的快車。
5月24日,云知聲正式發(fā)布“山海大模型”,現(xiàn)場實測十大核心能力,具體包括:語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)等7項通用能力,以及插件擴展、領(lǐng)域增強、企業(yè)定制等3項行業(yè)落地能力。
值得一提的是,除了通用能力的演示,一向重視“工程化”的云知聲也比較明確地提出了落地能力的實現(xiàn)路徑。這讓大模型的落地更加實際,不是空中樓閣。
而在更重要的行業(yè)應(yīng)用層面,云知聲則仍然堅持此前提出的“U+X戰(zhàn)略”,賦能醫(yī)療、智慧物聯(lián)、銷售、知識管理、教育等千行百業(yè)。
在云知聲最為重要的落地場景之一——醫(yī)療領(lǐng)域,黃偉透露,山海大模型在臨床執(zhí)業(yè)醫(yī)師醫(yī)學(xué)考試中拿到了511分,滿分600分,考生平均分為365。“在醫(yī)療領(lǐng)域,山海大模型已經(jīng)超越了GPT-4的中文水平。”
得益于此前在Ttransformer模型方向的發(fā)力,以及從2016年對醫(yī)療領(lǐng)域的深耕,云知聲從去年12月開始組建AGI團隊,“閉門修煉”5個月后,就拿出了一個在通用能力方面與國內(nèi)大公司打平,在行業(yè)大模型超越GPT-4中文水平的成績。
黃偉并不滿足這樣的成績,給云知聲定下了年內(nèi)的目標(biāo),“年內(nèi)通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個垂直領(lǐng)域能力超越GPT-4。”
雖然2個月近20個大模型發(fā)布中“有李逵也有李鬼”,但一流AI公司的技術(shù)水平可以靠時間接近GPT-4成為了行業(yè)共識。當(dāng)技術(shù)拉齊后,大模型正在打響一場“行業(yè)”爭奪戰(zhàn)。
01 把通用能力用起來
在通用能力上,云知聲山海大模型順利通過了語言理解、推理能力等一系列測試。
首先,在對中文的理解方面,山海大模型更接近“中國人的體質(zhì)”,可以精準(zhǔn)地理解中文6級水平的繞口令“行的人,干一行行行行,行行都行”中每個“行”的意思,還能給出單獨的解釋。知道八大山人是畫家的名號,孫悟空和齊天大圣是同一個人?梢哉f,山海大模型對中文的理解達(dá)到了百科字典的水平。
不僅如此,山海大模型還具備邏輯判斷和計算推理能力。例如,可以識破“所有貓都愛吃魚,所以愛吃魚的動物都是貓”這類偽三段論邏輯,以及“小明爸爸姓王,問小明姓什么”這類基本常識問題。
而在計算能力中,山海大模型可以立即給出雞兔同籠這類簡單問題的答案和解題過程,也能夠根據(jù)指令當(dāng)場編寫代碼。在涉及開根號等復(fù)雜的數(shù)學(xué)運算上,山海模型也沒有拉胯,過程清楚、答案正確。
總體來看,與國內(nèi)各家大模型相比,山海大模型雖然沒有展現(xiàn)圖文生成等多模態(tài)的能力,但關(guān)鍵的NLP(自然語言處理)表現(xiàn)仍在頭部水平。
光錐智能盤點了已發(fā)布大模型的公司發(fā)現(xiàn),隨著技術(shù)的不斷更新迭代,各家公司在文本生成、知識問答、語言理解、邏輯推理等各項通用能力上的差距正在變得越來越小,甚至有了同質(zhì)化的趨勢。
所以,攻克大模型的技術(shù)難關(guān)只是第一步,如何用起來才是接下來的關(guān)鍵。
ChatGPT驚艷全球后,OpenAI隨即拋出的一顆驚雷,就是宣布向所有ChatGPT Plus用戶開放聯(lián)網(wǎng)功能和70多個第三方插件,插件覆蓋了衣食住行、社交、工作以及學(xué)習(xí)等方方面面。
面對千行百業(yè),沒有一家公司能夠獨立吃下所有場景。民生證券報告稱:“OpenAI正沿著類蘋果模式的‘終端+平臺+生態(tài)’,邁向高于操作系統(tǒng)的戰(zhàn)略地位。”
云知聲也有同樣的思考路徑,但不同的是,更希望利用插件,將合作伙伴的能力集成進來。用了計算器插件,山海大模型就實現(xiàn)了復(fù)雜計算的能力;用了搜索引擎插件,就能幫用戶實時查天氣、查球賽結(jié)果。與ChatGPT一樣,給大模型按上了插件就裝上了“外掛”。
黃偉表示:“大模型的通用能力并不能解決所有問題,還有說胡話的風(fēng)險。特別是在醫(yī)療、汽車、物聯(lián)一些容錯率低的專業(yè)場景中,通用能力就顯得不那么夠用,所以才要引入大量的插件來推動應(yīng)用落地,做大模型的黃金搭檔。”
云知聲也給AI公司做大生態(tài)提供了借鑒思路,面對很多垂類的行業(yè)場景,AI公司一方面可以自己做一些插件去開放給行業(yè)客戶,集成到產(chǎn)品里。另一方面,也可以讓客戶自己做插件開發(fā),共同深入場景。
02 成為行業(yè)專家
通用能力的提升,在行業(yè)場景的實際落地方面,還遠(yuǎn)遠(yuǎn)不夠。這就要求大模型們,不僅成為AI領(lǐng)域的“本科全才”,更要成為特定領(lǐng)域中的“博士生”甚至“博導(dǎo)”。
即使通用能力強如ChatGPT,在醫(yī)療等特定領(lǐng)域的專業(yè)度也遠(yuǎn)遠(yuǎn)未達(dá)到可用的水平。例如,對一手術(shù)過程的描述,ChatGPT給出了一個完全錯誤的答案?梢哉f,一旦涉及到核心的診療過程,ChatGPT目前只是一個“庸醫(yī)”。
“如果把GPT-4比作一個不偏科,每門都能考到80分的學(xué)生;我們要做的,則是一個可以在某一兩門學(xué)科,考到95分甚至更高的學(xué)生。”黃偉在采訪中說道。
而這恰恰是眾多行業(yè)大模型的機會。從實際問題和產(chǎn)業(yè)應(yīng)用出發(fā),沉淀垂直行業(yè)經(jīng)驗,AI公司就能建立自己在特定領(lǐng)域的壁壘。
從這個角度而言,在AI 1.0時代積累下行業(yè)能力的AI公司,擁有更大的機會。
2016年,醫(yī)療+AI行業(yè)還猶如一片空白地帶,彼時,AI企業(yè)們還在找尋合適的降落姿勢。
以語音技術(shù)起家的云知聲,抓住了醫(yī)生病歷記錄效率低下這個痛點,以語音電子病歷錄入打開了醫(yī)療賽道的突破口。
為了能夠做到精準(zhǔn)識別,云知聲為醫(yī)院做了深度定制服務(wù),根據(jù)不同科室、不同病種整理病歷資料,運算出關(guān)鍵詞句語料,為40多個臨床和醫(yī)技科室提供分場景支持,以適應(yīng)醫(yī)院不同科室實際的使用需求。
經(jīng)過專業(yè)數(shù)據(jù)優(yōu)化后,云知聲在醫(yī)療領(lǐng)域的優(yōu)勢十分明確,其語音識別準(zhǔn)確率超95%,個別科室的語音識別率超98%。醫(yī)生減負(fù)效果明顯,可以使醫(yī)生的錄入效率提升40%,每天節(jié)省1.5-2個小時時間。
然而,僅從一個單一效率工具切入并不夠。
三年磨一劍,2019年,云知聲公布了“醫(yī)療+AI”的戰(zhàn)略,從電子病歷場景出發(fā)構(gòu)建起了醫(yī)療產(chǎn)品體系。除“醫(yī)療語音交互解決方案”外,針對診療過程的診前、診中、診后不同場景,云知聲還推出了導(dǎo)醫(yī)機器人、智能病歷生成系統(tǒng)、智能病歷質(zhì)控系統(tǒng)以及智能院后管理解決方案等產(chǎn)品。
此外,基于對場景的理解,云知聲在醫(yī)療垂直領(lǐng)域建立起了知識圖譜,圖譜覆蓋了癥狀、體征、疾病、手術(shù),檢查檢驗,藥品等七大類實體,共計132萬個,對應(yīng)醫(yī)學(xué)術(shù)語334萬;包含十大類實體關(guān)系,共計757萬實體關(guān)系。2017年建立至今,該知識圖譜仍在更新迭代中,這成為云知聲核心壁壘之一。
黃偉介紹知識圖譜在大模型訓(xùn)練中發(fā)揮了重要的作用,“行業(yè)大模型訓(xùn)練有三個主要的數(shù)據(jù)來源,一是云知聲多年沉淀下來的優(yōu)質(zhì)醫(yī)療數(shù)據(jù),預(yù)訓(xùn)練階段可以加強大模型的知識和語言能力;二是在醫(yī)療行業(yè)積累的問題解決數(shù)據(jù),這部分可以拿來做微調(diào);三是知識圖譜,靠它嚴(yán)謹(jǐn)?shù)闹R來校驗數(shù)據(jù)和訓(xùn)練結(jié)果。”
在高質(zhì)量知識圖譜數(shù)據(jù)之上,實現(xiàn)了數(shù)據(jù)到場景的全鏈條打通,云知聲旗下的醫(yī)療產(chǎn)品從語言電子病歷、語音助手這類效率工具,進化為了病歷文書質(zhì)控、醫(yī)保支付審核一類的決策支持工具。
在大模型的加持下,云知聲也完成了從AI助手到AI專家,再到AI導(dǎo)師的角色升級。對比從前,所能抵達(dá)的場景更加厚重,能觸及的核心技術(shù)更多,行業(yè)know-how的經(jīng)驗再次更新沉淀下來。
如果說,云知聲在醫(yī)療行業(yè)的扎深是一家AI公司如何深入到行業(yè)的典型,那么其在物聯(lián)網(wǎng)領(lǐng)域的拓展,則證明了一家AI公司如何能把技術(shù)變成靠標(biāo)準(zhǔn)化的產(chǎn)品,從而打開行業(yè)廣度的生意經(jīng)。
2015年,云知聲啟動了AI語音芯片項目,并提出“云-端-芯”一體戰(zhàn)略。一方面把在垂直行業(yè)積累的AI技能放在云端,一方面通過芯片去賦能設(shè)備端的邊緣計算能力,進而把云端的算法能力向設(shè)備端進行輸出。
通過自研芯片的方式將算法集成在芯片模組中,這不僅形成了相對標(biāo)準(zhǔn)化的產(chǎn)品,還讓云知聲實現(xiàn)了產(chǎn)品成本的降低。“標(biāo)準(zhǔn)化+降本”,才能大規(guī)模應(yīng)用到智慧家居、車聯(lián)網(wǎng)等場景。
同時,云知聲這些年還搭建了厚重的中臺能力。物聯(lián)中臺發(fā)揮集中調(diào)配、匯總信息的功能,實時管理設(shè)備、人員、服務(wù)等各項因素,最終通過語音交互輸出指令反饋。
而到了大模型時代,面向智慧物聯(lián)場景,會有什么樣的進階呢?
ChatGPT已經(jīng)讓業(yè)界看到,人人都能擁有一個AI助手即將成為現(xiàn)實。“未來將全線升級智慧物聯(lián)核心產(chǎn)品,與山海大模型深度結(jié)合,塑造出一個真正的隨身管家:從只能進行指令交互升級為類人對話,真正聯(lián)動IoT生態(tài)和服務(wù)。”黃偉在發(fā)布會上表示。
“與全場景自然語言交互相比,搜索引擎的市場就非常小了。”一位曾在語音等AI領(lǐng)域深耕20年的創(chuàng)始人曾對光錐智能表示,萬物智聯(lián)的自然交互,才是更廣闊的市場。
“大模型發(fā)布后,無論是汽車、智能家居、酒店等各個潛在客戶,已經(jīng)迫不及待地在跟我們要方案了。”黃偉透露。
十年間,云知聲AI實現(xiàn)了三級跳,從第一階段的AI三駕馬車、“云端芯”戰(zhàn)略,到第二階段的以超算中心、知識圖譜等構(gòu)成的規(guī);疉I技術(shù)戰(zhàn)略,和開放平臺+智慧物聯(lián)/智慧醫(yī)療的“U+X”市場戰(zhàn)略,每一個階段都緊跟技術(shù)和市場的變化。
再到如今的AGI時代,云知聲也迎來了自己的GPT時刻。在技術(shù)上,不僅擁抱基礎(chǔ)大模型,也在工程化上利用指令調(diào)優(yōu)+反饋強化,讓大模型不斷迭代提升;另外,也在多知識/多模態(tài),以及跨語言/模態(tài)方面積極布局,為增量需求拓展能力。在市場策略上,依然堅持“U+X”,實現(xiàn)AGI+Industry生態(tài)加速。
在此次發(fā)布會上,除智慧醫(yī)療、物聯(lián)場景外,云知聲亦在教育、銷售場景、知識管理等場景上儲備下了能力,準(zhǔn)備迎接更多行業(yè)的升級需求。
03 行業(yè)爭奪戰(zhàn)打響,云知聲如何比拼?
自3月以來,國內(nèi)已有20多個玩家狂奔入局。從文心大模型到山海大模型,國產(chǎn)大模型之戰(zhàn)迎來中場戰(zhàn)事,從比拼“通用”進階到了比拼“行業(yè)”。
據(jù)不完全統(tǒng)計,在國內(nèi)發(fā)布的大模型中,行業(yè)大模型占比超過60%,各家AI公司大模型已經(jīng)開始向工業(yè)、金融、醫(yī)療、營銷、智慧物聯(lián)等多個領(lǐng)域滲透。比如,百度在發(fā)布文心一言后,在全國各地陸續(xù)舉辦了多場行業(yè)大模型的推介會,涉及工業(yè)、能源、媒體、金融等領(lǐng)域;而阿里云雖然沒有發(fā)布單獨的行業(yè)大模型,但也強調(diào)維度更垂類的企業(yè)大模型。“未來每一個企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識和應(yīng)用場景,訓(xùn)練自己的企業(yè)大模型。”
相比巨頭在技術(shù)上拼參數(shù),在市場上拼生態(tài),云知聲這樣的小巨頭,也有自己從本質(zhì)出發(fā)的思考。
“ChatGPT將人工智能研究的核心帶回到語言本身,而語言其實是人類智能的一個核心載體。”云知聲董事長梁家恩認(rèn)為,這是一個從專用AI轉(zhuǎn)向通用AI(AGI)的突破口。”
但轉(zhuǎn)向通用AI,并不能盲目的擴大訓(xùn)練參數(shù)。這是因為,雖然在優(yōu)質(zhì)數(shù)據(jù)規(guī)模足夠大情況下,模型越大效果越好,但訓(xùn)練成本也越高。
基于AI 1.0時代在專用AI方面的積累,云知聲計劃先將模型做到六七百億參數(shù),做出涌現(xiàn)效果,然后以這個參數(shù)規(guī)模,提升優(yōu)質(zhì)數(shù)據(jù)規(guī)模和大模型效果,再做千億以上參數(shù)來提高大模型性能。
云知聲堅信,通往AGI的路不只有一條。
“除了用大力出奇跡去做大模型,也可以用更高質(zhì)量的‘數(shù)據(jù)+規(guī)模’當(dāng)適當(dāng)?shù)臄?shù)據(jù)參數(shù),做行業(yè)‘中模型’。”黃偉表示,云知聲目前正在兩條腿一起走路。今年Q3云知聲會發(fā)布對標(biāo)GPT-3.5的“山海2.0”,數(shù)據(jù)參數(shù)也將達(dá)到千億級。而在Q3,云知聲的“中模型”也即將發(fā)布。
既然要做中模型,在行業(yè)爭奪戰(zhàn)中,又回到了上個階段中對行業(yè)深耕的過程。
縱觀整個中國市場的行業(yè)大模型玩家,首先基于1.0階段積累的行業(yè)經(jīng)驗不同,各家深扎的場景也不同,F(xiàn)階段,想要橫跨多個行業(yè)不太現(xiàn)實,無論是頭部大廠還是中小公司都可以有自己的壁壘。
其次,即使是進入同一行業(yè),每家公司瞄準(zhǔn)的方向也不同,細(xì)分領(lǐng)域競爭更具多樣化。如同樣在醫(yī)療領(lǐng)域,云知聲將語義識別的優(yōu)勢運用在了門診病歷撰寫、手術(shù)報告生成上,而商湯則將重點放在了線上問診、咨詢上。
而在真正的行業(yè)應(yīng)用落地時,還要考慮實際成本。
在AI 1.0階段,被調(diào)侃“有多少人工就有多少智能”的數(shù)據(jù)標(biāo)注情況,將被自動化標(biāo)注逐步替代。相對于GPT訓(xùn)練中需要的45T數(shù)據(jù),以前的AI訓(xùn)練數(shù)據(jù)量如同九牛一毛。在數(shù)據(jù)量較小的情況下,還能做到分離標(biāo)注,而現(xiàn)在數(shù)據(jù)訓(xùn)練過程完全自動化,根本無法標(biāo)注。于是,需要通過人類生成反饋的技術(shù),替代傳統(tǒng)數(shù)據(jù)標(biāo)注。
另外,則是數(shù)據(jù)訓(xùn)練成本。云知聲認(rèn)為,大模型訓(xùn)練成功后,以目前的算力成本,可能需要把大模型參數(shù)量通過蒸餾技術(shù)壓縮10倍才能滿足實時性和規(guī);瘧(yīng)用要求,這要視具體應(yīng)用場景而定。云知聲在做BERT模型時,就通過模型蒸餾提速近百倍,而實際性能損失很小。“就像打擊索馬里海盜,不能每次都開著航母過去。”梁家恩稱。
04 技術(shù)撬動行業(yè)價值
縱觀國產(chǎn)大模型,目前整個行業(yè)依然在非常早期,即使如馬斯克所言,中美技術(shù)的差距有12個月,但放眼到未來20年的長期競爭中,這開頭的100米或許并沒有那么重要。
回顧1.0階段,AI公司花費了6年的時間實現(xiàn)了價值跨越。
科大訊飛營收從2017年的54.45億,一躍增長至2022年的188.20億,對應(yīng)28.15%的復(fù)合增速;商湯的營收從2018年的18.5億,增長至2022年的38.09億,收入也實現(xiàn)了翻倍。
上個階段,AI技術(shù)實現(xiàn)了舊業(yè)務(wù)的提效、新業(yè)務(wù)的增長,最終達(dá)成AI公司營收、市值的雙增。進入2.0時代,這個邏輯依然成立,只不過2.0階段可能釋放的價值會更大,用的時間也會更短。
黃偉判斷,在新時代有兩件事目前是已經(jīng)確定的。首先,AI公司具備了更強的技術(shù)能力后,就能更好地滿足客戶需求,繼而也能更容易地推動商業(yè)化落地。其次,客戶強烈的需求會拉動整個市場空間增長,但高準(zhǔn)入門檻又會將一部分公司拒之門外,最后能在市場分蛋糕的是那些實力過硬的玩家。
回顧云知聲11年的創(chuàng)業(yè)歷程,保持技術(shù)的領(lǐng)先性和符合時代的市場戰(zhàn)略都同等重要。“勤勞勇敢”的中國AI公司,面對新技術(shù)和新市場的熱忱,會趟平所有可見的困難。
正如黃偉所信仰的,“所愛隔山海,山海皆可平”。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。