跨越山海的云知聲，迎來了自己的GPT時刻

2023年05月29日 11:34:50 作者|郝鑫，編輯|王一粟 來源：光錐智能

　　文|光錐智能，作者|郝鑫，編輯|王一粟

　　“世界上最高的山是什么山?”

　　云知聲創(chuàng)始人兼CEO黃偉仍清楚地記得，十年前他用語音提出的第一個問題。答案播放出來的那一刻，黃偉第一次體會到創(chuàng)業(yè)的成就感。

　　今年2月底，山海大模型雛形初現(xiàn)，用同樣的問題測試，黃偉一瞬間感覺好像穿越回了十年前，那座“最高的山”正在招手呼喚他。

　　“去年12月第一次看到ChatGPT，正是我創(chuàng)業(yè)十年最灰暗的時刻。而現(xiàn)在站在發(fā)布會舞臺上，剩下的只有緊張、興奮和自豪。”黃偉慶幸，自己再次搭上了AI下個十年的快車。

　　5月24日，云知聲正式發(fā)布“山海大模型”，現(xiàn)場實測十大核心能力，具體包括：語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)等7項通用能力，以及插件擴展、領(lǐng)域增強、企業(yè)定制等3項行業(yè)落地能力。

　　值得一提的是，除了通用能力的演示，一向重視“工程化”的云知聲也比較明確地提出了落地能力的實現(xiàn)路徑。這讓大模型的落地更加實際，不是空中樓閣。

　　而在更重要的行業(yè)應(yīng)用層面，云知聲則仍然堅持此前提出的“U+X戰(zhàn)略”，賦能醫(yī)療、智慧物聯(lián)、銷售、知識管理、教育等千行百業(yè)。

　　在云知聲最為重要的落地場景之一——醫(yī)療領(lǐng)域，黃偉透露，山海大模型在臨床執(zhí)業(yè)醫(yī)師醫(yī)學(xué)考試中拿到了511分，滿分600分，考生平均分為365。“在醫(yī)療領(lǐng)域，山海大模型已經(jīng)超越了GPT-4的中文水平。”

　　得益于此前在Ttransformer模型方向的發(fā)力，以及從2016年對醫(yī)療領(lǐng)域的深耕，云知聲從去年12月開始組建AGI團隊，“閉門修煉”5個月后，就拿出了一個在通用能力方面與國內(nèi)大公司打平，在行業(yè)大模型超越GPT-4中文水平的成績。

　　黃偉并不滿足這樣的成績，給云知聲定下了年內(nèi)的目標(biāo)，“年內(nèi)通用能力比肩ChatGPT，并在醫(yī)療、物聯(lián)、教育等多個垂直領(lǐng)域能力超越GPT-4。”

　　雖然2個月近20個大模型發(fā)布中“有李逵也有李鬼”，但一流AI公司的技術(shù)水平可以靠時間接近GPT-4成為了行業(yè)共識。當(dāng)技術(shù)拉齊后，大模型正在打響一場“行業(yè)”爭奪戰(zhàn)。

　　01 把通用能力用起來

　　在通用能力上，云知聲山海大模型順利通過了語言理解、推理能力等一系列測試。

　　首先，在對中文的理解方面，山海大模型更接近“中國人的體質(zhì)”，可以精準(zhǔn)地理解中文6級水平的繞口令“行的人，干一行行行行，行行都行”中每個“行”的意思，還能給出單獨的解釋。知道八大山人是畫家的名號，孫悟空和齊天大圣是同一個人�？梢哉f，山海大模型對中文的理解達(dá)到了百科字典的水平。

　　不僅如此，山海大模型還具備邏輯判斷和計算推理能力。例如，可以識破“所有貓都愛吃魚，所以愛吃魚的動物都是貓”這類偽三段論邏輯，以及“小明爸爸姓王，問小明姓什么”這類基本常識問題。

　　而在計算能力中，山海大模型可以立即給出雞兔同籠這類簡單問題的答案和解題過程，也能夠根據(jù)指令當(dāng)場編寫代碼。在涉及開根號等復(fù)雜的數(shù)學(xué)運算上，山海模型也沒有拉胯，過程清楚、答案正確。

　　總體來看，與國內(nèi)各家大模型相比，山海大模型雖然沒有展現(xiàn)圖文生成等多模態(tài)的能力，但關(guān)鍵的NLP(自然語言處理)表現(xiàn)仍在頭部水平。

　　光錐智能盤點了已發(fā)布大模型的公司發(fā)現(xiàn)，隨著技術(shù)的不斷更新迭代，各家公司在文本生成、知識問答、語言理解、邏輯推理等各項通用能力上的差距正在變得越來越小，甚至有了同質(zhì)化的趨勢。

　　所以，攻克大模型的技術(shù)難關(guān)只是第一步，如何用起來才是接下來的關(guān)鍵。

　　ChatGPT驚艷全球后，OpenAI隨即拋出的一顆驚雷，就是宣布向所有ChatGPT Plus用戶開放聯(lián)網(wǎng)功能和70多個第三方插件，插件覆蓋了衣食住行、社交、工作以及學(xué)習(xí)等方方面面。

　　面對千行百業(yè)，沒有一家公司能夠獨立吃下所有場景。民生證券報告稱：“OpenAI正沿著類蘋果模式的‘終端+平臺+生態(tài)’，邁向高于操作系統(tǒng)的戰(zhàn)略地位。”

　　云知聲也有同樣的思考路徑，但不同的是，更希望利用插件，將合作伙伴的能力集成進來。用了計算器插件，山海大模型就實現(xiàn)了復(fù)雜計算的能力;用了搜索引擎插件，就能幫用戶實時查天氣、查球賽結(jié)果。與ChatGPT一樣，給大模型按上了插件就裝上了“外掛”。

　　黃偉表示：“大模型的通用能力并不能解決所有問題，還有說胡話的風(fēng)險。特別是在醫(yī)療、汽車、物聯(lián)一些容錯率低的專業(yè)場景中，通用能力就顯得不那么夠用，所以才要引入大量的插件來推動應(yīng)用落地，做大模型的黃金搭檔。”

　　云知聲也給AI公司做大生態(tài)提供了借鑒思路，面對很多垂類的行業(yè)場景，AI公司一方面可以自己做一些插件去開放給行業(yè)客戶，集成到產(chǎn)品里。另一方面，也可以讓客戶自己做插件開發(fā)，共同深入場景。

　　02 成為行業(yè)專家

　　通用能力的提升，在行業(yè)場景的實際落地方面，還遠(yuǎn)遠(yuǎn)不夠。這就要求大模型們，不僅成為AI領(lǐng)域的“本科全才”，更要成為特定領(lǐng)域中的“博士生”甚至“博導(dǎo)”。

　　即使通用能力強如ChatGPT，在醫(yī)療等特定領(lǐng)域的專業(yè)度也遠(yuǎn)遠(yuǎn)未達(dá)到可用的水平。例如，對一手術(shù)過程的描述，ChatGPT給出了一個完全錯誤的答案�？梢哉f，一旦涉及到核心的診療過程，ChatGPT目前只是一個“庸醫(yī)”。

　　“如果把GPT-4比作一個不偏科，每門都能考到80分的學(xué)生;我們要做的，則是一個可以在某一兩門學(xué)科，考到95分甚至更高的學(xué)生。”黃偉在采訪中說道。

　　而這恰恰是眾多行業(yè)大模型的機會。從實際問題和產(chǎn)業(yè)應(yīng)用出發(fā)，沉淀垂直行業(yè)經(jīng)驗，AI公司就能建立自己在特定領(lǐng)域的壁壘。

　　從這個角度而言，在AI 1.0時代積累下行業(yè)能力的AI公司，擁有更大的機會。

　　2016年，醫(yī)療+AI行業(yè)還猶如一片空白地帶，彼時，AI企業(yè)們還在找尋合適的降落姿勢。

　　以語音技術(shù)起家的云知聲，抓住了醫(yī)生病歷記錄效率低下這個痛點，以語音電子病歷錄入打開了醫(yī)療賽道的突破口。

　　為了能夠做到精準(zhǔn)識別，云知聲為醫(yī)院做了深度定制服務(wù)，根據(jù)不同科室、不同病種整理病歷資料，運算出關(guān)鍵詞句語料，為40多個臨床和醫(yī)技科室提供分場景支持，以適應(yīng)醫(yī)院不同科室實際的使用需求。

　　經(jīng)過專業(yè)數(shù)據(jù)優(yōu)化后，云知聲在醫(yī)療領(lǐng)域的優(yōu)勢十分明確，其語音識別準(zhǔn)確率超95%，個別科室的語音識別率超98%。醫(yī)生減負(fù)效果明顯，可以使醫(yī)生的錄入效率提升40%，每天節(jié)省1.5-2個小時時間。

　　然而，僅從一個單一效率工具切入并不夠。

　　三年磨一劍，2019年，云知聲公布了“醫(yī)療+AI”的戰(zhàn)略，從電子病歷場景出發(fā)構(gòu)建起了醫(yī)療產(chǎn)品體系。除“醫(yī)療語音交互解決方案”外，針對診療過程的診前、診中、診后不同場景，云知聲還推出了導(dǎo)醫(yī)機器人、智能病歷生成系統(tǒng)、智能病歷質(zhì)控系統(tǒng)以及智能院后管理解決方案等產(chǎn)品。

　　此外，基于對場景的理解，云知聲在醫(yī)療垂直領(lǐng)域建立起了知識圖譜，圖譜覆蓋了癥狀、體征、疾病、手術(shù)，檢查檢驗，藥品等七大類實體，共計132萬個，對應(yīng)醫(yī)學(xué)術(shù)語334萬;包含十大類實體關(guān)系，共計757萬實體關(guān)系。2017年建立至今，該知識圖譜仍在更新迭代中，這成為云知聲核心壁壘之一。

　　黃偉介紹知識圖譜在大模型訓(xùn)練中發(fā)揮了重要的作用，“行業(yè)大模型訓(xùn)練有三個主要的數(shù)據(jù)來源，一是云知聲多年沉淀下來的優(yōu)質(zhì)醫(yī)療數(shù)據(jù)，預(yù)訓(xùn)練階段可以加強大模型的知識和語言能力;二是在醫(yī)療行業(yè)積累的問題解決數(shù)據(jù)，這部分可以拿來做微調(diào);三是知識圖譜，靠它嚴(yán)謹(jǐn)?shù)闹R來校驗數(shù)據(jù)和訓(xùn)練結(jié)果。”

　　在高質(zhì)量知識圖譜數(shù)據(jù)之上，實現(xiàn)了數(shù)據(jù)到場景的全鏈條打通，云知聲旗下的醫(yī)療產(chǎn)品從語言電子病歷、語音助手這類效率工具，進化為了病歷文書質(zhì)控、醫(yī)保支付審核一類的決策支持工具。

　　在大模型的加持下，云知聲也完成了從AI助手到AI專家，再到AI導(dǎo)師的角色升級。對比從前，所能抵達(dá)的場景更加厚重，能觸及的核心技術(shù)更多，行業(yè)know-how的經(jīng)驗再次更新沉淀下來。

　　如果說，云知聲在醫(yī)療行業(yè)的扎深是一家AI公司如何深入到行業(yè)的典型，那么其在物聯(lián)網(wǎng)領(lǐng)域的拓展，則證明了一家AI公司如何能把技術(shù)變成靠標(biāo)準(zhǔn)化的產(chǎn)品，從而打開行業(yè)廣度的生意經(jīng)。

　　2015年，云知聲啟動了AI語音芯片項目，并提出“云-端-芯”一體戰(zhàn)略。一方面把在垂直行業(yè)積累的AI技能放在云端，一方面通過芯片去賦能設(shè)備端的邊緣計算能力，進而把云端的算法能力向設(shè)備端進行輸出。

　　通過自研芯片的方式將算法集成在芯片模組中，這不僅形成了相對標(biāo)準(zhǔn)化的產(chǎn)品，還讓云知聲實現(xiàn)了產(chǎn)品成本的降低。“標(biāo)準(zhǔn)化+降本”，才能大規(guī)模應(yīng)用到智慧家居、車聯(lián)網(wǎng)等場景。

　　同時，云知聲這些年還搭建了厚重的中臺能力。物聯(lián)中臺發(fā)揮集中調(diào)配、匯總信息的功能，實時管理設(shè)備、人員、服務(wù)等各項因素，最終通過語音交互輸出指令反饋。

　　而到了大模型時代，面向智慧物聯(lián)場景，會有什么樣的進階呢?

　　ChatGPT已經(jīng)讓業(yè)界看到，人人都能擁有一個AI助手即將成為現(xiàn)實。“未來將全線升級智慧物聯(lián)核心產(chǎn)品，與山海大模型深度結(jié)合，塑造出一個真正的隨身管家：從只能進行指令交互升級為類人對話，真正聯(lián)動IoT生態(tài)和服務(wù)。”黃偉在發(fā)布會上表示。

　　“與全場景自然語言交互相比，搜索引擎的市場就非常小了。”一位曾在語音等AI領(lǐng)域深耕20年的創(chuàng)始人曾對光錐智能表示，萬物智聯(lián)的自然交互，才是更廣闊的市場。

　　“大模型發(fā)布后，無論是汽車、智能家居、酒店等各個潛在客戶，已經(jīng)迫不及待地在跟我們要方案了。”黃偉透露。

　　十年間，云知聲AI實現(xiàn)了三級跳，從第一階段的AI三駕馬車、“云端芯”戰(zhàn)略，到第二階段的以超算中心、知識圖譜等構(gòu)成的規(guī)�；疉I技術(shù)戰(zhàn)略，和開放平臺+智慧物聯(lián)/智慧醫(yī)療的“U+X”市場戰(zhàn)略，每一個階段都緊跟技術(shù)和市場的變化。

　　再到如今的AGI時代，云知聲也迎來了自己的GPT時刻。在技術(shù)上，不僅擁抱基礎(chǔ)大模型，也在工程化上利用指令調(diào)優(yōu)+反饋強化，讓大模型不斷迭代提升;另外，也在多知識/多模態(tài)，以及跨語言/模態(tài)方面積極布局，為增量需求拓展能力。在市場策略上，依然堅持“U+X”，實現(xiàn)AGI+Industry生態(tài)加速。

　　在此次發(fā)布會上，除智慧醫(yī)療、物聯(lián)場景外，云知聲亦在教育、銷售場景、知識管理等場景上儲備下了能力，準(zhǔn)備迎接更多行業(yè)的升級需求。

　　03 行業(yè)爭奪戰(zhàn)打響，云知聲如何比拼?

　　自3月以來，國內(nèi)已有20多個玩家狂奔入局。從文心大模型到山海大模型，國產(chǎn)大模型之戰(zhàn)迎來中場戰(zhàn)事，從比拼“通用”進階到了比拼“行業(yè)”。

　　據(jù)不完全統(tǒng)計，在國內(nèi)發(fā)布的大模型中，行業(yè)大模型占比超過60%，各家AI公司大模型已經(jīng)開始向工業(yè)、金融、醫(yī)療、營銷、智慧物聯(lián)等多個領(lǐng)域滲透。比如，百度在發(fā)布文心一言后，在全國各地陸續(xù)舉辦了多場行業(yè)大模型的推介會，涉及工業(yè)、能源、媒體、金融等領(lǐng)域;而阿里云雖然沒有發(fā)布單獨的行業(yè)大模型，但也強調(diào)維度更垂類的企業(yè)大模型。“未來每一個企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力，也可以結(jié)合企業(yè)自己的行業(yè)知識和應(yīng)用場景，訓(xùn)練自己的企業(yè)大模型。”

　　相比巨頭在技術(shù)上拼參數(shù)，在市場上拼生態(tài)，云知聲這樣的小巨頭，也有自己從本質(zhì)出發(fā)的思考。

　　“ChatGPT將人工智能研究的核心帶回到語言本身，而語言其實是人類智能的一個核心載體。”云知聲董事長梁家恩認(rèn)為，這是一個從專用AI轉(zhuǎn)向通用AI(AGI)的突破口。”

　　但轉(zhuǎn)向通用AI，并不能盲目的擴大訓(xùn)練參數(shù)。這是因為，雖然在優(yōu)質(zhì)數(shù)據(jù)規(guī)模足夠大情況下，模型越大效果越好，但訓(xùn)練成本也越高。

　　基于AI 1.0時代在專用AI方面的積累，云知聲計劃先將模型做到六七百億參數(shù)，做出涌現(xiàn)效果，然后以這個參數(shù)規(guī)模，提升優(yōu)質(zhì)數(shù)據(jù)規(guī)模和大模型效果，再做千億以上參數(shù)來提高大模型性能。

　　云知聲堅信，通往AGI的路不只有一條。

　　“除了用大力出奇跡去做大模型，也可以用更高質(zhì)量的‘數(shù)據(jù)+規(guī)模’當(dāng)適當(dāng)?shù)臄?shù)據(jù)參數(shù)，做行業(yè)‘中模型’。”黃偉表示，云知聲目前正在兩條腿一起走路。今年Q3云知聲會發(fā)布對標(biāo)GPT-3.5的“山海2.0”，數(shù)據(jù)參數(shù)也將達(dá)到千億級。而在Q3，云知聲的“中模型”也即將發(fā)布。

　　既然要做中模型，在行業(yè)爭奪戰(zhàn)中，又回到了上個階段中對行業(yè)深耕的過程。

　　縱觀整個中國市場的行業(yè)大模型玩家，首先基于1.0階段積累的行業(yè)經(jīng)驗不同，各家深扎的場景也不同�，F(xiàn)階段，想要橫跨多個行業(yè)不太現(xiàn)實，無論是頭部大廠還是中小公司都可以有自己的壁壘。

　　其次，即使是進入同一行業(yè)，每家公司瞄準(zhǔn)的方向也不同，細(xì)分領(lǐng)域競爭更具多樣化。如同樣在醫(yī)療領(lǐng)域，云知聲將語義識別的優(yōu)勢運用在了門診病歷撰寫、手術(shù)報告生成上，而商湯則將重點放在了線上問診、咨詢上。

　　而在真正的行業(yè)應(yīng)用落地時，還要考慮實際成本。

　　在AI 1.0階段，被調(diào)侃“有多少人工就有多少智能”的數(shù)據(jù)標(biāo)注情況，將被自動化標(biāo)注逐步替代。相對于GPT訓(xùn)練中需要的45T數(shù)據(jù)，以前的AI訓(xùn)練數(shù)據(jù)量如同九牛一毛。在數(shù)據(jù)量較小的情況下，還能做到分離標(biāo)注，而現(xiàn)在數(shù)據(jù)訓(xùn)練過程完全自動化，根本無法標(biāo)注。于是，需要通過人類生成反饋的技術(shù)，替代傳統(tǒng)數(shù)據(jù)標(biāo)注。

　　另外，則是數(shù)據(jù)訓(xùn)練成本。云知聲認(rèn)為，大模型訓(xùn)練成功后，以目前的算力成本，可能需要把大模型參數(shù)量通過蒸餾技術(shù)壓縮10倍才能滿足實時性和規(guī)�；瘧�(yīng)用要求，這要視具體應(yīng)用場景而定。云知聲在做BERT模型時，就通過模型蒸餾提速近百倍，而實際性能損失很小。“就像打擊索馬里海盜，不能每次都開著航母過去。”梁家恩稱。

　　04 技術(shù)撬動行業(yè)價值

　　縱觀國產(chǎn)大模型，目前整個行業(yè)依然在非常早期，即使如馬斯克所言，中美技術(shù)的差距有12個月，但放眼到未來20年的長期競爭中，這開頭的100米或許并沒有那么重要。

　　回顧1.0階段，AI公司花費了6年的時間實現(xiàn)了價值跨越。

　　科大訊飛營收從2017年的54.45億，一躍增長至2022年的188.20億，對應(yīng)28.15%的復(fù)合增速;商湯的營收從2018年的18.5億，增長至2022年的38.09億，收入也實現(xiàn)了翻倍。

　　上個階段，AI技術(shù)實現(xiàn)了舊業(yè)務(wù)的提效、新業(yè)務(wù)的增長，最終達(dá)成AI公司營收、市值的雙增。進入2.0時代，這個邏輯依然成立，只不過2.0階段可能釋放的價值會更大，用的時間也會更短。

　　黃偉判斷，在新時代有兩件事目前是已經(jīng)確定的。首先，AI公司具備了更強的技術(shù)能力后，就能更好地滿足客戶需求，繼而也能更容易地推動商業(yè)化落地。其次，客戶強烈的需求會拉動整個市場空間增長，但高準(zhǔn)入門檻又會將一部分公司拒之門外，最后能在市場分蛋糕的是那些實力過硬的玩家。

　　回顧云知聲11年的創(chuàng)業(yè)歷程，保持技術(shù)的領(lǐng)先性和符合時代的市場戰(zhàn)略都同等重要。“勤勞勇敢”的中國AI公司，面對新技術(shù)和新市場的熱忱，會趟平所有可見的困難。

　　正如黃偉所信仰的，“所愛隔山海，山海皆可平”。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信