下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風(fēng)機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預(yù)告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預(yù)售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項健康功能,包括心率監(jiān)測和溫度感應(yīng)一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務(wù)實現(xiàn)盈利,退市裁員重組后終于賺錢
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    跨越山海的云知聲,迎來了自己的GPT時刻

    2023年05月29日 11:34:50   來源:光錐智能

      文|光錐智能,作者|郝鑫,編輯|王一粟

      “世界上最高的山是什么山?”

      云知聲創(chuàng)始人兼CEO黃偉仍清楚地記得,十年前他用語音提出的第一個問題。答案播放出來的那一刻,黃偉第一次體會到創(chuàng)業(yè)的成就感。

      今年2月底,山海大模型雛形初現(xiàn),用同樣的問題測試,黃偉一瞬間感覺好像穿越回了十年前,那座“最高的山”正在招手呼喚他。

      “去年12月第一次看到ChatGPT,正是我創(chuàng)業(yè)十年最灰暗的時刻。而現(xiàn)在站在發(fā)布會舞臺上,剩下的只有緊張、興奮和自豪。”黃偉慶幸,自己再次搭上了AI下個十年的快車。

      5月24日,云知聲正式發(fā)布“山海大模型”,現(xiàn)場實測十大核心能力,具體包括:語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)等7項通用能力,以及插件擴展、領(lǐng)域增強、企業(yè)定制等3項行業(yè)落地能力。

      值得一提的是,除了通用能力的演示,一向重視“工程化”的云知聲也比較明確地提出了落地能力的實現(xiàn)路徑。這讓大模型的落地更加實際,不是空中樓閣。

      而在更重要的行業(yè)應(yīng)用層面,云知聲則仍然堅持此前提出的“U+X戰(zhàn)略”,賦能醫(yī)療、智慧物聯(lián)、銷售、知識管理、教育等千行百業(yè)。

      在云知聲最為重要的落地場景之一——醫(yī)療領(lǐng)域,黃偉透露,山海大模型在臨床執(zhí)業(yè)醫(yī)師醫(yī)學(xué)考試中拿到了511分,滿分600分,考生平均分為365。“在醫(yī)療領(lǐng)域,山海大模型已經(jīng)超越了GPT-4的中文水平。”

      得益于此前在Ttransformer模型方向的發(fā)力,以及從2016年對醫(yī)療領(lǐng)域的深耕,云知聲從去年12月開始組建AGI團隊,“閉門修煉”5個月后,就拿出了一個在通用能力方面與國內(nèi)大公司打平,在行業(yè)大模型超越GPT-4中文水平的成績。

      黃偉并不滿足這樣的成績,給云知聲定下了年內(nèi)的目標(biāo),“年內(nèi)通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個垂直領(lǐng)域能力超越GPT-4。”

      雖然2個月近20個大模型發(fā)布中“有李逵也有李鬼”,但一流AI公司的技術(shù)水平可以靠時間接近GPT-4成為了行業(yè)共識。當(dāng)技術(shù)拉齊后,大模型正在打響一場“行業(yè)”爭奪戰(zhàn)。

      01 把通用能力用起來

      在通用能力上,云知聲山海大模型順利通過了語言理解、推理能力等一系列測試。

      首先,在對中文的理解方面,山海大模型更接近“中國人的體質(zhì)”,可以精準(zhǔn)地理解中文6級水平的繞口令“行的人,干一行行行行,行行都行”中每個“行”的意思,還能給出單獨的解釋。知道八大山人是畫家的名號,孫悟空和齊天大圣是同一個人?梢哉f,山海大模型對中文的理解達(dá)到了百科字典的水平。

      不僅如此,山海大模型還具備邏輯判斷和計算推理能力。例如,可以識破“所有貓都愛吃魚,所以愛吃魚的動物都是貓”這類偽三段論邏輯,以及“小明爸爸姓王,問小明姓什么”這類基本常識問題。

      而在計算能力中,山海大模型可以立即給出雞兔同籠這類簡單問題的答案和解題過程,也能夠根據(jù)指令當(dāng)場編寫代碼。在涉及開根號等復(fù)雜的數(shù)學(xué)運算上,山海模型也沒有拉胯,過程清楚、答案正確。

      總體來看,與國內(nèi)各家大模型相比,山海大模型雖然沒有展現(xiàn)圖文生成等多模態(tài)的能力,但關(guān)鍵的NLP(自然語言處理)表現(xiàn)仍在頭部水平。

      光錐智能盤點了已發(fā)布大模型的公司發(fā)現(xiàn),隨著技術(shù)的不斷更新迭代,各家公司在文本生成、知識問答、語言理解、邏輯推理等各項通用能力上的差距正在變得越來越小,甚至有了同質(zhì)化的趨勢。

      所以,攻克大模型的技術(shù)難關(guān)只是第一步,如何用起來才是接下來的關(guān)鍵。

      ChatGPT驚艷全球后,OpenAI隨即拋出的一顆驚雷,就是宣布向所有ChatGPT Plus用戶開放聯(lián)網(wǎng)功能和70多個第三方插件,插件覆蓋了衣食住行、社交、工作以及學(xué)習(xí)等方方面面。

      面對千行百業(yè),沒有一家公司能夠獨立吃下所有場景。民生證券報告稱:“OpenAI正沿著類蘋果模式的‘終端+平臺+生態(tài)’,邁向高于操作系統(tǒng)的戰(zhàn)略地位。”

      云知聲也有同樣的思考路徑,但不同的是,更希望利用插件,將合作伙伴的能力集成進來。用了計算器插件,山海大模型就實現(xiàn)了復(fù)雜計算的能力;用了搜索引擎插件,就能幫用戶實時查天氣、查球賽結(jié)果。與ChatGPT一樣,給大模型按上了插件就裝上了“外掛”。

      黃偉表示:“大模型的通用能力并不能解決所有問題,還有說胡話的風(fēng)險。特別是在醫(yī)療、汽車、物聯(lián)一些容錯率低的專業(yè)場景中,通用能力就顯得不那么夠用,所以才要引入大量的插件來推動應(yīng)用落地,做大模型的黃金搭檔。”

      云知聲也給AI公司做大生態(tài)提供了借鑒思路,面對很多垂類的行業(yè)場景,AI公司一方面可以自己做一些插件去開放給行業(yè)客戶,集成到產(chǎn)品里。另一方面,也可以讓客戶自己做插件開發(fā),共同深入場景。

      02 成為行業(yè)專家

      通用能力的提升,在行業(yè)場景的實際落地方面,還遠(yuǎn)遠(yuǎn)不夠。這就要求大模型們,不僅成為AI領(lǐng)域的“本科全才”,更要成為特定領(lǐng)域中的“博士生”甚至“博導(dǎo)”。

      即使通用能力強如ChatGPT,在醫(yī)療等特定領(lǐng)域的專業(yè)度也遠(yuǎn)遠(yuǎn)未達(dá)到可用的水平。例如,對一手術(shù)過程的描述,ChatGPT給出了一個完全錯誤的答案?梢哉f,一旦涉及到核心的診療過程,ChatGPT目前只是一個“庸醫(yī)”。

      “如果把GPT-4比作一個不偏科,每門都能考到80分的學(xué)生;我們要做的,則是一個可以在某一兩門學(xué)科,考到95分甚至更高的學(xué)生。”黃偉在采訪中說道。

      而這恰恰是眾多行業(yè)大模型的機會。從實際問題和產(chǎn)業(yè)應(yīng)用出發(fā),沉淀垂直行業(yè)經(jīng)驗,AI公司就能建立自己在特定領(lǐng)域的壁壘。

      從這個角度而言,在AI 1.0時代積累下行業(yè)能力的AI公司,擁有更大的機會。

      2016年,醫(yī)療+AI行業(yè)還猶如一片空白地帶,彼時,AI企業(yè)們還在找尋合適的降落姿勢。

      以語音技術(shù)起家的云知聲,抓住了醫(yī)生病歷記錄效率低下這個痛點,以語音電子病歷錄入打開了醫(yī)療賽道的突破口。

      為了能夠做到精準(zhǔn)識別,云知聲為醫(yī)院做了深度定制服務(wù),根據(jù)不同科室、不同病種整理病歷資料,運算出關(guān)鍵詞句語料,為40多個臨床和醫(yī)技科室提供分場景支持,以適應(yīng)醫(yī)院不同科室實際的使用需求。

      經(jīng)過專業(yè)數(shù)據(jù)優(yōu)化后,云知聲在醫(yī)療領(lǐng)域的優(yōu)勢十分明確,其語音識別準(zhǔn)確率超95%,個別科室的語音識別率超98%。醫(yī)生減負(fù)效果明顯,可以使醫(yī)生的錄入效率提升40%,每天節(jié)省1.5-2個小時時間。

      然而,僅從一個單一效率工具切入并不夠。

      三年磨一劍,2019年,云知聲公布了“醫(yī)療+AI”的戰(zhàn)略,從電子病歷場景出發(fā)構(gòu)建起了醫(yī)療產(chǎn)品體系。除“醫(yī)療語音交互解決方案”外,針對診療過程的診前、診中、診后不同場景,云知聲還推出了導(dǎo)醫(yī)機器人、智能病歷生成系統(tǒng)、智能病歷質(zhì)控系統(tǒng)以及智能院后管理解決方案等產(chǎn)品。

      此外,基于對場景的理解,云知聲在醫(yī)療垂直領(lǐng)域建立起了知識圖譜,圖譜覆蓋了癥狀、體征、疾病、手術(shù),檢查檢驗,藥品等七大類實體,共計132萬個,對應(yīng)醫(yī)學(xué)術(shù)語334萬;包含十大類實體關(guān)系,共計757萬實體關(guān)系。2017年建立至今,該知識圖譜仍在更新迭代中,這成為云知聲核心壁壘之一。

      黃偉介紹知識圖譜在大模型訓(xùn)練中發(fā)揮了重要的作用,“行業(yè)大模型訓(xùn)練有三個主要的數(shù)據(jù)來源,一是云知聲多年沉淀下來的優(yōu)質(zhì)醫(yī)療數(shù)據(jù),預(yù)訓(xùn)練階段可以加強大模型的知識和語言能力;二是在醫(yī)療行業(yè)積累的問題解決數(shù)據(jù),這部分可以拿來做微調(diào);三是知識圖譜,靠它嚴(yán)謹(jǐn)?shù)闹R來校驗數(shù)據(jù)和訓(xùn)練結(jié)果。”

      在高質(zhì)量知識圖譜數(shù)據(jù)之上,實現(xiàn)了數(shù)據(jù)到場景的全鏈條打通,云知聲旗下的醫(yī)療產(chǎn)品從語言電子病歷、語音助手這類效率工具,進化為了病歷文書質(zhì)控、醫(yī)保支付審核一類的決策支持工具。

      在大模型的加持下,云知聲也完成了從AI助手到AI專家,再到AI導(dǎo)師的角色升級。對比從前,所能抵達(dá)的場景更加厚重,能觸及的核心技術(shù)更多,行業(yè)know-how的經(jīng)驗再次更新沉淀下來。

      如果說,云知聲在醫(yī)療行業(yè)的扎深是一家AI公司如何深入到行業(yè)的典型,那么其在物聯(lián)網(wǎng)領(lǐng)域的拓展,則證明了一家AI公司如何能把技術(shù)變成靠標(biāo)準(zhǔn)化的產(chǎn)品,從而打開行業(yè)廣度的生意經(jīng)。

      2015年,云知聲啟動了AI語音芯片項目,并提出“云-端-芯”一體戰(zhàn)略。一方面把在垂直行業(yè)積累的AI技能放在云端,一方面通過芯片去賦能設(shè)備端的邊緣計算能力,進而把云端的算法能力向設(shè)備端進行輸出。

      通過自研芯片的方式將算法集成在芯片模組中,這不僅形成了相對標(biāo)準(zhǔn)化的產(chǎn)品,還讓云知聲實現(xiàn)了產(chǎn)品成本的降低。“標(biāo)準(zhǔn)化+降本”,才能大規(guī)模應(yīng)用到智慧家居、車聯(lián)網(wǎng)等場景。

      同時,云知聲這些年還搭建了厚重的中臺能力。物聯(lián)中臺發(fā)揮集中調(diào)配、匯總信息的功能,實時管理設(shè)備、人員、服務(wù)等各項因素,最終通過語音交互輸出指令反饋。

      而到了大模型時代,面向智慧物聯(lián)場景,會有什么樣的進階呢?

      ChatGPT已經(jīng)讓業(yè)界看到,人人都能擁有一個AI助手即將成為現(xiàn)實。“未來將全線升級智慧物聯(lián)核心產(chǎn)品,與山海大模型深度結(jié)合,塑造出一個真正的隨身管家:從只能進行指令交互升級為類人對話,真正聯(lián)動IoT生態(tài)和服務(wù)。”黃偉在發(fā)布會上表示。

      “與全場景自然語言交互相比,搜索引擎的市場就非常小了。”一位曾在語音等AI領(lǐng)域深耕20年的創(chuàng)始人曾對光錐智能表示,萬物智聯(lián)的自然交互,才是更廣闊的市場。

      “大模型發(fā)布后,無論是汽車、智能家居、酒店等各個潛在客戶,已經(jīng)迫不及待地在跟我們要方案了。”黃偉透露。

      十年間,云知聲AI實現(xiàn)了三級跳,從第一階段的AI三駕馬車、“云端芯”戰(zhàn)略,到第二階段的以超算中心、知識圖譜等構(gòu)成的規(guī);疉I技術(shù)戰(zhàn)略,和開放平臺+智慧物聯(lián)/智慧醫(yī)療的“U+X”市場戰(zhàn)略,每一個階段都緊跟技術(shù)和市場的變化。

      再到如今的AGI時代,云知聲也迎來了自己的GPT時刻。在技術(shù)上,不僅擁抱基礎(chǔ)大模型,也在工程化上利用指令調(diào)優(yōu)+反饋強化,讓大模型不斷迭代提升;另外,也在多知識/多模態(tài),以及跨語言/模態(tài)方面積極布局,為增量需求拓展能力。在市場策略上,依然堅持“U+X”,實現(xiàn)AGI+Industry生態(tài)加速。

      在此次發(fā)布會上,除智慧醫(yī)療、物聯(lián)場景外,云知聲亦在教育、銷售場景、知識管理等場景上儲備下了能力,準(zhǔn)備迎接更多行業(yè)的升級需求。

      03 行業(yè)爭奪戰(zhàn)打響,云知聲如何比拼?

      自3月以來,國內(nèi)已有20多個玩家狂奔入局。從文心大模型到山海大模型,國產(chǎn)大模型之戰(zhàn)迎來中場戰(zhàn)事,從比拼“通用”進階到了比拼“行業(yè)”。

      據(jù)不完全統(tǒng)計,在國內(nèi)發(fā)布的大模型中,行業(yè)大模型占比超過60%,各家AI公司大模型已經(jīng)開始向工業(yè)、金融、醫(yī)療、營銷、智慧物聯(lián)等多個領(lǐng)域滲透。比如,百度在發(fā)布文心一言后,在全國各地陸續(xù)舉辦了多場行業(yè)大模型的推介會,涉及工業(yè)、能源、媒體、金融等領(lǐng)域;而阿里云雖然沒有發(fā)布單獨的行業(yè)大模型,但也強調(diào)維度更垂類的企業(yè)大模型。“未來每一個企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識和應(yīng)用場景,訓(xùn)練自己的企業(yè)大模型。”

      相比巨頭在技術(shù)上拼參數(shù),在市場上拼生態(tài),云知聲這樣的小巨頭,也有自己從本質(zhì)出發(fā)的思考。

      “ChatGPT將人工智能研究的核心帶回到語言本身,而語言其實是人類智能的一個核心載體。”云知聲董事長梁家恩認(rèn)為,這是一個從專用AI轉(zhuǎn)向通用AI(AGI)的突破口。”

      但轉(zhuǎn)向通用AI,并不能盲目的擴大訓(xùn)練參數(shù)。這是因為,雖然在優(yōu)質(zhì)數(shù)據(jù)規(guī)模足夠大情況下,模型越大效果越好,但訓(xùn)練成本也越高。

      基于AI 1.0時代在專用AI方面的積累,云知聲計劃先將模型做到六七百億參數(shù),做出涌現(xiàn)效果,然后以這個參數(shù)規(guī)模,提升優(yōu)質(zhì)數(shù)據(jù)規(guī)模和大模型效果,再做千億以上參數(shù)來提高大模型性能。

      云知聲堅信,通往AGI的路不只有一條。

      “除了用大力出奇跡去做大模型,也可以用更高質(zhì)量的‘數(shù)據(jù)+規(guī)模’當(dāng)適當(dāng)?shù)臄?shù)據(jù)參數(shù),做行業(yè)‘中模型’。”黃偉表示,云知聲目前正在兩條腿一起走路。今年Q3云知聲會發(fā)布對標(biāo)GPT-3.5的“山海2.0”,數(shù)據(jù)參數(shù)也將達(dá)到千億級。而在Q3,云知聲的“中模型”也即將發(fā)布。

      既然要做中模型,在行業(yè)爭奪戰(zhàn)中,又回到了上個階段中對行業(yè)深耕的過程。

      縱觀整個中國市場的行業(yè)大模型玩家,首先基于1.0階段積累的行業(yè)經(jīng)驗不同,各家深扎的場景也不同,F(xiàn)階段,想要橫跨多個行業(yè)不太現(xiàn)實,無論是頭部大廠還是中小公司都可以有自己的壁壘。

      其次,即使是進入同一行業(yè),每家公司瞄準(zhǔn)的方向也不同,細(xì)分領(lǐng)域競爭更具多樣化。如同樣在醫(yī)療領(lǐng)域,云知聲將語義識別的優(yōu)勢運用在了門診病歷撰寫、手術(shù)報告生成上,而商湯則將重點放在了線上問診、咨詢上。

      而在真正的行業(yè)應(yīng)用落地時,還要考慮實際成本。

      在AI 1.0階段,被調(diào)侃“有多少人工就有多少智能”的數(shù)據(jù)標(biāo)注情況,將被自動化標(biāo)注逐步替代。相對于GPT訓(xùn)練中需要的45T數(shù)據(jù),以前的AI訓(xùn)練數(shù)據(jù)量如同九牛一毛。在數(shù)據(jù)量較小的情況下,還能做到分離標(biāo)注,而現(xiàn)在數(shù)據(jù)訓(xùn)練過程完全自動化,根本無法標(biāo)注。于是,需要通過人類生成反饋的技術(shù),替代傳統(tǒng)數(shù)據(jù)標(biāo)注。

      另外,則是數(shù)據(jù)訓(xùn)練成本。云知聲認(rèn)為,大模型訓(xùn)練成功后,以目前的算力成本,可能需要把大模型參數(shù)量通過蒸餾技術(shù)壓縮10倍才能滿足實時性和規(guī);瘧(yīng)用要求,這要視具體應(yīng)用場景而定。云知聲在做BERT模型時,就通過模型蒸餾提速近百倍,而實際性能損失很小。“就像打擊索馬里海盜,不能每次都開著航母過去。”梁家恩稱。

      04 技術(shù)撬動行業(yè)價值

      縱觀國產(chǎn)大模型,目前整個行業(yè)依然在非常早期,即使如馬斯克所言,中美技術(shù)的差距有12個月,但放眼到未來20年的長期競爭中,這開頭的100米或許并沒有那么重要。

      回顧1.0階段,AI公司花費了6年的時間實現(xiàn)了價值跨越。

      科大訊飛營收從2017年的54.45億,一躍增長至2022年的188.20億,對應(yīng)28.15%的復(fù)合增速;商湯的營收從2018年的18.5億,增長至2022年的38.09億,收入也實現(xiàn)了翻倍。

      上個階段,AI技術(shù)實現(xiàn)了舊業(yè)務(wù)的提效、新業(yè)務(wù)的增長,最終達(dá)成AI公司營收、市值的雙增。進入2.0時代,這個邏輯依然成立,只不過2.0階段可能釋放的價值會更大,用的時間也會更短。

      黃偉判斷,在新時代有兩件事目前是已經(jīng)確定的。首先,AI公司具備了更強的技術(shù)能力后,就能更好地滿足客戶需求,繼而也能更容易地推動商業(yè)化落地。其次,客戶強烈的需求會拉動整個市場空間增長,但高準(zhǔn)入門檻又會將一部分公司拒之門外,最后能在市場分蛋糕的是那些實力過硬的玩家。

      回顧云知聲11年的創(chuàng)業(yè)歷程,保持技術(shù)的領(lǐng)先性和符合時代的市場戰(zhàn)略都同等重要。“勤勞勇敢”的中國AI公司,面對新技術(shù)和新市場的熱忱,會趟平所有可見的困難。

      正如黃偉所信仰的,“所愛隔山海,山海皆可平”。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。