趕“ChatGPT”潮的云知聲

2023年06月02日 15:54:56 田小夢(mèng) 來源：DoNews

　　撰文 | 田小夢(mèng)

　　編輯 | 李信馬

　　“去年12月份，我第一次看到ChatGPT的時(shí)候，是我創(chuàng)業(yè)十年中最灰暗、最沮喪的時(shí)候。ChatGPT所表現(xiàn)出的幾乎百分之百準(zhǔn)確的理解能力，以及前所未見的‘生存’能力，這讓我們這些理工男能夠安身立命的技能，好像瞬間沒有了價(jià)值。”黃偉惆悵道。

　　面對(duì)ChatGPT的橫空出世，發(fā)布僅5天注冊(cè)用戶就超100萬的沖擊，黃偉有差不多一周的時(shí)間里處于焦慮的狀態(tài)。但這種焦慮，也讓他有了解和鉆研ChatGPT的沖動(dòng)。通過網(wǎng)上的文章、論文等，以及與技術(shù)負(fù)責(zé)人交流后，在他看來，ChatGPT好像也沒什么，它就像是一個(gè)做的更大的Transformer。

　　從挫折、沮喪，再到發(fā)現(xiàn)——“好像我們也可以”。正是抱著這樣的期待，云知聲在去年12月中下旬快速組建了團(tuán)隊(duì)，投身于大模型的研發(fā)過程中。今年2月底就研發(fā)出第一版“山海”大模型。黃偉感慨稱：“看到一版的時(shí)候，我整個(gè)的感覺和我在十年前創(chuàng)業(yè)的第一刻是一樣的。”

　　但伴隨互聯(lián)網(wǎng)巨頭的加入，雖然為科技公司指出了發(fā)展的新路徑、新機(jī)遇，但對(duì)于創(chuàng)業(yè)公司來說，這條路并不輕松。

　　在黃偉看來，人工智能正從1.0進(jìn)入到2.0時(shí)代，但目前只是在2.0的起點(diǎn)位置。1.0時(shí)代，人工智能更多的是一種鑒別能力，即利用已有的數(shù)據(jù)來訓(xùn)練模型，讓模型做出Yes or No的判斷，但無法告知原因。而2.0時(shí)代，在大模型引領(lǐng)的AI 2.0時(shí)代，為人工智能帶來了新的能力，可以打造更多新的產(chǎn)品，滿足客戶更多的需求，例如醫(yī)療、營(yíng)銷、溝通等，能夠創(chuàng)造更多的商業(yè)機(jī)會(huì)。

　　同時(shí)，從數(shù)據(jù)來看，今天的數(shù)據(jù)還沒充分發(fā)揮它應(yīng)有的價(jià)值，而通過大模型的深度學(xué)習(xí)可以充分利用和使用數(shù)據(jù)價(jià)值。黃偉認(rèn)為，大模型會(huì)成為人工智能2.0時(shí)代的“發(fā)電廠”。“誰擁有發(fā)電廠，誰就具有最大的商業(yè)價(jià)值。”

　　在業(yè)界都將目光鎖定在大模型身上，并認(rèn)為大模型是未來十年20年最大的機(jī)會(huì)之一時(shí)，云知聲自然也不會(huì)放棄。再者，云知聲在過去十年里，積累了大量算法、數(shù)據(jù)、工程落地經(jīng)驗(yàn)，仿佛都是為“山海”而生。

　　天時(shí)地利加人和，這不正是云知聲在去年12月份毅然決然投身大模型的底氣。

　　如今，“山海”大模型完成多輪優(yōu)化升級(jí)，擁有超過十項(xiàng)技術(shù)能力。在通用能力上，包含語(yǔ)言生成、語(yǔ)言理解、知識(shí)問答、推理能力、數(shù)學(xué)能力、代碼能力，以及與人類對(duì)齊的安全合規(guī)能力;在落地能力上，提供插件擴(kuò)展、領(lǐng)域增強(qiáng)，以及企業(yè)定制能力。

　　01.

　　年內(nèi)通用能力比肩ChatGPT

　　“目標(biāo)年內(nèi)通用能力比肩ChatGPT，并在醫(yī)療、物聯(lián)、教育等多個(gè)垂直領(lǐng)域能力超越GPT4。”黃偉在發(fā)布會(huì)線上揚(yáng)言稱。這也透露出，云知聲不是簡(jiǎn)單的將目光鎖定在通用能力上，更看側(cè)重TO B的落地場(chǎng)景中。

　　當(dāng)然這步棋子的布局，離不開黃偉的經(jīng)驗(yàn)。他從學(xué)術(shù)界到工業(yè)界，再到創(chuàng)業(yè)，完整的做過產(chǎn)品，深知人工智能只是一種能力，不能僅做酷炫的外表，而是要做完整的閉環(huán)。

　　其實(shí)，從云知聲的發(fā)展也可以窺見一二。

　　2012年成立時(shí)，云知聲就開始做自然語(yǔ)言理解，投入在整個(gè)對(duì)話AI的全棧能力研究中，形成數(shù)據(jù)、算力和算法完整的能力鏈條。2016年，當(dāng)DeepMind AIphaGo 4:1 擊敗李世石時(shí),云知聲敏銳的意識(shí)到，人工智能的本質(zhì)是認(rèn)知智能，自然語(yǔ)言理解才是人工智能皇冠上的明珠，并在2016年年初開始布局超算——Atlas，并躬身入局物聯(lián)網(wǎng)、醫(yī)療等領(lǐng)域，收獲了真實(shí)的行業(yè)場(chǎng)景和數(shù)據(jù)�；诖耍�2022年云知聲緊抓機(jī)遇，開啟“山海”大模型研發(fā)，實(shí)現(xiàn)云知聲的AI三級(jí)跳。

　　在這新一輪的人工智能比拼中，為了提高大模型在具體場(chǎng)景的應(yīng)用落地水平，云知聲沿襲了一以貫之的U+X戰(zhàn)略，即以 U(AI技術(shù)和產(chǎn)品能力)，深度結(jié)合 X(行業(yè)應(yīng)用場(chǎng)景)，解決行業(yè)深層問題。

　　黃偉介紹稱，山海大模型技術(shù)架構(gòu)就是通用大模型，并針對(duì)知識(shí)密度高的領(lǐng)域，通過數(shù)據(jù)訓(xùn)練、訓(xùn)練數(shù)據(jù)、微調(diào)等方式，做一些專業(yè)的加強(qiáng)，這樣模型既具備了通用應(yīng)用水平，也針對(duì)特殊場(chǎng)景與領(lǐng)域進(jìn)行了能力的加強(qiáng)。

　　如在醫(yī)療領(lǐng)域，以前醫(yī)療行業(yè)利用AI的方式去錄入病例，但是醫(yī)生依然需要逐字錄入信息，如今借助山海大模型，只需要隨著醫(yī)患問答的過程中，就能夠提取關(guān)鍵信息生成病例，提高了醫(yī)療的效率，同時(shí)，云知聲在為醫(yī)療服務(wù)中積累的千萬級(jí)的標(biāo)準(zhǔn)的醫(yī)療數(shù)據(jù)，并背靠國(guó)內(nèi)最大的醫(yī)療知識(shí)數(shù)據(jù)圖譜，使得山海大模型在MedQA評(píng)測(cè)能力中可超越GPT-4。

　　云知聲科技董事長(zhǎng)兼CTO梁家恩表示，就目前而言，大模型仍然是有限的東西，對(duì)于沒有見過的東西，大模型會(huì)生成“似是而非”的回答，隨著AI生成能力的不斷增強(qiáng)，校驗(yàn)會(huì)更加困難，這也讓AI行業(yè)需要不斷去探索新的解決方法。

　　隨著AGI時(shí)代的到來，云知聲也迎來了自己的GPT時(shí)刻。“如果把通用大模型看作每科都能考到80分的學(xué)生，我們要做就是在某一兩門學(xué)科上，考到95分甚至更高。”黃偉如是說。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信