撰文 | 田小夢(mèng)
編輯 | 李信馬
“去年12月份,我第一次看到ChatGPT的時(shí)候,是我創(chuàng)業(yè)十年中最灰暗、最沮喪的時(shí)候。ChatGPT所表現(xiàn)出的幾乎百分之百準(zhǔn)確的理解能力,以及前所未見的‘生存’能力,這讓我們這些理工男能夠安身立命的技能,好像瞬間沒有了價(jià)值。”黃偉惆悵道。
面對(duì)ChatGPT的橫空出世,發(fā)布僅5天注冊(cè)用戶就超100萬的沖擊,黃偉有差不多一周的時(shí)間里處于焦慮的狀態(tài)。但這種焦慮,也讓他有了解和鉆研ChatGPT的沖動(dòng)。通過網(wǎng)上的文章、論文等,以及與技術(shù)負(fù)責(zé)人交流后,在他看來,ChatGPT好像也沒什么,它就像是一個(gè)做的更大的Transformer。
從挫折、沮喪,再到發(fā)現(xiàn)——“好像我們也可以”。正是抱著這樣的期待,云知聲在去年12月中下旬快速組建了團(tuán)隊(duì),投身于大模型的研發(fā)過程中。今年2月底就研發(fā)出第一版“山海”大模型。黃偉感慨稱:“看到一版的時(shí)候,我整個(gè)的感覺和我在十年前創(chuàng)業(yè)的第一刻是一樣的。”
但伴隨互聯(lián)網(wǎng)巨頭的加入,雖然為科技公司指出了發(fā)展的新路徑、新機(jī)遇,但對(duì)于創(chuàng)業(yè)公司來說,這條路并不輕松。
在黃偉看來,人工智能正從1.0進(jìn)入到2.0時(shí)代,但目前只是在2.0的起點(diǎn)位置。1.0時(shí)代,人工智能更多的是一種鑒別能力,即利用已有的數(shù)據(jù)來訓(xùn)練模型,讓模型做出Yes or No的判斷,但無法告知原因。而2.0時(shí)代,在大模型引領(lǐng)的AI 2.0時(shí)代,為人工智能帶來了新的能力,可以打造更多新的產(chǎn)品,滿足客戶更多的需求,例如醫(yī)療、營(yíng)銷、溝通等,能夠創(chuàng)造更多的商業(yè)機(jī)會(huì)。
同時(shí),從數(shù)據(jù)來看,今天的數(shù)據(jù)還沒充分發(fā)揮它應(yīng)有的價(jià)值,而通過大模型的深度學(xué)習(xí)可以充分利用和使用數(shù)據(jù)價(jià)值。黃偉認(rèn)為,大模型會(huì)成為人工智能2.0時(shí)代的“發(fā)電廠”。“誰擁有發(fā)電廠,誰就具有最大的商業(yè)價(jià)值。”
在業(yè)界都將目光鎖定在大模型身上,并認(rèn)為大模型是未來十年20年最大的機(jī)會(huì)之一時(shí),云知聲自然也不會(huì)放棄。再者,云知聲在過去十年里,積累了大量算法、數(shù)據(jù)、工程落地經(jīng)驗(yàn),仿佛都是為“山海”而生。
天時(shí)地利加人和,這不正是云知聲在去年12月份毅然決然投身大模型的底氣。
如今,“山海”大模型完成多輪優(yōu)化升級(jí),擁有超過十項(xiàng)技術(shù)能力。在通用能力上,包含語(yǔ)言生成、語(yǔ)言理解、知識(shí)問答、推理能力、數(shù)學(xué)能力、代碼能力,以及與人類對(duì)齊的安全合規(guī)能力;在落地能力上,提供插件擴(kuò)展、領(lǐng)域增強(qiáng),以及企業(yè)定制能力。
01.
年內(nèi)通用能力比肩ChatGPT
“目標(biāo)年內(nèi)通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個(gè)垂直領(lǐng)域能力超越GPT4。”黃偉在發(fā)布會(huì)線上揚(yáng)言稱。這也透露出,云知聲不是簡(jiǎn)單的將目光鎖定在通用能力上,更看側(cè)重TO B的落地場(chǎng)景中。
當(dāng)然這步棋子的布局,離不開黃偉的經(jīng)驗(yàn)。他從學(xué)術(shù)界到工業(yè)界,再到創(chuàng)業(yè),完整的做過產(chǎn)品,深知人工智能只是一種能力,不能僅做酷炫的外表,而是要做完整的閉環(huán)。
其實(shí),從云知聲的發(fā)展也可以窺見一二。
2012年成立時(shí),云知聲就開始做自然語(yǔ)言理解,投入在整個(gè)對(duì)話AI的全棧能力研究中,形成數(shù)據(jù)、算力和算法完整的能力鏈條。2016年,當(dāng)DeepMind AIphaGo 4:1 擊敗李世石時(shí),云知聲敏銳的意識(shí)到,人工智能的本質(zhì)是認(rèn)知智能,自然語(yǔ)言理解才是人工智能皇冠上的明珠,并在2016年年初開始布局超算——Atlas,并躬身入局物聯(lián)網(wǎng)、醫(yī)療等領(lǐng)域,收獲了真實(shí)的行業(yè)場(chǎng)景和數(shù)據(jù);诖耍2022年云知聲緊抓機(jī)遇,開啟“山海”大模型研發(fā),實(shí)現(xiàn)云知聲的AI三級(jí)跳。
在這新一輪的人工智能比拼中,為了提高大模型在具體場(chǎng)景的應(yīng)用落地水平,云知聲沿襲了一以貫之的U+X戰(zhàn)略,即以 U(AI技術(shù)和產(chǎn)品能力),深度結(jié)合 X(行業(yè)應(yīng)用場(chǎng)景),解決行業(yè)深層問題。
黃偉介紹稱,山海大模型技術(shù)架構(gòu)就是通用大模型,并針對(duì)知識(shí)密度高的領(lǐng)域,通過數(shù)據(jù)訓(xùn)練、訓(xùn)練數(shù)據(jù)、微調(diào)等方式,做一些專業(yè)的加強(qiáng),這樣模型既具備了通用應(yīng)用水平,也針對(duì)特殊場(chǎng)景與領(lǐng)域進(jìn)行了能力的加強(qiáng)。
如在醫(yī)療領(lǐng)域,以前醫(yī)療行業(yè)利用AI的方式去錄入病例,但是醫(yī)生依然需要逐字錄入信息,如今借助山海大模型,只需要隨著醫(yī)患問答的過程中,就能夠提取關(guān)鍵信息生成病例,提高了醫(yī)療的效率,同時(shí),云知聲在為醫(yī)療服務(wù)中積累的千萬級(jí)的標(biāo)準(zhǔn)的醫(yī)療數(shù)據(jù),并背靠國(guó)內(nèi)最大的醫(yī)療知識(shí)數(shù)據(jù)圖譜,使得山海大模型在MedQA評(píng)測(cè)能力中可超越GPT-4。
云知聲科技董事長(zhǎng)兼CTO梁家恩表示,就目前而言,大模型仍然是有限的東西,對(duì)于沒有見過的東西,大模型會(huì)生成“似是而非”的回答,隨著AI生成能力的不斷增強(qiáng),校驗(yàn)會(huì)更加困難,這也讓AI行業(yè)需要不斷去探索新的解決方法。
隨著AGI時(shí)代的到來,云知聲也迎來了自己的GPT時(shí)刻。“如果把通用大模型看作每科都能考到80分的學(xué)生,我們要做就是在某一兩門學(xué)科上,考到95分甚至更高。”黃偉如是說。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。