首頁 > 云計算頻道 > 大模型

訊飛星火煥新，上線“超級知識助手”，跳出“長文本”混戰(zhàn)

2024年04月30日 09:29:15 來源：鋅刻度公眾號

　　科大訊飛的星火大模型V3.5春季上新，一句話聲音復(fù)刻功能讓科技更有溫度;推出星火智能體平臺，助企業(yè)解決大模型應(yīng)用落地“最后一公里”難題;確定6月27日正式發(fā)布訊飛星火V4.0……

　　這其中，訊飛星火成為業(yè)界首個支持“長文本、長圖文、長語音”的大模型，成功抓住用戶高效準(zhǔn)確知識獲取的痛點，尤為引人矚目。

　　相比之下，長文文字長度“全球第一”的攀比變得索然無趣。

　　時至今日，科大訊飛為什么要做長文本、長圖文、長語音的大模型?長文本、長圖文、長語音的大模型，到底成色幾何?闖入大模型決賽圈，科大訊飛的底氣何在?

　　“長文本”競爭，邁入2.0時代

　　ChatGPT橫空出世，催生了“百模大戰(zhàn)”。

　　百家爭鳴之下，行業(yè)也在思考大模型的價值，從嘗鮮走向?qū)嵱贸蔀楣餐脑V求，于是乎應(yīng)用落地成為大模型博弈的“主戰(zhàn)場”。

　　不過，“大廠們”的主要精力在B端，通過賦能產(chǎn)業(yè)的方式，實現(xiàn)共生共榮共贏。

　　與之對應(yīng)是，C端重視的程度有所不及，提效需求長期得不到徹底滿足，以至于“修改AI生成文案的時間，不比從頭想來的少”成為共鳴。

　　直到“長文本”出現(xiàn)，才有了微妙的變化。

　　畢竟，人工閱讀長文本耗時按小時計算，但大模型耗時按秒計算，提效肉眼可見，C端知識高效獲取從夢想走向現(xiàn)實。

　　公開資料顯示，GPT-4Turbo-128k的文本范圍約為10萬漢字，Claude3200k約為16萬漢字，而以Kimi為首的國內(nèi)大模型不斷內(nèi)卷，長文本處理能力從20萬漢字一路攀升超千萬漢字，上演了一出“軍備競賽”。

　　作為既懂B端又懂C端的公司，科大訊飛卻有不同的看法。

　　科大訊飛分析發(fā)現(xiàn)，在知識獲取和學(xué)習(xí)的過程中，廣大用戶能拿到的資料往往不僅是現(xiàn)成的長文本，還有隨手可見的報刊書籍內(nèi)容、各種研討會的PPT內(nèi)容，老師黑板上的板書、同學(xué)的筆記，以及各種會議錄音、訪談，各種網(wǎng)上的發(fā)布會、培訓(xùn)教育視頻等，如何把這些文本、圖片、語音等都上傳到訊飛星火中，則可以快速地獲取全維度的知識。

　　通俗易懂地說，科大訊飛跳出長文本之爭的固有思維，通過多模態(tài)進行降維打擊，真正面向用戶高效知識獲取的多元場景，擺脫了“長文本”當(dāng)下的內(nèi)卷。

　　對此，科大訊飛董事長劉慶峰表示:“我們從星火APP的應(yīng)用看到，使用的最高峰不是周末，而是工作日，使用的最高峰時間是在工作日的上午9:30和下午的3:30，也就是說絕大部分用戶是由我們訊飛星火來解決和工作相關(guān)的問題的。”

　　七麥數(shù)據(jù)顯示，訊飛星火APP在安卓端的下載量已經(jīng)超過9600萬次，在國內(nèi)工具類通用大模型APP中排名第一。

　　從可用走向愛用，從場景中找到剛需

　　以上可見，持續(xù)用技術(shù)進步解決真實剛需，是訊飛星火獲得用戶認(rèn)可的關(guān)鍵所在，也契合科大訊飛大模型一直秉持的“解放生產(chǎn)力，釋放想象力”宗旨。

　　事實上，科大訊飛的長文本、長圖文、長語音大模型，堪稱職場人的提效“神器”。

　　一方面，長文本處理更專業(yè)。

　　雖然越來越多的大模型支持長文本處理，但含金量卻并不相同，之所以如此與使用RAG(檢索增強)算法息息相關(guān)。

　　一名業(yè)內(nèi)人士告訴鋅刻度:“所謂RAG算法，可以簡單粗暴地理解為長文本拆分成多個短文本再進行處理，從而降低了技術(shù)門檻，拼長度很有優(yōu)勢，但捕捉上下文能力相對不足，進而降低了處理效率，并在精準(zhǔn)性、連貫性、可靠性上處于劣勢。”

　　上述業(yè)內(nèi)人士進一步表示，RAG算法滿足可用標(biāo)準(zhǔn)，適合一些對知識準(zhǔn)確度要求不高的工作場景，需要用戶人工再檢查一遍，而無損算法可以完整地捕捉上下文內(nèi)容，從而理解長文本更準(zhǔn)確，滿足易用標(biāo)準(zhǔn)。

　　訊飛星火則更進一步，達到好用與愛用的標(biāo)準(zhǔn)。

　　訊飛星火通用長文本能力，包括長文檔信息抽取、長文檔知識問答、長文檔總結(jié)、長文檔文本生成等，總體已經(jīng)接近GPT-4Turbo，而在各垂直領(lǐng)域的知識問答任務(wù)上，星火大模型長文本總體水平已經(jīng)超過GPT-4Turbo。

　　更為重要的是，借助稀疏剪枝技術(shù)與知識蒸餾技術(shù)，推出業(yè)界最優(yōu)的130億參數(shù)的大模型在效果損失僅3%以內(nèi)的情況下，使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。

　　測試顯示，在保障長文本效果的情況下，無論是10K、64K、128K token，還是更長的文本上，星火大模型的性能都做到業(yè)界最優(yōu)。

　　如此一來，即使潦草手寫文字的識別也不在話下，而這曾是Kimi的痛點。

　　另外一方面，創(chuàng)新瞄準(zhǔn)剛需。

　　作為后入者，單單更專業(yè)是不夠的，還需要有獨到之處才可以后來居上，科大訊飛從場景中找到剛需，再通過滿足剛需達到創(chuàng)新的目的。

　　于是乎，長圖文、長語音令訊飛星火占據(jù)了“人無我有”的競爭優(yōu)勢。

　　更為關(guān)鍵的是，長文本、長圖文與長語音相互促進，應(yīng)用場景得到極大的擴展，訊飛星火落地也順勢獲得更大的增量場。

　　譬如，日常生活中經(jīng)常碰到冗長的購房合同、保險合同等，看不懂、看不完、看不全成為一個長期的痛點，長文本與長圖文疊加則可以對合同進行風(fēng)險審核、合同比對、摘要總結(jié)等，迅速識別潛在風(fēng)險漏洞，讓合同處理更便捷、更高效、更準(zhǔn)確。

　　再譬如，長文本疊加長語音，可以幫助提升實錄轉(zhuǎn)寫的效率以及篇章梳理能力，讓教師備課、學(xué)生復(fù)習(xí)更方便、更輕松、更省心。

　　另外，訊飛AI學(xué)習(xí)機是全球首款認(rèn)知大模型AI學(xué)習(xí)機，長圖文與長語音疊加可以提升了AI學(xué)習(xí)機是的智能化輔學(xué)能力，賦予英語口語陪練、中英作文批改、數(shù)學(xué)互動輔學(xué)、百科自由問答、親子教育助手等更強的互動性，增加孩子的學(xué)習(xí)興趣，進一步釋放孩子的創(chuàng)造力、啟發(fā)力與想象力。

　　2023年，受益于訊飛星火，訊飛AI學(xué)習(xí)機、訊飛智能辦公本，訊飛智能錄音筆、訊飛智能翻譯機等C端硬件產(chǎn)品的GMV實現(xiàn)84%增長。

　　由此可見，長文本、長圖文、長語音的“化學(xué)反應(yīng)”，解決了用戶在全場景中更高效獲取知識的剛需。

　　想象力變?yōu)樯a(chǎn)力，算力底座是關(guān)鍵

　　不難看出，科大訊飛為大模型博弈指明了一個行業(yè)方向:避免無效的“內(nèi)卷”，回歸技術(shù)創(chuàng)新的“主航道”，則可以上演彎道超車的好戲。

　　畢竟，技術(shù)創(chuàng)新才是最大的生產(chǎn)力。

　　而要把想象力變?yōu)樯a(chǎn)力，則離不開科大訊飛長期苦練基本功，夯實了大模型底座，如此才能跑得快、更跑得遠(yuǎn)。

　　簡而言之，算力才是大模型的底座，是支撐長文本、長圖文與長語音的重要保障。

　　巧的是，科大訊飛一直堅持做難而正確的事情:相較行業(yè)的“大玩家們”，科大訊飛的資金并不突出，卻持之以恒地加碼算力，成為屈指可數(shù)擁有大模型底座的AI企業(yè)。

　　財報數(shù)據(jù)顯示，科大訊飛2023年的研發(fā)費用為38.39億元，同比增長11.89%，而全年凈利潤也不過6.57億元，研發(fā)費用是凈利潤的5.84倍，“該投的投，絕不手軟，應(yīng)投盡投，飽和投入”。

　　值得一提的是，科大訊飛的算力底座自主可控。

　　2023年10月，科大訊飛與華為聯(lián)合發(fā)布首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”，通過帶寬利用率提升、并行訓(xùn)練算法優(yōu)化，訊飛星火在華為910B芯片上實現(xiàn)了英偉達A100的90%的算力能力，而且在部分專用能力領(lǐng)域甚至超越英偉達。

　　這么一來，訊飛星火大模型V3.5，一躍成為首個全國產(chǎn)算力訓(xùn)練的完全自主知識產(chǎn)權(quán)的大模型，不懼“卡脖子”的風(fēng)險。

　　強強聯(lián)合之下，科大訊飛躋身大模型的第一梯隊。

　　關(guān)于此，從剛剛結(jié)束不久的第27屆聯(lián)合國科技大會就可見一斑:科大訊飛與OpenAI、谷歌、微軟等數(shù)十家國內(nèi)外知名企業(yè)共同參與、編制《生成式人工智能應(yīng)用安全測試標(biāo)準(zhǔn)》和《大語言模型安全測試方法》兩項國際標(biāo)準(zhǔn)，其中科大訊飛深度參與制定《生成式人工智能應(yīng)用安全測試標(biāo)準(zhǔn)》，彰顯了其人工智能技術(shù)實力與國際影響力。

　　總而言之，科大訊飛的立足于大模型算力底座，與國際最先進的能力看齊，從而孵化出長文本、長圖文與長語音大模型，憑借文字處理更專業(yè)、應(yīng)用場景更豐富、用戶需求更易滿足，一舉奠定了其大模型的領(lǐng)先地位。

　　那么，科大訊飛的“星火”正在“燎原”。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信