科大訊飛的星火大模型V3.5春季上新,一句話聲音復(fù)刻功能讓科技更有溫度;推出星火智能體平臺,助企業(yè)解決大模型應(yīng)用落地“最后一公里”難題;確定6月27日正式發(fā)布訊飛星火V4.0……
這其中,訊飛星火成為業(yè)界首個支持“長文本、長圖文、長語音”的大模型,成功抓住用戶高效準(zhǔn)確知識獲取的痛點,尤為引人矚目。
相比之下,長文文字長度“全球第一”的攀比變得索然無趣。
時至今日,科大訊飛為什么要做長文本、長圖文、長語音的大模型?長文本、長圖文、長語音的大模型,到底成色幾何?闖入大模型決賽圈,科大訊飛的底氣何在?
“長文本”競爭,邁入2.0時代
ChatGPT橫空出世,催生了“百模大戰(zhàn)”。
百家爭鳴之下,行業(yè)也在思考大模型的價值,從嘗鮮走向?qū)嵱贸蔀楣餐脑V求,于是乎應(yīng)用落地成為大模型博弈的“主戰(zhàn)場”。
不過,“大廠們”的主要精力在B端,通過賦能產(chǎn)業(yè)的方式,實現(xiàn)共生共榮共贏。
與之對應(yīng)是,C端重視的程度有所不及,提效需求長期得不到徹底滿足,以至于“修改AI生成文案的時間,不比從頭想來的少”成為共鳴。
直到“長文本”出現(xiàn),才有了微妙的變化。
畢竟,人工閱讀長文本耗時按小時計算,但大模型耗時按秒計算,提效肉眼可見,C端知識高效獲取從夢想走向現(xiàn)實。
公開資料顯示,GPT-4Turbo-128k的文本范圍約為10萬漢字,Claude3200k約為16萬漢字,而以Kimi為首的國內(nèi)大模型不斷內(nèi)卷,長文本處理能力從20萬漢字一路攀升超千萬漢字,上演了一出“軍備競賽”。
作為既懂B端又懂C端的公司,科大訊飛卻有不同的看法。
科大訊飛分析發(fā)現(xiàn),在知識獲取和學(xué)習(xí)的過程中,廣大用戶能拿到的資料往往不僅是現(xiàn)成的長文本,還有隨手可見的報刊書籍內(nèi)容、各種研討會的PPT內(nèi)容,老師黑板上的板書、同學(xué)的筆記,以及各種會議錄音、訪談,各種網(wǎng)上的發(fā)布會、培訓(xùn)教育視頻等,如何把這些文本、圖片、語音等都上傳到訊飛星火中,則可以快速地獲取全維度的知識。
通俗易懂地說,科大訊飛跳出長文本之爭的固有思維,通過多模態(tài)進行降維打擊,真正面向用戶高效知識獲取的多元場景,擺脫了“長文本”當(dāng)下的內(nèi)卷。
對此,科大訊飛董事長劉慶峰表示:“我們從星火APP的應(yīng)用看到,使用的最高峰不是周末,而是工作日,使用的最高峰時間是在工作日的上午9:30和下午的3:30,也就是說絕大部分用戶是由我們訊飛星火來解決和工作相關(guān)的問題的。”
七麥數(shù)據(jù)顯示,訊飛星火APP在安卓端的下載量已經(jīng)超過9600萬次,在國內(nèi)工具類通用大模型APP中排名第一。
從可用走向愛用,從場景中找到剛需
以上可見,持續(xù)用技術(shù)進步解決真實剛需,是訊飛星火獲得用戶認(rèn)可的關(guān)鍵所在,也契合科大訊飛大模型一直秉持的“解放生產(chǎn)力,釋放想象力”宗旨。
事實上,科大訊飛的長文本、長圖文、長語音大模型,堪稱職場人的提效“神器”。
一方面,長文本處理更專業(yè)。
雖然越來越多的大模型支持長文本處理,但含金量卻并不相同,之所以如此與使用RAG(檢索增強)算法息息相關(guān)。
一名業(yè)內(nèi)人士告訴鋅刻度:“所謂RAG算法,可以簡單粗暴地理解為長文本拆分成多個短文本再進行處理,從而降低了技術(shù)門檻,拼長度很有優(yōu)勢,但捕捉上下文能力相對不足,進而降低了處理效率,并在精準(zhǔn)性、連貫性、可靠性上處于劣勢。”
上述業(yè)內(nèi)人士進一步表示,RAG算法滿足可用標(biāo)準(zhǔn),適合一些對知識準(zhǔn)確度要求不高的工作場景,需要用戶人工再檢查一遍,而無損算法可以完整地捕捉上下文內(nèi)容,從而理解長文本更準(zhǔn)確,滿足易用標(biāo)準(zhǔn)。
訊飛星火則更進一步,達到好用與愛用的標(biāo)準(zhǔn)。
訊飛星火通用長文本能力,包括長文檔信息抽取、長文檔知識問答、長文檔總結(jié)、長文檔文本生成等,總體已經(jīng)接近GPT-4Turbo,而在各垂直領(lǐng)域的知識問答任務(wù)上,星火大模型長文本總體水平已經(jīng)超過GPT-4Turbo。
更為重要的是,借助稀疏剪枝技術(shù)與知識蒸餾技術(shù),推出業(yè)界最優(yōu)的130億參數(shù)的大模型在效果損失僅3%以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。
測試顯示,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本上,星火大模型的性能都做到業(yè)界最優(yōu)。
如此一來,即使潦草手寫文字的識別也不在話下,而這曾是Kimi的痛點。
另外一方面,創(chuàng)新瞄準(zhǔn)剛需。
作為后入者,單單更專業(yè)是不夠的,還需要有獨到之處才可以后來居上,科大訊飛從場景中找到剛需,再通過滿足剛需達到創(chuàng)新的目的。
于是乎,長圖文、長語音令訊飛星火占據(jù)了“人無我有”的競爭優(yōu)勢。
更為關(guān)鍵的是,長文本、長圖文與長語音相互促進,應(yīng)用場景得到極大的擴展,訊飛星火落地也順勢獲得更大的增量場。
譬如,日常生活中經(jīng)常碰到冗長的購房合同、保險合同等,看不懂、看不完、看不全成為一個長期的痛點,長文本與長圖文疊加則可以對合同進行風(fēng)險審核、合同比對、摘要總結(jié)等,迅速識別潛在風(fēng)險漏洞,讓合同處理更便捷、更高效、更準(zhǔn)確。
再譬如,長文本疊加長語音,可以幫助提升實錄轉(zhuǎn)寫的效率以及篇章梳理能力,讓教師備課、學(xué)生復(fù)習(xí)更方便、更輕松、更省心。
另外,訊飛AI學(xué)習(xí)機是全球首款認(rèn)知大模型AI學(xué)習(xí)機,長圖文與長語音疊加可以提升了AI學(xué)習(xí)機是的智能化輔學(xué)能力,賦予英語口語陪練、中英作文批改、數(shù)學(xué)互動輔學(xué)、百科自由問答、親子教育助手等更強的互動性,增加孩子的學(xué)習(xí)興趣,進一步釋放孩子的創(chuàng)造力、啟發(fā)力與想象力。
2023年,受益于訊飛星火,訊飛AI學(xué)習(xí)機、訊飛智能辦公本,訊飛智能錄音筆、訊飛智能翻譯機等C端硬件產(chǎn)品的GMV實現(xiàn)84%增長。
由此可見,長文本、長圖文、長語音的“化學(xué)反應(yīng)”,解決了用戶在全場景中更高效獲取知識的剛需。
想象力變?yōu)樯a(chǎn)力,算力底座是關(guān)鍵
不難看出,科大訊飛為大模型博弈指明了一個行業(yè)方向:避免無效的“內(nèi)卷”,回歸技術(shù)創(chuàng)新的“主航道”,則可以上演彎道超車的好戲。
畢竟,技術(shù)創(chuàng)新才是最大的生產(chǎn)力。
而要把想象力變?yōu)樯a(chǎn)力,則離不開科大訊飛長期苦練基本功,夯實了大模型底座,如此才能跑得快、更跑得遠(yuǎn)。
簡而言之,算力才是大模型的底座,是支撐長文本、長圖文與長語音的重要保障。
巧的是,科大訊飛一直堅持做難而正確的事情:相較行業(yè)的“大玩家們”,科大訊飛的資金并不突出,卻持之以恒地加碼算力,成為屈指可數(shù)擁有大模型底座的AI企業(yè)。
財報數(shù)據(jù)顯示,科大訊飛2023年的研發(fā)費用為38.39億元,同比增長11.89%,而全年凈利潤也不過6.57億元,研發(fā)費用是凈利潤的5.84倍,“該投的投,絕不手軟,應(yīng)投盡投,飽和投入”。
值得一提的是,科大訊飛的算力底座自主可控。
2023年10月,科大訊飛與華為聯(lián)合發(fā)布首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”,通過帶寬利用率提升、并行訓(xùn)練算法優(yōu)化,訊飛星火在華為910B芯片上實現(xiàn)了英偉達A100的90%的算力能力,而且在部分專用能力領(lǐng)域甚至超越英偉達。
這么一來,訊飛星火大模型V3.5,一躍成為首個全國產(chǎn)算力訓(xùn)練的完全自主知識產(chǎn)權(quán)的大模型,不懼“卡脖子”的風(fēng)險。
強強聯(lián)合之下,科大訊飛躋身大模型的第一梯隊。
關(guān)于此,從剛剛結(jié)束不久的第27屆聯(lián)合國科技大會就可見一斑:科大訊飛與OpenAI、谷歌、微軟等數(shù)十家國內(nèi)外知名企業(yè)共同參與、編制《生成式人工智能應(yīng)用安全測試標(biāo)準(zhǔn)》和《大語言模型安全測試方法》兩項國際標(biāo)準(zhǔn),其中科大訊飛深度參與制定《生成式人工智能應(yīng)用安全測試標(biāo)準(zhǔn)》,彰顯了其人工智能技術(shù)實力與國際影響力。
總而言之,科大訊飛的立足于大模型算力底座,與國際最先進的能力看齊,從而孵化出長文本、長圖文與長語音大模型,憑借文字處理更專業(yè)、應(yīng)用場景更豐富、用戶需求更易滿足,一舉奠定了其大模型的領(lǐng)先地位。
那么,科大訊飛的“星火”正在“燎原”。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。