正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團喜歡“追風(fēng)口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權(quán)益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢也準備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級,核心場景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動互聯(lián)網(wǎng)時代,移動App兼容測試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個月內(nèi)開放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實現(xiàn)營收5970億元,同比增長13.53%傳三星計劃2025年推出卷軸屏手機蘋果新專利探索折疊iPhone未來,任意表面實現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁 > 云計算頻道 > 大模型

    訊飛星火煥新,上線“超級知識助手”,跳出“長文本”混戰(zhàn)

    2024年04月30日 09:29:15   來源:鋅刻度公眾號

      科大訊飛的星火大模型V3.5春季上新,一句話聲音復(fù)刻功能讓科技更有溫度;推出星火智能體平臺,助企業(yè)解決大模型應(yīng)用落地“最后一公里”難題;確定6月27日正式發(fā)布訊飛星火V4.0……

      這其中,訊飛星火成為業(yè)界首個支持“長文本、長圖文、長語音”的大模型,成功抓住用戶高效準確知識獲取的痛點,尤為引人矚目。

      相比之下,長文文字長度“全球第一”的攀比變得索然無趣。

      時至今日,科大訊飛為什么要做長文本、長圖文、長語音的大模型?長文本、長圖文、長語音的大模型,到底成色幾何?闖入大模型決賽圈,科大訊飛的底氣何在?

      “長文本”競爭,邁入2.0時代

      ChatGPT橫空出世,催生了“百模大戰(zhàn)”。

      百家爭鳴之下,行業(yè)也在思考大模型的價值,從嘗鮮走向?qū)嵱贸蔀楣餐脑V求,于是乎應(yīng)用落地成為大模型博弈的“主戰(zhàn)場”。

      不過,“大廠們”的主要精力在B端,通過賦能產(chǎn)業(yè)的方式,實現(xiàn)共生共榮共贏。

      與之對應(yīng)是,C端重視的程度有所不及,提效需求長期得不到徹底滿足,以至于“修改AI生成文案的時間,不比從頭想來的少”成為共鳴。

      直到“長文本”出現(xiàn),才有了微妙的變化。

      畢竟,人工閱讀長文本耗時按小時計算,但大模型耗時按秒計算,提效肉眼可見,C端知識高效獲取從夢想走向現(xiàn)實。

      公開資料顯示,GPT-4Turbo-128k的文本范圍約為10萬漢字,Claude3200k約為16萬漢字,而以Kimi為首的國內(nèi)大模型不斷內(nèi)卷,長文本處理能力從20萬漢字一路攀升超千萬漢字,上演了一出“軍備競賽”。

      作為既懂B端又懂C端的公司,科大訊飛卻有不同的看法。

      科大訊飛分析發(fā)現(xiàn),在知識獲取和學(xué)習(xí)的過程中,廣大用戶能拿到的資料往往不僅是現(xiàn)成的長文本,還有隨手可見的報刊書籍內(nèi)容、各種研討會的PPT內(nèi)容,老師黑板上的板書、同學(xué)的筆記,以及各種會議錄音、訪談,各種網(wǎng)上的發(fā)布會、培訓(xùn)教育視頻等,如何把這些文本、圖片、語音等都上傳到訊飛星火中,則可以快速地獲取全維度的知識。

      通俗易懂地說,科大訊飛跳出長文本之爭的固有思維,通過多模態(tài)進行降維打擊,真正面向用戶高效知識獲取的多元場景,擺脫了“長文本”當下的內(nèi)卷。

      對此,科大訊飛董事長劉慶峰表示:“我們從星火APP的應(yīng)用看到,使用的最高峰不是周末,而是工作日,使用的最高峰時間是在工作日的上午9:30和下午的3:30,也就是說絕大部分用戶是由我們訊飛星火來解決和工作相關(guān)的問題的。”

      七麥數(shù)據(jù)顯示,訊飛星火APP在安卓端的下載量已經(jīng)超過9600萬次,在國內(nèi)工具類通用大模型APP中排名第一。

      從可用走向愛用,從場景中找到剛需

      以上可見,持續(xù)用技術(shù)進步解決真實剛需,是訊飛星火獲得用戶認可的關(guān)鍵所在,也契合科大訊飛大模型一直秉持的“解放生產(chǎn)力,釋放想象力”宗旨。

      事實上,科大訊飛的長文本、長圖文、長語音大模型,堪稱職場人的提效“神器”。

      一方面,長文本處理更專業(yè)。

      雖然越來越多的大模型支持長文本處理,但含金量卻并不相同,之所以如此與使用RAG(檢索增強)算法息息相關(guān)。

      一名業(yè)內(nèi)人士告訴鋅刻度:“所謂RAG算法,可以簡單粗暴地理解為長文本拆分成多個短文本再進行處理,從而降低了技術(shù)門檻,拼長度很有優(yōu)勢,但捕捉上下文能力相對不足,進而降低了處理效率,并在精準性、連貫性、可靠性上處于劣勢。”

      上述業(yè)內(nèi)人士進一步表示,RAG算法滿足可用標準,適合一些對知識準確度要求不高的工作場景,需要用戶人工再檢查一遍,而無損算法可以完整地捕捉上下文內(nèi)容,從而理解長文本更準確,滿足易用標準。

      訊飛星火則更進一步,達到好用與愛用的標準。

      訊飛星火通用長文本能力,包括長文檔信息抽取、長文檔知識問答、長文檔總結(jié)、長文檔文本生成等,總體已經(jīng)接近GPT-4Turbo,而在各垂直領(lǐng)域的知識問答任務(wù)上,星火大模型長文本總體水平已經(jīng)超過GPT-4Turbo。

      更為重要的是,借助稀疏剪枝技術(shù)與知識蒸餾技術(shù),推出業(yè)界最優(yōu)的130億參數(shù)的大模型在效果損失僅3%以內(nèi)的情況下,使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。

      測試顯示,在保障長文本效果的情況下,無論是10K、64K、128K token,還是更長的文本上,星火大模型的性能都做到業(yè)界最優(yōu)。

      如此一來,即使潦草手寫文字的識別也不在話下,而這曾是Kimi的痛點。

      另外一方面,創(chuàng)新瞄準剛需。

      作為后入者,單單更專業(yè)是不夠的,還需要有獨到之處才可以后來居上,科大訊飛從場景中找到剛需,再通過滿足剛需達到創(chuàng)新的目的。

      于是乎,長圖文、長語音令訊飛星火占據(jù)了“人無我有”的競爭優(yōu)勢。

      更為關(guān)鍵的是,長文本、長圖文與長語音相互促進,應(yīng)用場景得到極大的擴展,訊飛星火落地也順勢獲得更大的增量場。

      譬如,日常生活中經(jīng)常碰到冗長的購房合同、保險合同等,看不懂、看不完、看不全成為一個長期的痛點,長文本與長圖文疊加則可以對合同進行風(fēng)險審核、合同比對、摘要總結(jié)等,迅速識別潛在風(fēng)險漏洞,讓合同處理更便捷、更高效、更準確。

      再譬如,長文本疊加長語音,可以幫助提升實錄轉(zhuǎn)寫的效率以及篇章梳理能力,讓教師備課、學(xué)生復(fù)習(xí)更方便、更輕松、更省心。

      另外,訊飛AI學(xué)習(xí)機是全球首款認知大模型AI學(xué)習(xí)機,長圖文與長語音疊加可以提升了AI學(xué)習(xí)機是的智能化輔學(xué)能力,賦予英語口語陪練、中英作文批改、數(shù)學(xué)互動輔學(xué)、百科自由問答、親子教育助手等更強的互動性,增加孩子的學(xué)習(xí)興趣,進一步釋放孩子的創(chuàng)造力、啟發(fā)力與想象力。

      2023年,受益于訊飛星火,訊飛AI學(xué)習(xí)機、訊飛智能辦公本,訊飛智能錄音筆、訊飛智能翻譯機等C端硬件產(chǎn)品的GMV實現(xiàn)84%增長。

      由此可見,長文本、長圖文、長語音的“化學(xué)反應(yīng)”,解決了用戶在全場景中更高效獲取知識的剛需。

      想象力變?yōu)樯a(chǎn)力,算力底座是關(guān)鍵

      不難看出,科大訊飛為大模型博弈指明了一個行業(yè)方向:避免無效的“內(nèi)卷”,回歸技術(shù)創(chuàng)新的“主航道”,則可以上演彎道超車的好戲。

      畢竟,技術(shù)創(chuàng)新才是最大的生產(chǎn)力。

      而要把想象力變?yōu)樯a(chǎn)力,則離不開科大訊飛長期苦練基本功,夯實了大模型底座,如此才能跑得快、更跑得遠。

      簡而言之,算力才是大模型的底座,是支撐長文本、長圖文與長語音的重要保障。

      巧的是,科大訊飛一直堅持做難而正確的事情:相較行業(yè)的“大玩家們”,科大訊飛的資金并不突出,卻持之以恒地加碼算力,成為屈指可數(shù)擁有大模型底座的AI企業(yè)。

      財報數(shù)據(jù)顯示,科大訊飛2023年的研發(fā)費用為38.39億元,同比增長11.89%,而全年凈利潤也不過6.57億元,研發(fā)費用是凈利潤的5.84倍,“該投的投,絕不手軟,應(yīng)投盡投,飽和投入”。

      值得一提的是,科大訊飛的算力底座自主可控。

      2023年10月,科大訊飛與華為聯(lián)合發(fā)布首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”,通過帶寬利用率提升、并行訓(xùn)練算法優(yōu)化,訊飛星火在華為910B芯片上實現(xiàn)了英偉達A100的90%的算力能力,而且在部分專用能力領(lǐng)域甚至超越英偉達。

      這么一來,訊飛星火大模型V3.5,一躍成為首個全國產(chǎn)算力訓(xùn)練的完全自主知識產(chǎn)權(quán)的大模型,不懼“卡脖子”的風(fēng)險。

      強強聯(lián)合之下,科大訊飛躋身大模型的第一梯隊。

      關(guān)于此,從剛剛結(jié)束不久的第27屆聯(lián)合國科技大會就可見一斑:科大訊飛與OpenAI、谷歌、微軟等數(shù)十家國內(nèi)外知名企業(yè)共同參與、編制《生成式人工智能應(yīng)用安全測試標準》和《大語言模型安全測試方法》兩項國際標準,其中科大訊飛深度參與制定《生成式人工智能應(yīng)用安全測試標準》,彰顯了其人工智能技術(shù)實力與國際影響力。

      總而言之,科大訊飛的立足于大模型算力底座,與國際最先進的能力看齊,從而孵化出長文本、長圖文與長語音大模型,憑借文字處理更專業(yè)、應(yīng)用場景更豐富、用戶需求更易滿足,一舉奠定了其大模型的領(lǐng)先地位。

      那么,科大訊飛的“星火”正在“燎原”。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。