合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實(shí)況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開(kāi)放革命性AI對(duì)話系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話了?
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    清華學(xué)霸引爆“長(zhǎng)文本”大戰(zhàn),大模型的應(yīng)用前景清晰了嗎?

    2024年04月02日 14:26:43   來(lái)源:智能相對(duì)論

      Long-LLM(長(zhǎng)文本大模型)時(shí)代似乎來(lái)得有些突然,而引爆這場(chǎng)熱潮的,竟是一家由清華學(xué)霸牽頭的本土AI初創(chuàng)企業(yè)。

      前不久,月之暗面(Moonshot AI)公司宣布旗下對(duì)話式 AI 助理產(chǎn)品 Kimi 應(yīng)用現(xiàn)已支持200萬(wàn)字無(wú)損上下文輸入。

      對(duì)比去年10月份Kimi上線時(shí)僅支持的20萬(wàn)字,這一波升級(jí)直接提升了10倍文本處理能力,同時(shí)也引起了強(qiáng)烈的市場(chǎng)反應(yīng),特別是在資本市場(chǎng),Kimi概念股應(yīng)運(yùn)而生,諸如九安醫(yī)療、華策影視、中廣天擇等都受益于Kimi概念而實(shí)現(xiàn)了股價(jià)不同程度的漲幅。

      這些刺激更讓大模型領(lǐng)域徹底卷起了長(zhǎng)文本大戰(zhàn)。

      01 “長(zhǎng)文本”大戰(zhàn),卷的不是字?jǐn)?shù)而是財(cái)力

      阿里率先完成自家的大模型產(chǎn)品升級(jí),強(qiáng)化長(zhǎng)文本處理能力,免費(fèi)面向大眾開(kāi)放最高1000萬(wàn)字的長(zhǎng)文本處理能力。

      360則緊隨其后,宣布旗下360智腦正式內(nèi)測(cè)500萬(wàn)字的長(zhǎng)文本功能,并在360AI瀏覽器開(kāi)放給用戶使用。

      而百度也宣布在下個(gè)月進(jìn)行版本升級(jí),開(kāi)放長(zhǎng)文本能力,文字范圍會(huì)在200萬(wàn)-500萬(wàn)字。

      目前,文心一言的文本上限大致為2.8萬(wàn)字。而像GPT-4Turbo-128k公布的文本范圍也不過(guò)為10萬(wàn)漢字,Claude3200k上下文約16萬(wàn)漢字。

      可以說(shuō),這一波熱潮直接把國(guó)內(nèi)的大模型廠商一下子都拉進(jìn)了百萬(wàn)量級(jí)的長(zhǎng)文本競(jìng)賽,而主流廠商的入局也為這場(chǎng)“長(zhǎng)文本”大戰(zhàn)增添了很多看頭。

      目前來(lái)看,“長(zhǎng)文本”大戰(zhàn)的賽點(diǎn)主要呈現(xiàn)在兩個(gè)方面。

      一方面,是大模型的支持文本參數(shù)。類似阿里通義千問(wèn)的1000萬(wàn)字、360智腦的500萬(wàn)字、百度文心一言的200萬(wàn)-500萬(wàn)字、Kimi的200萬(wàn)字等等,都在極力向市場(chǎng)爭(zhēng)“彩頭”,告訴用戶自家的長(zhǎng)文本處理能力足夠“長(zhǎng)”。

      另一方面,是長(zhǎng)文本處理能力的開(kāi)放程度。有意思的是,Kimi是免費(fèi)開(kāi)放給用戶使用的,阿里通義千問(wèn)的長(zhǎng)文本處理功能也是免費(fèi)的,360智腦、百度文心一言也沒(méi)有要收費(fèi)的意思。——以“長(zhǎng)文本”大戰(zhàn)為例,今年的大模型競(jìng)爭(zhēng)遠(yuǎn)比去年要“卷”得多。

      還記得去年大火的妙鴨相機(jī),以及各式各樣的圖片生成式服務(wù),都或多或少地通過(guò)各種形式如充值、辦會(huì)員等,要求用戶付費(fèi)才能體驗(yàn)。

      今年大模型領(lǐng)域的這把“火”燒得旺,也燒的離奇地“free”。

      為什么?

      Kimi自升級(jí)以來(lái),就有大量用戶不斷涌入,激增的流量更是一度讓月之暗面(Moonshot AI)的服務(wù)器承受了巨大的壓力,一度陷入宕機(jī),旗下的App和小程序都無(wú)法正常使用。

      根據(jù)月之暗面(Moonshot AI)發(fā)布的官方消息,從3.20觀測(cè)到流量異常增高后,已經(jīng)進(jìn)行了5次擴(kuò)容工作。推理資源會(huì)持續(xù)配合流量進(jìn)行擴(kuò)容,以盡量承載持續(xù)增長(zhǎng)的用戶量。

      簡(jiǎn)單來(lái)說(shuō),用戶對(duì)長(zhǎng)文本功能是非常有興趣的,相關(guān)的市場(chǎng)需求還在保持持續(xù)性的、爆炸性的增長(zhǎng)。同時(shí),大量的用戶涌進(jìn),不僅提高了大模型產(chǎn)品的知名度,更重要的是在大量用戶的基礎(chǔ)上通過(guò)類似于UGC的模式去探索大模型的應(yīng)用,或許更能進(jìn)一步推動(dòng)Long-LLM(長(zhǎng)文本大模型)的商業(yè)化進(jìn)程。

      當(dāng)然,在這個(gè)過(guò)程中,不可避免地就得投入大量資金,一旦商業(yè)化加速,大模型廠商就得做好“卷”財(cái)力的準(zhǔn)備。

      阿里通義千問(wèn)目前免費(fèi)對(duì)所有人開(kāi)放高達(dá)萬(wàn)頁(yè)的文檔處理能力,如果要計(jì)算成本,按照目前最便宜的市價(jià)0.1元/頁(yè),10000頁(yè)的文檔光解析費(fèi)用就要1000元,這還不包括解析完成之后大模型處理文檔的成本?紤]到通義千問(wèn)網(wǎng)頁(yè)、APP、釘釘?shù)榷鄠(gè)端口的用戶基數(shù),需要投入的資金恐怕不會(huì)是個(gè)小數(shù)目。

      大模型的商業(yè)化在開(kāi)始階段并非“賺錢”,而是“燒錢”。

      02 長(zhǎng)文本,直接“接駁”商業(yè)化場(chǎng)景

      在大模型的商業(yè)化進(jìn)程上,長(zhǎng)文本的爆火是很關(guān)鍵的一環(huán)。

      就大模型的技術(shù)原理而言,解決長(zhǎng)文本問(wèn)題是必要的。因?yàn)槲谋鹃L(zhǎng)度的提高,對(duì)應(yīng)的模型能解決問(wèn)題的邊界也將大幅提升,兩者呈現(xiàn)出明顯的正向關(guān)系。

      傳統(tǒng)的文本處理模型受限于訓(xùn)練結(jié)構(gòu),可支持的文本范圍都不算長(zhǎng),在處理復(fù)雜任務(wù)和深度專業(yè)知識(shí)(這一類知識(shí)往往都是長(zhǎng)篇巨著)時(shí),只能拆解輸入訓(xùn)練,由此就有可能導(dǎo)致輸出的結(jié)果上下文邏輯不連貫不順暢等問(wèn)題。

      區(qū)別于傳統(tǒng)的文本處理模型,長(zhǎng)文本模型就具備更準(zhǔn)確的文本理解和生成能力以及更強(qiáng)大的跨領(lǐng)域遷移能力。這對(duì)于打造垂直領(lǐng)域的行業(yè)專家是一個(gè)非常必要的能力支持,比如面向一些長(zhǎng)篇巨制的醫(yī)療文獻(xiàn)、法律文件、財(cái)務(wù)報(bào)告等,長(zhǎng)文本模型就具備更好的理解能力,對(duì)應(yīng)完成跨領(lǐng)域?qū)W習(xí)和應(yīng)用,從而打造出更專業(yè)的醫(yī)療助理、法律助理以及金融助理等應(yīng)用。

      話不多說(shuō),實(shí)踐一下。

      在這里,「智能相對(duì)論」向阿里通義千問(wèn)相繼“投喂”了幾本長(zhǎng)達(dá)數(shù)百頁(yè)的專業(yè)書(shū)籍,涵蓋以《高產(chǎn)母豬飼養(yǎng)技術(shù)有問(wèn)必答》為代表的農(nóng)業(yè)養(yǎng)殖、以《犬貓營(yíng)養(yǎng)需要》為代表的寵物喂養(yǎng)等等小眾領(lǐng)域。

      結(jié)果所能實(shí)現(xiàn)的效果確實(shí)令人驚訝,阿里通義千問(wèn)不僅能高度概括總結(jié)這些長(zhǎng)篇巨著的主要內(nèi)容,還能有針對(duì)性的給出具體篇章的知識(shí)解答。比如,在《高產(chǎn)母豬飼養(yǎng)技術(shù)有問(wèn)必答》一書(shū)中,「智能相對(duì)論」向其提問(wèn)“夏季高溫提問(wèn)應(yīng)該如何飼養(yǎng)母豬?”很快就得到了書(shū)中的精煉解答。

      這意味著什么?只要用戶有足夠多的專業(yè)書(shū)籍“投喂”給大模型,那么大模型就可以成長(zhǎng)為一個(gè)專業(yè)的專家助理,幫助用戶快速解答相關(guān)專業(yè)問(wèn)題。

      在日常生活中,或許有很多書(shū)籍是我們沒(méi)辦法去仔細(xì)閱讀和學(xué)習(xí)的,但是只要有長(zhǎng)文本大模型予以支持,那么基本上人人都能創(chuàng)造一個(gè)專業(yè)的垂直領(lǐng)域助理。

      這或許會(huì)顛覆現(xiàn)在我們獲取信息、知識(shí)的渠道,去百度搜索或是去知乎提問(wèn)、亦或是去小紅書(shū)討論這些路徑都將被替代。

      在Kimi開(kāi)放20萬(wàn)字文本處理能力的時(shí)候,其做了一個(gè)簡(jiǎn)單的對(duì)比,20萬(wàn)字等于什么?答案是等于先秦的全部古籍。隨著長(zhǎng)文本大模型進(jìn)入百萬(wàn)量級(jí)的迭代,那么這些能力還能實(shí)現(xiàn)進(jìn)一步的進(jìn)化,對(duì)應(yīng)所賦予場(chǎng)景應(yīng)用的機(jī)會(huì)就是無(wú)限的。

      如今,在AI領(lǐng)域,Agent的話題也很火,被認(rèn)為是下一個(gè)主流的應(yīng)用形態(tài)。那么,打造Agent的關(guān)鍵是什么?答案正是大模型的長(zhǎng)文本處理能力。

      比如,Kimi就在幫助元隆雅圖等公司進(jìn)行營(yíng)銷升級(jí),基于長(zhǎng)文本處理能力來(lái)提供爆品文案分析、文案寫作、市場(chǎng)分析、輔助營(yíng)銷策劃等功能。

      盡管現(xiàn)在很多相關(guān)的應(yīng)用還處在探索階段,但是誰(shuí)又能確定下一個(gè)爆款應(yīng)用不是出自自家的大模型+某個(gè)C端用戶的想法/某個(gè)企業(yè)客戶的業(yè)務(wù)融合?正因如此,大模型廠商們才不顧一切的升級(jí)并開(kāi)放長(zhǎng)文本功能,為下一場(chǎng)應(yīng)用上的爆火做準(zhǔn)備。

      目前,長(zhǎng)本文的火爆還只是技術(shù)上的,接下來(lái)的爆點(diǎn)大概率將是應(yīng)用上的爆發(fā)。

      03 寫在最后

      2024年是大模型大規(guī)模走向商業(yè)化的關(guān)鍵一年。從Kimi的火爆程度來(lái)看,以長(zhǎng)文本為代表的技術(shù)迭代走向C端引發(fā)了非常積極的反饋。同時(shí),在「智能相對(duì)論」的實(shí)踐中,也預(yù)感這一能力隨著技術(shù)的成熟和完善,必然會(huì)在C端用戶的手中被“玩出花來(lái)”。

      只是目前很多的“玩法”還缺乏打磨,顯得比較粗糙。OpenAI在發(fā)布GPT商店時(shí),就期望要打造一個(gè)全新的生態(tài),人人都能創(chuàng)造自己的專屬GPTs。

      現(xiàn)在,擺在大眾面前的長(zhǎng)文本熱潮,其實(shí)就是一個(gè)全民時(shí)代到來(lái)的信號(hào)。只要用戶有書(shū),會(huì)投喂,那么同樣可以在國(guó)內(nèi)的大模型平臺(tái)上打造出屬于自己想要的專業(yè)助理,進(jìn)而延伸到應(yīng)用端的火爆。

      當(dāng)然,在這個(gè)過(guò)程中,書(shū)籍的版權(quán)問(wèn)題、平臺(tái)的審核問(wèn)題以及巨大的流量涌入所帶來(lái)的諸多挑戰(zhàn)和問(wèn)題,也是大模型走向商業(yè)化的難點(diǎn)。但是,其根本的方向是清晰的,Long-LLM(長(zhǎng)文本大模型)時(shí)代已經(jīng)拉開(kāi)序幕,從技術(shù)到應(yīng)用,接下來(lái)大模型廠商們有得卷了。

      說(shuō)實(shí)在,就目前各大廠商公布的參數(shù),從500萬(wàn)到1000萬(wàn),基本上也足夠用了。大模型在長(zhǎng)文本技術(shù)層面或許不會(huì)再有什么值得卷了,哪怕是有也只是背地里正常迭代和發(fā)展。

      接下來(lái)的爆點(diǎn)只能是往應(yīng)用層面來(lái)看。不管是To C還是To B,誰(shuí)家的平臺(tái)最先把大眾化的應(yīng)用探索并驗(yàn)證出來(lái),再加以打磨推向大眾市場(chǎng),那么誰(shuí)就有可能成為下一個(gè)市場(chǎng)的寵兒。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。