京東攜手海爾發(fā)布小紅花系列新品 引領(lǐng)智能家電新趨勢(shì)惠普暗影精靈MAX游戲本上架:高性能配置與散熱優(yōu)化英雄聯(lián)盟聯(lián)名金士頓 NV3 固態(tài)硬盤發(fā)布機(jī)械師曙光16 Pro游戲本發(fā)布 搭載AMD銳龍9 7945HX 和 RTX 5080顯卡加速數(shù)字化轉(zhuǎn)型 富士膠片商業(yè)創(chuàng)新6款新Apeos旗艦智能型A3彩色數(shù)碼多功能機(jī)上市機(jī)器人必須是「人形」嗎?2025年央視3·15晚會(huì)主題發(fā)布:將曝光食品添加、互聯(lián)網(wǎng)盜取個(gè)人數(shù)據(jù)信息源頭何小鵬:小鵬智駕每年砸?guī)资畠|建算力中心 普通公司沒數(shù)據(jù)也沒錢拼不過京東方:預(yù)計(jì)第8.6代AMOLED生產(chǎn)線2026年底量產(chǎn)無人車頻繁遇違停難題,Waymo去年在舊金山吃到近600張罰單消息稱蘋果華為平板電腦去年Q4在國(guó)內(nèi)市場(chǎng)出貨量同比均有下滑 但仍排在前兩位315關(guān)注:國(guó)檢曝光網(wǎng)購(gòu)家電質(zhì)量問題,平臺(tái)莫縱容偽劣家電泛濫空調(diào)子品牌2025很活躍:格力用晶弘打天下,美的系華凌求變化微軟云服務(wù)本月頻繁中斷 專家推測(cè)罪魁禍?zhǔn)资锹┒?/a>微軟承認(rèn)Win11 / Win10新版Outlook問題:點(diǎn)擊“返回經(jīng)典版”按鈕后應(yīng)用崩潰3GPP 首次 6G 研討會(huì)召開,華為、vivo、中國(guó)移動(dòng)、中國(guó)電信等企業(yè)人員入選新一屆領(lǐng)導(dǎo)層微信官方:超過 1/4 用戶置頂“文件傳輸助手”百億補(bǔ)貼下的灰產(chǎn)漩渦:華強(qiáng)北后封機(jī)、翻新機(jī)流入電商平臺(tái)摩根大通編程助手提升效率 AI賦能業(yè)務(wù)增長(zhǎng)今年315,汽車行業(yè)的三大“雷區(qū)”猜想——電池、智駕和孤兒車
  • 垂類AI率先引爆行業(yè)!AI終于開始解決實(shí)際問題了

    2025年03月14日 15:48:33   來源:雷科技

       最近,一款名為Manus的產(chǎn)品頗受爭(zhēng)議。

      Manus是什么,它怎么突然就火了?從官網(wǎng)展示的demo來看,Manus主打的是針對(duì)某場(chǎng)景的實(shí)際應(yīng)用,比如可以深度體驗(yàn)產(chǎn)品并制作調(diào)研報(bào)告,再比如可以批量處理面試簡(jiǎn)歷并打分排名。

      先不管Manus的爭(zhēng)議如何,它的出現(xiàn)能導(dǎo)致刷屏,正好說明了AI領(lǐng)域的一個(gè)新趨勢(shì):AI的發(fā)展不再盲目追求規(guī)模,而是開始深入挖掘?qū)嶋H價(jià)值。

      無獨(dú)有偶,Manus智能體橫空出世后,OpenAI緊跟放大招,推出開發(fā)者工具鏈簡(jiǎn)化智能體開發(fā),幫助開發(fā)人員和企業(yè)構(gòu)建有用且可靠的AI智能體。OpenAI首席產(chǎn)品官凱文威爾直言:“2025年將是智能體真正發(fā)揮作用的一年。到2025年,ChatGPT將開始在現(xiàn)實(shí)世界中為你做事。”

      這也讓我們看到了AI領(lǐng)域的一個(gè)根本性變化:過去AI追求通用的廣泛能力,現(xiàn)在則更聚焦于在特定垂直領(lǐng)域解決具體問題。

      AI領(lǐng)域重心出現(xiàn)轉(zhuǎn)移,市場(chǎng)開始聚焦垂類應(yīng)用

      這個(gè)發(fā)展路徑并不意外,從歷史上看,科技行業(yè)的變革往往遵循一定的階段性規(guī)律。以互聯(lián)網(wǎng)時(shí)代為例,最初是那些“賦能者”受益,比如半導(dǎo)體公司,然后進(jìn)入基礎(chǔ)設(shè)施的層面,包括云計(jì)算、設(shè)備和電力供應(yīng)相關(guān)的企業(yè),最后才是應(yīng)用和服務(wù)層面,比如抖音、微信、美團(tuán)等,大部分的價(jià)值都會(huì)在應(yīng)用推廣后釋放出來。

      這個(gè)思路放在AI時(shí)代同樣適用,通用大模型建立了基礎(chǔ)設(shè)施,最后真正實(shí)現(xiàn)AI價(jià)值的,是基于通用大模型所衍生出來的垂類模型。

      有兩個(gè)場(chǎng)景可以充分證明,一是醫(yī)療行業(yè),二是翻譯行業(yè)。

      雖然人工智能已經(jīng)落地醫(yī)療多場(chǎng)景,但當(dāng)前醫(yī)學(xué)領(lǐng)域的專用垂類模型和以DeepSeek為代表的通用大模型還有很大區(qū)別。以藥物研發(fā)為例,據(jù)新華財(cái)經(jīng)報(bào)道,多家生物醫(yī)藥企業(yè)表示,當(dāng)前通用大模型對(duì)藥物研發(fā)的直接賦能仍然有限。

      藥物研發(fā)目前還是依靠垂類模型。通用模型和垂類模型的差別主要取決于兩個(gè)方面,一個(gè)是訓(xùn)練數(shù)據(jù)源的差異,另一個(gè)是反饋機(jī)制的差異。通用模型可用數(shù)據(jù)是龐大的、易獲得的;專有模型訓(xùn)練用的數(shù)據(jù)是有較高質(zhì)量要求的、精準(zhǔn)的。

      再以AI翻譯市場(chǎng)為例,不可否認(rèn)的是,對(duì)于文字轉(zhuǎn)譯這種簡(jiǎn)單翻譯需求,其實(shí)大模型都能滿足,但具有專業(yè)難度、容錯(cuò)率低的翻譯需求,卻往往會(huì)讓我們對(duì)大模型持更大的懷疑態(tài)度,在準(zhǔn)確性、專業(yè)性、安全合規(guī)性上,試錯(cuò)成本太高,因此最后還是要求助專業(yè)工具。

      即便強(qiáng)如DeepSeek,有時(shí)候也會(huì)在回答結(jié)果上進(jìn)行“思維涌現(xiàn)”,可能會(huì)出現(xiàn)在文字上生造概念,堆疊名詞,濫用修辭的現(xiàn)象。簡(jiǎn)單來說就是會(huì)畫蛇添足。這種自作主張對(duì)某個(gè)詞語的“優(yōu)化”,在專業(yè)場(chǎng)景中具有致命性,特別是在重要場(chǎng)合,或者醫(yī)藥翻譯上,錯(cuò)誤代價(jià)太高。

      而且,DeepSeek有時(shí)候存在胡編亂造的可能,比如最典型的是在舉例的時(shí)候,很容易自己異想天開。比如以下例子,著實(shí)讓人貽笑大方。

      圖源:DeepSeek

      在需要精準(zhǔn)度的專業(yè)領(lǐng)域,通用大模型其引以為傲的"涌現(xiàn)能力"反而成為風(fēng)險(xiǎn)源頭。當(dāng)技術(shù)進(jìn)入實(shí)際產(chǎn)業(yè)應(yīng)用階段時(shí),建立精準(zhǔn)的數(shù)據(jù)和場(chǎng)景適配,比單純?cè)黾幽P蛥?shù)更有意義。

      因此現(xiàn)在我們能夠看到的一大趨勢(shì)就是,2025年市場(chǎng)的焦點(diǎn)轉(zhuǎn)向垂類AI應(yīng)用。

      專業(yè)工具想要擁抱AI,垂類模型是最好的選擇

      如果說2024年的主角是通用大模型,那2025年的主角絕對(duì)是小參數(shù)的垂類模型。

      當(dāng)業(yè)界還在熱議 DeepSeek-R1 開源戰(zhàn)略對(duì) AI 生態(tài)的重構(gòu)、持續(xù)探討 Manus 智能 Agent 的技術(shù)突破時(shí),國(guó)產(chǎn)大模型已在垂直賽道實(shí)現(xiàn)關(guān)鍵性跨越。

      3 月 11 日,網(wǎng)易有道宣布完成翻譯底層技術(shù)迭代,基于自主研發(fā)的子曰翻譯大模型 2.0,在測(cè)試中實(shí)現(xiàn)翻譯質(zhì)量超越國(guó)內(nèi)外主流通用大模型,達(dá)行業(yè)第一。

      我們也實(shí)測(cè)了一下,發(fā)現(xiàn)在很多專業(yè)領(lǐng)域的翻譯中,有道大模型翻譯確實(shí)領(lǐng)先于市面上主流的通用大模型。

      比如兩者分別輸入:“After the 52-week trial period, patients entered a 12-week follow-up safety period during which they were no longer receiving dupilumab or placebo。”對(duì)比其翻譯結(jié)果。

      可以看到,DeepSeek無法將“dupilumab”進(jìn)行本土化翻譯,仍是以英文的方式呈現(xiàn),而有道詞典則是準(zhǔn)確將“dupilumab”翻譯為度普利尤單抗。

      另外,DeepSeek把“trial period”翻譯成了“治療期”,而正確的翻譯應(yīng)該是有道詞典的“試驗(yàn)期”。

      我不確定在醫(yī)療場(chǎng)景下,“治療期”與“試驗(yàn)期”的差別是什么,但僅從語義來看,兩者顯然會(huì)讓非醫(yī)學(xué)專業(yè)的同學(xué)產(chǎn)生誤會(huì)。

      類似的例子還有很多,比如曾有通用大模型將臨床試驗(yàn)報(bào)告中的"placebo effect"(安慰劑效應(yīng))誤譯為"愉悅效應(yīng)",仲裁案中,法律文件里的"force majeure"(不可抗力)被譯成"主要力量";再比如某并購(gòu)協(xié)議中的“joint and several liability”(連帶責(zé)任)被翻譯為“聯(lián)合與單獨(dú)責(zé)任”,引發(fā)合同雙方對(duì)責(zé)任范圍的重大誤解,最終需人工律師介入修正。

      圖源:小紅書

      之所以有道大模型翻譯的質(zhì)量能做到比主流通用大模型高,背后就是垂類大模型的驅(qū)動(dòng)。

      2023年7月,網(wǎng)易有道推出國(guó)內(nèi)首個(gè)教育大模型“子曰”,“子曰”大模型從一開始就定位為是一個(gè)“場(chǎng)景為先”的教育垂類大模型,相比于通用大模型,教育垂類大模型子曰擁有更專業(yè)的預(yù)訓(xùn)練語料,可以滿足用戶在不同場(chǎng)景下的學(xué)習(xí)需求。

      目前子曰翻譯大模型已經(jīng)來到了2.0階段,這背后,有道從數(shù)據(jù)、算法和效果評(píng)估三個(gè)核心環(huán)節(jié)入手,進(jìn)行了全面的優(yōu)化和升級(jí)。

      在數(shù)據(jù)層面,有道精心收集了并嚴(yán)格清洗了數(shù)千萬高質(zhì)量的翻譯數(shù)據(jù),并由英語專八認(rèn)證人員及職業(yè)譯員組成的專家團(tuán)隊(duì)進(jìn)行多維度人工標(biāo)注,保證訓(xùn)練數(shù)據(jù)的高質(zhì)量。極大豐富了數(shù)據(jù)資源庫,讓模型在多樣化翻譯場(chǎng)景中游刃有余。

      在算法層面,有道子曰翻譯大模型實(shí)現(xiàn)了兩大技術(shù)突破,分別是大模型融合與Online DPO。

      簡(jiǎn)單來說,大模型融合就是像“專家會(huì)診”一樣翻譯,相當(dāng)于有道子曰翻譯大模型如同組建了“全科專家團(tuán)”。使用大模型融合技術(shù),通過結(jié)合不同大模型的優(yōu)勢(shì)來避免災(zāi)難性遺忘現(xiàn)象,確保模型在保持翻譯能力的同時(shí),也不失綜合能力。

      而Online DPO則可以理解成翻譯界的"養(yǎng)成計(jì)劃",每次訓(xùn)練生成一優(yōu)一劣兩個(gè)譯文,讓模型學(xué)習(xí)更高質(zhì)量的譯文,通過3輪對(duì)比淘汰機(jī)制強(qiáng)化模型的判斷力,自動(dòng)標(biāo)注翻譯偏好數(shù)據(jù)。經(jīng)過海選→晉級(jí)→決賽三輪嚴(yán)格篩選,最終留下的都是"全能翻譯"。

      在評(píng)估層面,有道團(tuán)隊(duì)人工標(biāo)注了覆蓋各個(gè)領(lǐng)域的開發(fā)集和盲測(cè)集,嚴(yán)格確保了測(cè)試數(shù)據(jù)的全面性和代表性。對(duì)算法團(tuán)隊(duì)所使用的開發(fā)集和盲測(cè)數(shù)據(jù)集實(shí)行嚴(yán)格分離、相互獨(dú)立,以確保評(píng)估的客觀性與準(zhǔn)確性,模型最終效果以盲測(cè)集效果為準(zhǔn)。

      在自動(dòng)評(píng)估方面,有道不僅使用行業(yè)通用的Comet指標(biāo),還自主研發(fā)了更精準(zhǔn)的大模型評(píng)估工具,進(jìn)一步提升了翻譯質(zhì)量檢測(cè)的可靠性。同時(shí)設(shè)計(jì)并執(zhí)行了更完善的人工評(píng)估方案,從多維度對(duì)模型的翻譯結(jié)果進(jìn)行細(xì)致地分析和評(píng)價(jià)。

      正是通過這三個(gè)層面的全方位優(yōu)化與升級(jí),有道用一個(gè)小參數(shù)模型就能實(shí)現(xiàn)超越通用大模型的翻譯質(zhì)量。而這樣的故事,在2025年還會(huì)涌現(xiàn)更多。

      AI的價(jià)值,在于解決了多少實(shí)際問題

      科技發(fā)展的核心就是解決問題,F(xiàn)在大家越來越清楚:到2025年,各種專業(yè)領(lǐng)域的AI工具會(huì)迎來大爆發(fā)。

      根據(jù)市場(chǎng)研究機(jī)構(gòu)MarketsandMarkets的最新報(bào)告,垂類AI應(yīng)用的市場(chǎng)規(guī)模預(yù)計(jì)將從去年51億美元大幅擴(kuò)張至2030年的大約471億美元,到2032年還可能超過1000億美元。

      在這樣的大背景下,以有道為代表的專業(yè)翻譯工具具有標(biāo)桿意義。這場(chǎng)垂類AI革命給予行業(yè)的最大啟示,或許在于對(duì)技術(shù)本質(zhì)的重新認(rèn)知:AI的價(jià)值不在于參數(shù)多少,而在于解決了多少實(shí)際問題。

      當(dāng)科技巨頭還在為"萬億俱樂部"的門票廝殺時(shí),那些在垂直領(lǐng)域默默耕耘的“有道”們,正在用更精巧的模型、更專注的投入,撬動(dòng)百倍于通用模型的實(shí)際價(jià)值。這種"少即是多"的策略,或許才是穿越AI時(shí)代的真正指南針。

      站在2025年的技術(shù)分水嶺回望,我們會(huì)發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象:當(dāng)通用大模型試圖用規(guī)模征服世界時(shí),專業(yè)工具正在用深度重新定義邊界。其中,有道大模型翻譯就是一個(gè)將AI與實(shí)際應(yīng)用結(jié)合的極佳典范。

      這不僅是技術(shù)的勝利,更是對(duì)產(chǎn)業(yè)規(guī)律最深刻的敬畏:在任何領(lǐng)域,專業(yè)主義永遠(yuǎn)是不可替代的稀缺品。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。