來京東參與榮耀Magic7 RSR 保時(shí)捷設(shè)計(jì)預(yù)售 享365天只換不修國補(bǔ)期間電視迎來換機(jī)潮,最暢銷MiniLED品牌花落誰家?美團(tuán)旗下微信社群團(tuán)購業(yè)務(wù)“團(tuán)買買”宣布年底停運(yùn)消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機(jī)設(shè)備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項(xiàng)健康功能,包括心率監(jiān)測和溫度感應(yīng)一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗(yàn)東芝全部業(yè)務(wù)實(shí)現(xiàn)盈利,退市裁員重組后終于賺錢真我14 Pro+開始提上日程:1.5K等深四微曲屏+潛望長焦穩(wěn)了消息稱本田和日產(chǎn)計(jì)劃明年6月前敲定合并協(xié)議 2026年8月成立控股公司凱迪拉克最新版OTA開啟推送,新增百度語音大模型和QQ音樂等應(yīng)用中國聯(lián)通11月5G套餐用戶凈增127.8萬戶5G確定性工業(yè)基站首商用,工業(yè)互聯(lián)網(wǎng)走上新高度李飛飛團(tuán)隊(duì)前瞻性研究 多模態(tài)AI模型初顯空間智能AI終于邁過這道檻!Livekit 開源模型精準(zhǔn)識別“你是否說完”!DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/a>廣汽詳解旗下首款復(fù)合翼飛行汽車 GOVY AirJet:最高飛行速度可達(dá) 250km/h清華大學(xué)聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroES
  • 首頁 > 云計(jì)算頻道 > 大模型

    超越眾多開源模型 諾諦智能拿下C-MTEB榜單第一

    2024年06月13日 11:25:18   來源:中文科技資訊

      近日,諾諦智能“支點(diǎn)”向量模型憑借多樣化困難樣本采樣策略以及基于“支點(diǎn)”大模型的數(shù)據(jù)合成,超越眾多開源模型,拿下主流權(quán)威評測C-MTEB榜單排名第一。

    圖片 1.png

      MTEB(Massive Text Embedding Benchmark)是用于評估文本嵌入模型的一系列評估指標(biāo)的集合,對應(yīng)的C-MTEB則被公認(rèn)為是目前業(yè)界最全面、最權(quán)威的中文語義向量評測基準(zhǔn)之一,涵蓋了分類、聚類、檢索、排序、文本相似度、STS等6個經(jīng)典任務(wù),共計(jì)35個數(shù)據(jù)集,為深度測試中文語義向量的全面性和可靠性提供了可靠的實(shí)驗(yàn)平臺,眾多行業(yè)領(lǐng)先的開源模型都會參與評測,榜單競爭激烈。

      此次獲得C-MTEB榜單排名第一的諾諦“支點(diǎn)”向量模型,采用了多樣化困難樣本采樣策略,其針對分類和聚類、檢索、排序以及句對匹配任務(wù)設(shè)計(jì)了不同的困難樣本選擇策略。同時(shí)該模型還采用了基于諾諦“支點(diǎn)”行業(yè)大模型的數(shù)據(jù)合成,通過多樣化的數(shù)據(jù)合成策略對分類、聚類、句對匹配樣本進(jìn)行重寫,為每個樣本構(gòu)造出多個合成樣本,并針對檢索和排序任務(wù)對問題和文章同時(shí)進(jìn)行增強(qiáng),可生成多個檢索問題。此外,對于不同場景的檢索任務(wù),“支點(diǎn)”向量模型還設(shè)計(jì)了多樣化損失函數(shù),結(jié)合梯度累積策略以及數(shù)據(jù)調(diào)度策略,最終使諾諦“支點(diǎn)”向量模型在分類、聚類、句對匹配、檢索、排序任務(wù)上的性能大幅提升。

      在實(shí)際應(yīng)用中,“支點(diǎn)”向量模型為了滿足不同業(yè)務(wù)實(shí)際場景對向量的差異化需求,在訓(xùn)練過程中引入了MRL技術(shù),可根據(jù)指定維度的向量計(jì)算多個附加損失,使其可以輸出不同維度的向量用于下游任務(wù),進(jìn)一步提升實(shí)際業(yè)務(wù)場景下分類、聚類、檢索、排序、文本相似度等任務(wù)的AI能力。

      而作為大模型的最主要應(yīng)用場景之一,RAG技術(shù)需要配合大模型和向量模型來落地,而諾諦開源了行業(yè)頂尖中文RAG場景向量模型,在為AI領(lǐng)域的持續(xù)創(chuàng)新提供助力的同時(shí),也可以賦能更多制造企業(yè)實(shí)現(xiàn)智能化升級。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. X048]
    分享到微信

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。