上半年中國(guó)AR/VR出貨23.3萬臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開放革命性AI對(duì)話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國(guó)際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?
  • 首頁(yè) > 數(shù)據(jù)存儲(chǔ)頻道 > 數(shù)據(jù)庫(kù)頻道 > 數(shù)據(jù)庫(kù)

    向量數(shù)據(jù)庫(kù)王冠易主!李開復(fù)的零一萬物支棱起來了

    2024年03月15日 16:42:06   來源:OFweek人工智能網(wǎng)

      3 月 11 日,龍?zhí)ь^之日,零一萬物宣布成功研發(fā)其基于全導(dǎo)航圖技術(shù)打造的新型向量數(shù)據(jù)庫(kù)“笛卡爾(Descartes)”,并包攬權(quán)威榜單 ANN-Benchmarks 的 6 項(xiàng)數(shù)據(jù)集評(píng)測(cè)第一名。

      這標(biāo)志著向量數(shù)據(jù)庫(kù)排行榜的頭號(hào)交椅再次易主。

      笛卡爾包攬 6 項(xiàng)第一

      向量數(shù)據(jù)庫(kù),又被稱為 AI 時(shí)代的信息檢索技術(shù),是檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)內(nèi)核技術(shù)之一。

      ANN-Benchmarks 是當(dāng)下業(yè)界最權(quán)威的向量數(shù)據(jù)庫(kù)性能測(cè)試工具,它可以展示不同算法在不同真實(shí)數(shù)據(jù)集下的表現(xiàn)。

      在 ANN-Benchmarks 離線測(cè)試中,零一萬物笛卡爾(Descartes)向量數(shù)據(jù)庫(kù)登頂 6 份數(shù)據(jù)集評(píng)測(cè)第一名,比之前榜單上同業(yè)第一名有顯著性能提升,部分?jǐn)?shù)據(jù)集上的性能提升甚至超過 2 倍以上。

      由圖可見,零一萬物向量數(shù)據(jù)庫(kù)在 6 份評(píng)測(cè)數(shù)據(jù)集中都位于最高,曲線位置越偏右上角意味著算法性能越好,笛卡爾包攬 6 項(xiàng)第一。

      此前,榜單里六個(gè)數(shù)據(jù)集的榜首分屬于兩家廠商,而笛卡爾的包攬結(jié)束了這種“分庭抗禮”的局面,成為了大一統(tǒng)的“新王”。

      關(guān)于零一萬物

      零一萬物,是 2023 年初由李開復(fù)創(chuàng)辦的 AI 公司。零一萬物已經(jīng)獲得數(shù)輪融資,估值已超 10 億美元,躋身 AI 2.0 獨(dú)角獸行列。

      大家對(duì)李開復(fù)也并不陌生。計(jì)算機(jī)科學(xué)家出身,他的職業(yè)生涯起步于硅谷,先后任職于微軟、谷歌等,后來創(chuàng)立了創(chuàng)新工場(chǎng),以投資 AI 為人熟知。

      零一萬物聚集的技術(shù)團(tuán)隊(duì)實(shí)力彪悍。團(tuán)隊(duì)成員涉及大模型技術(shù)、人工智能算法、自然語(yǔ)言處理、系統(tǒng)架構(gòu)、算力架構(gòu)、數(shù)據(jù)安全、產(chǎn)品研發(fā)等領(lǐng)域。聯(lián)創(chuàng)團(tuán)隊(duì)成員包含前阿里巴巴副總裁、前滴滴/百度首席算法負(fù)責(zé)人、前谷歌中國(guó)高管、前微軟/SAP/Cisco/副總裁,算法和產(chǎn)品團(tuán)隊(duì)背景均來自國(guó)內(nèi)外大廠。

      2023 年 11 月,零一萬物曾發(fā)布首款開源中英雙語(yǔ)大模型“Yi”。

      背后的技術(shù)揭秘

      回歸本次主題。RAG 向量檢索主要解決兩大問題:一,分別是通過建立某種索引結(jié)構(gòu),減少檢索考察的候選集。二、降低單個(gè)向量計(jì)算的復(fù)雜度。

      對(duì)于第一個(gè)問題,零一萬物團(tuán)隊(duì)給出量大策略:

      全導(dǎo)航圖技術(shù)。零一萬物研發(fā)的全局多層縮略圖導(dǎo)航技術(shù),圖上坐標(biāo)系導(dǎo)航,既能保證精度,又能裁剪大量無關(guān)向量。

      自適應(yīng)鄰居選擇策略,填補(bǔ)業(yè)界空白。零一萬物自研的自適應(yīng)鄰居選擇新策略,使每個(gè)節(jié)點(diǎn)可以根據(jù)自身及鄰居的分布特征動(dòng)態(tài)地選取最佳鄰居邊,更快收斂接近目標(biāo)向量,從而讓 RAG 向量檢索性能提高 15%-30%。

      對(duì)于“降低單個(gè)向量計(jì)算的復(fù)雜度”的問題,零一萬物采用了兩級(jí)量化方案增強(qiáng) RAG。

      通過用兩級(jí)量化降低計(jì)算復(fù)雜度,同時(shí)列式存儲(chǔ)充分利用 SIMD 的并發(fā)能力,進(jìn)一步發(fā)揮硬件能力,相比傳統(tǒng) PQ 查表,性能得到大幅提升到 2-3 倍。

      還有索引結(jié)構(gòu)優(yōu)化、連通性保障等全棧向量技術(shù)方案提高笛卡爾向量數(shù)據(jù)庫(kù)的性能。

      解決大模型當(dāng)下缺陷

      對(duì)大模型應(yīng)用開發(fā)者來說,向量數(shù)據(jù)庫(kù)是非常重要的基礎(chǔ)設(shè)施,在一定程度上影響著大模型的性能表現(xiàn)。

      比如,向量數(shù)據(jù)庫(kù)能精準(zhǔn)解決大模型當(dāng)前階段下的重要問題:

      實(shí)時(shí)信息:大模型無法反應(yīng)最新的信息。向量數(shù)據(jù)庫(kù)采用輕量化更新機(jī)制,可以快速補(bǔ)充最新信息。

      隱私保護(hù):用戶的安全隱私數(shù)據(jù)有泄密風(fēng)險(xiǎn)。向量數(shù)據(jù)通過在推理階段扮演信息傳遞的中間載體,破解了隱私保護(hù)的難關(guān)。

      幻覺矯正:大模型常推理失真或產(chǎn)生幻覺。向量數(shù)據(jù)庫(kù)提供的豐富知識(shí)參照,有效矯正和減輕此類問題。

      推理高效:大模型推理成本高,向量數(shù)據(jù)庫(kù)能夠作為一種緩存機(jī)制,避免每一次查詢請(qǐng)求都需要重新執(zhí)行復(fù)雜的推理計(jì)算,節(jié)省計(jì)算資源。

      伴隨 AI 熱風(fēng),向量數(shù)據(jù)庫(kù)創(chuàng)業(yè)公司也異軍突起。比如,2023 年,OpenAI 的向量數(shù)據(jù)庫(kù)合作方 Pinecone 完成了 B 輪 1.38 億美元融資,國(guó)內(nèi)初創(chuàng)企業(yè) Fabarta ArcNeural 也完成了上億元 Pre-A 輪融資。

      笛卡爾將在近期亮相AI產(chǎn)品中

      關(guān)于數(shù)據(jù)的重要性,有個(gè)十分形象的比喻:信息時(shí)代的數(shù)據(jù),就是工業(yè)時(shí)代的石油。未來,向量數(shù)據(jù)庫(kù),將成為決定大模型天花板的關(guān)鍵要素。

      零一萬物笛卡爾向量數(shù)據(jù)庫(kù)目前聚焦于高性能向量數(shù)據(jù)庫(kù),在實(shí)際應(yīng)用場(chǎng)景中具備超高精度、超高性能核心優(yōu)勢(shì)。

      超高精度:基于多層縮略圖和坐標(biāo)系實(shí)現(xiàn)層間導(dǎo)航和圖上方位導(dǎo)航,以及圖連通性保障,實(shí)現(xiàn)精度大于 99%,相同性能下,精度大幅領(lǐng)先業(yè)內(nèi)水平。

      超高性能:高效的邊選擇和裁剪技術(shù),千萬數(shù)據(jù)庫(kù) ms 響應(yīng)。

      具體來說,高性能向量數(shù)據(jù)庫(kù)可以幫助企業(yè)客戶構(gòu)建私域知識(shí)庫(kù)、智能客服系統(tǒng);在自動(dòng)駕駛領(lǐng)域,使用高性能向量數(shù)據(jù)庫(kù)可來加速自動(dòng)駕駛模型訓(xùn)練等。

      零一萬物表示,笛卡爾向量數(shù)據(jù)庫(kù)將用在近期即將正式亮相的 AI 產(chǎn)品中,未來也將結(jié)合工具提供給開發(fā)者。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。