合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗全面升級機器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機器也能說人話了?
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù)庫頻道 > 編程開發(fā)

    在 Azure 認知服務(wù)中使用矢量搜索構(gòu)建 LLM 應(yīng)用程序

    2023年08月23日 19:08:29   來源:51CTO

      作者 | Simon Bisson

      Microsoft 的認知搜索 API 現(xiàn)在提供矢量搜索即服務(wù),可與 Azure OpenAI 等中的大型語言模型一起使用。

      Semantic Kernel、TypeChat 和 LangChain 等工具使得圍繞 Azure OpenAI 等生成式 AI 技術(shù)構(gòu)建應(yīng)用程序成為可能。這是因為它們允許對底層大語言模型 (LLM) 施加約束,將其用作構(gòu)建和運行自然語言界面的工具。

      從本質(zhì)上講,LLM 是一種用于導航語義空間的工具,其中深度神經(jīng)網(wǎng)絡(luò)可以預測從初始提示開始的標記鏈中的下一個音節(jié)。如果提示是開放式的,LLM 可能會超出其輸入范圍,產(chǎn)生看似合理但實際上完全是無稽之談的內(nèi)容。

      正如大家傾向于信任搜索引擎的輸出一樣,我們也傾向于信任LLM的輸出,因為我們將它們視為熟悉技術(shù)的另一個方面。但是,使用來自維基百科、Stack Overflow 和 Reddit 等網(wǎng)站的可信數(shù)據(jù)來訓練大型語言模型并不能傳達對內(nèi)容的理解;它只是賦予生成文本的能力,該文本遵循與這些來源中的文本相同的模式。有時輸出可能是正確的,但有時卻是錯誤的。

      我們?nèi)绾伪苊獯笮驼Z言模型的錯誤和無意義的輸出,并確保我們的用戶獲得準確且合理的查詢答案?

      1、限制用語義記憶約束大模型

      我們需要做的是限制 LLM,確保它只從更小的數(shù)據(jù)集生成文本。這就是 Microsoft 基于 LLM 的新開發(fā)堆棧的用武之地。它提供了必要的工具來控制模型并防止其產(chǎn)生錯誤。

      你可以通過使用 TypeChat 之類的工具來強制使用特定的輸出格式,或者使用 Semantic Kernel 之類的編排管道來處理其他可信信息源,從而有效地將模型“root”在已知的語義空間中,從而約束 LLM。在這里,LLM 可以做它擅長的事情,總結(jié)構(gòu)建的提示并根據(jù)該提示生成文本,而不會超限(或至少顯著減少發(fā)生超限的可能性)。

      微軟所說的“語義記憶”是最后一種方法的基礎(chǔ)。語義記憶使用向量搜索來提供提示,可用于提供 LLM 的事實輸出。矢量數(shù)據(jù)庫管理初始提示的上下文,矢量搜索查找與初始用戶查詢匹配的存儲數(shù)據(jù),LLM 根據(jù)該數(shù)據(jù)生成文本。Bing Chat 中看到這種方法的實際應(yīng)用,它使用 Bing 的本機矢量搜索工具來構(gòu)建從其搜索數(shù)據(jù)庫中獲取的答案。

      語義記憶使矢量數(shù)據(jù)庫和矢量搜索成為提供基于LLM的應(yīng)用程序的手段。你可以使用數(shù)量不斷增加的開源矢量數(shù)據(jù)庫中的任何一個,或?qū)⑹噶克饕砑拥绞煜さ?SQL 和 NoSQL 數(shù)據(jù)庫中。一項看起來特別有用的新產(chǎn)品擴展了 Azure 認知搜索,為數(shù)據(jù)添加了向量索引以及用于查詢該索引的新 API。

      2、將矢量索引添加到 Azure 認知搜索

      Azure 認知搜索建立在 Microsoft 自己的搜索工具基礎(chǔ)上,提供了熟悉的 Lucene 查詢和自己的自然語言查詢工具的組合。Azure 認知搜索是一個軟件即服務(wù)平臺,托管私有數(shù)據(jù)并使用認知服務(wù) API 來訪問內(nèi)容。Microsoft 最近添加了對構(gòu)建和使用向量索引的支持,允許你使用相似性搜索對數(shù)據(jù)中的相關(guān)結(jié)果進行排名,并在基于 AI 的應(yīng)用程序中使用它們。這使得 Azure 認知搜索成為使用 Semantic Kernel 和 Azure OpenAI 構(gòu)建的 Azure 托管 LLM 應(yīng)用程序的理想工具,并帶有用于C# 和 Python認知搜索的語義內(nèi)核插件。

      與所有 Azure 服務(wù)一樣,Azure 認知搜索是一項托管服務(wù),可與其他 Azure 服務(wù)配合使用,允許你在各種 Azure 存儲服務(wù)中進行索引和搜索,托管文本和圖像以及音頻和視頻。數(shù)據(jù)存儲在多個區(qū)域,提供高可用性并減少延遲和響應(yīng)時間。作為一個額外的好處,對于企業(yè)應(yīng)用程序,你可以使用Microsoft Entra ID(Azure Active Directory 的新名稱)來控制對私有數(shù)據(jù)的訪問。

      3、為內(nèi)容生成和存儲嵌入向量

      需要注意的一點是,Azure 認知搜索是一項“自帶嵌入向量”服務(wù)。認知搜索不會為你生成所需的矢量嵌入,因此你必須使用 Azure OpenAI 或 OpenAI embedding API 為內(nèi)容創(chuàng)建嵌入。這可能需要對大文件進行分塊,以便你保持在服務(wù)的令牌限制內(nèi)。準備在必要時為向量索引數(shù)據(jù)創(chuàng)建新表。

      Azure 認知搜索中的矢量搜索使用最近鄰模型返回選定數(shù)量的與原始查詢相似的文檔。這在對向量索引的調(diào)用中使用原始查詢的向量嵌入,從數(shù)據(jù)庫返回相似的向量以及索引內(nèi)容,準備在 LLM 提示中使用。

      Microsoft 使用這樣的矢量存儲作為 Azure 機器學習的檢索增強生成 (RAG) 設(shè)計模式的一部分,并與其提示流工具配合使用。RAG 使用認知搜索中的向量索引來構(gòu)建構(gòu)成 LLM 提示基礎(chǔ)的上下文。這為你提供了一種構(gòu)建和使用向量索引的低代碼方法,例如設(shè)置查詢返回的相似文檔的數(shù)量。

      4、Azure 認知搜索中的矢量搜索入門

      使用 Azure 認知搜索進行矢量查詢非常簡單。首先在同一區(qū)域中為 Azure OpenAI 和認知搜索創(chuàng)建資源。這將允許你以最小的延遲加載帶有嵌入的搜索索引。你需要調(diào)用 Azure OpenAI API 和認知搜索 API 來加載索引,因此最好通過添加管理重試的代碼來確保代碼可以響應(yīng)服務(wù)中任何可能的速率限制為你。當你使用服務(wù) API 時,你應(yīng)該使用異步調(diào)用來生成嵌入和加載索引。

      向量作為向量字段存儲在搜索索引中,其中向量是具有維度的浮點數(shù)。這些向量通過分層可導航小世界鄰近圖進行映射,該圖將向量分類到相似向量的鄰域中,從而加快了搜索向量索引的實際過程。

      為矢量搜索定義索引架構(gòu)后,你可以將數(shù)據(jù)加載到認知搜索索引中。請務(wù)必注意,數(shù)據(jù)可能有多個與之關(guān)聯(lián)的向量。例如,如果你使用認知搜索來托管公司文檔,你可能有針對關(guān)鍵文檔元數(shù)據(jù)術(shù)語以及文檔內(nèi)容的單獨向量。數(shù)據(jù)集必須存儲為JSON 文檔,這應(yīng)該可以簡化使用結(jié)果來組合提示上下文的過程。索引不需要包含源文檔,因為它支持使用最常見的 Azure 存儲選項。

      運行查詢需要首先使用查詢正文調(diào)用你選擇的嵌入模型。這將返回一個多維向量,你可以使用它來搜索你選擇的索引。調(diào)用矢量搜索API時,請注明目標矢量索引、你需要的匹配項數(shù)量以及索引中的相關(guān)文本字段。為查詢選擇適當?shù)南嗨菩远攘糠浅S杏茫渲凶畛S玫氖怯嘞叶攘俊?/p>

      5、超越簡單的文本向量

      Azure 認知搜索的矢量功能不僅僅是匹配文本。認知搜索能夠與多語言嵌入配合使用,以支持跨多種語言的文檔搜索。你也可以使用更復雜的 API。例如,你可以在混合搜索中混合使用 Bing 語義搜索工具,以提供更準確的結(jié)果,從而提高 LLM 支持的應(yīng)用程序的輸出質(zhì)量。

      微軟正在快速將其用于構(gòu)建自己的基于 GPT-4 的 Bing 搜索引擎及其各種 Copilot 的工具和技術(shù)產(chǎn)品化。Semantic Kernel 和 Azure AI Studio 的提示流等編排引擎是 Microsoft 使用大型語言模型的方法的核心,F(xiàn)在這些基礎(chǔ)已經(jīng)奠定,我們看到該公司推出了更多必要的支持技術(shù)。矢量搜索和矢量索引是提供準確響應(yīng)的關(guān)鍵。通過構(gòu)建熟悉的工具來提供這些服務(wù),微軟將幫助我們將成本和學習曲線降至最低。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。