搜索引擎要被DeepSeek革命?
繼華為、OPPO、TCL、吉利、機(jī)械革命等各行各業(yè)玩家接連接入DeepSeek-R1模型之后,微信、納米AI搜索、QQ瀏覽器、百度搜索、騰訊元寶等即時(shí)通訊軟件、搜索引擎、AI工具,也陸續(xù)接入了DeepSeek-R1模型。2月16日晚,百度搜索官方表示,為豐富多元化搜索體驗(yàn),將全面接入DeepSeek和文心大模型的最新深度搜索功能。
(圖源:微信公眾號(hào)截圖)
DeepSeek-R1的到來,打破了國內(nèi)AI行業(yè)原有的局面,不僅大語言模型領(lǐng)域積累較弱的手機(jī)、家電、PC、汽車廠商接入該模型,就連已經(jīng)開發(fā)出AI大模型的騰訊、360等互聯(lián)網(wǎng)企業(yè),也在為自家的AI工具接入DeepSeek-R1,而且在更強(qiáng)算力規(guī)模的支持下, 體驗(yàn)比DeepSeek官方平臺(tái)更勝一籌。
其中尤為引發(fā)行業(yè)震蕩的是百度搜索,畢竟百度一度被視作中國AI產(chǎn)業(yè)的“扛旗者”,早在2013年甚至更早百度就在探索深度學(xué)習(xí)AI,多年來在AI技術(shù)上持續(xù)進(jìn)行戰(zhàn)略押注,號(hào)稱在AI上已投資千億。如今百度搜索接入DeepSeek,是“打不過就加入”,還是另有所圖?
探索AI搜索,百度其實(shí)早已出發(fā)
網(wǎng)站流量分析機(jī)構(gòu)Statcounter統(tǒng)計(jì)數(shù)據(jù)顯示,2015年到2023年,谷歌在搜索引擎領(lǐng)域幾乎處于壟斷地位,份額始終維持在90%以上,但2024年的最后三個(gè)月,谷歌的市場份額卻分別為89.34%、89.99%、89.73%。這種趨勢意味著其他搜索引擎,尤其是正在興起的AI搜索工具,已對(duì)谷歌造成了不小的壓力。
傳統(tǒng)的搜索引擎在我們查詢信息時(shí),會(huì)篩選出相關(guān)的網(wǎng)址鏈接,并按照相關(guān)性、發(fā)布時(shí)間等規(guī)則排列,但具體內(nèi)容如何、是否屬于標(biāo)題黨,還要我們進(jìn)入網(wǎng)址之后才能得知。
(圖源:百度AI搜索截圖)
小雷經(jīng)常需要搜索某類產(chǎn)品的銷量數(shù)據(jù)或者查證一些消息的真實(shí)性,可許多媒體在報(bào)道時(shí)會(huì)隱去具體來源,導(dǎo)致小雷需要花費(fèi)大量時(shí)間在眾多鏈接中查找有效信息。搜索引擎的廣告付費(fèi)排名問題,對(duì)于用戶更是堪稱折磨,嚴(yán)重影響了我們尋找有效信息的效率。
任何帶有聯(lián)網(wǎng)功能的AI應(yīng)用,廣義上都屬于AI搜索工具。AI搜索工具可以快速從大量信息中篩選出有效信息,總結(jié)歸納后直接展現(xiàn)在用戶眼前,而且基本會(huì)告知信息來源,還會(huì)附上網(wǎng)址鏈接,便于用戶求證和查看完整信息。相較于傳統(tǒng)搜索引擎,AI搜索能夠主動(dòng)總結(jié)查詢信息的重點(diǎn)內(nèi)容,不再需要用戶一個(gè)個(gè)點(diǎn)開鏈接查看、對(duì)比各方信息,大幅提升了查找信息的效率。
為進(jìn)一步提升用戶的搜索體驗(yàn),AI企業(yè)除了投入巨資訓(xùn)練AI大模型,還在嘗試為AI搜索工具加入更多技能和高質(zhì)量信息源。如微信新增的AI搜索功能,關(guān)聯(lián)了公眾號(hào)的文章,生成的內(nèi)容還可以一鍵發(fā)送給微信好友或轉(zhuǎn)發(fā)至朋友圈。騰訊元寶同樣加入了該功能,也可以快捷分享至微信好友、朋友圈、QQ好友、QQ空間、企業(yè)微信。
(左:微信,右:騰訊元寶;圖源:App截圖)
AI搜索工具無疑對(duì)傳統(tǒng)搜索引擎造成了降維打擊,而身為國內(nèi)搜索領(lǐng)域領(lǐng)頭羊的百度,自然率先感受到了壓力,并選擇積極擁抱AI,于2024年4月26日正式上線了百度AI助手,將搜索、大模型、智能體相互連接,以滿足用戶多樣化的搜索需求。
當(dāng)前我們使用百度搜索引擎查找某些信息時(shí),便能夠看到百度AI搜索給出的答案,無需再點(diǎn)進(jìn)網(wǎng)址查看,減少了一個(gè)步驟。百度AI搜索也會(huì)提供信息來源的網(wǎng)址,方便用戶查看完整內(nèi)容。
(圖源:百度AI搜索)
然而面對(duì)AI搜索,網(wǎng)友們依然分成了三個(gè)派別,部分網(wǎng)友支持AI搜索,認(rèn)為它讓自己的工作、學(xué)習(xí)、生活更加方便;另一部分網(wǎng)友聲稱AI搜索準(zhǔn)確性不佳,可能會(huì)出現(xiàn)某些事實(shí)性錯(cuò)誤;最后一部分網(wǎng)友則屬于中立派,使用AI搜索功能的同時(shí),也會(huì)去驗(yàn)證AI搜索生成信息的準(zhǔn)確性。
AI搜索好用但并不完美,百度為AI搜索引入文心和DeepSeek的深度搜索功能,目的或許就在于提高生成內(nèi)容的準(zhǔn)確性。
“AI幻覺”才是AI搜索的最大敵人?
作為一名媒體工作者,小雷經(jīng)常使用AI搜索查找各種數(shù)據(jù),遇到AI幻覺的情況不在少數(shù)。例如小雷打開了聯(lián)網(wǎng)搜索功能并搜索“2024年中國手機(jī)銷量數(shù)據(jù)”時(shí),DeepSeek-R1(騰訊元寶提供的服務(wù))居然告知小雷現(xiàn)在是2023年10月,所以沒有相關(guān)的數(shù)據(jù)。這種情況通常被稱為“AI幻覺”,指AI生成的內(nèi)容與事實(shí)嚴(yán)重不符或存在邏輯錯(cuò)誤。
(圖源:騰訊元寶截圖)
為更直觀展現(xiàn)AI幻覺問題,小雷對(duì)目前國內(nèi)使用人數(shù)較多的六個(gè)AI大模型做了一個(gè)簡單的“草莓測試”,即向AI提問,Strawberry一詞中有多少個(gè)字母“r”?相信看到這個(gè)問題的小伙伴沒有一個(gè)會(huì)回答錯(cuò)誤,但AI給出的答案卻令小雷瞠目結(jié)舌。
在小雷測試的騰訊元寶、豆包、百度AI搜索、Kimi、通義千問、納米AI搜索等工具中,只有騰訊元寶的混元大模型和Kimi的k1.5模型回答正確,其他所有大模型全部回答錯(cuò)誤。最離譜的是豆包生成的答案,雖然指出了Strawberry的第三、第八、第九個(gè)字母是“r”,給出的答案卻依然是Strawberry只有兩個(gè)字母“r”。
(從左到右依次為:騰訊元寶、豆包、百度AI搜索、Kimi、通義千問、納米AI搜索;圖源:App截圖)
而小雷將納米AI搜索的模型從智腦(360gpt- Pro)切換至DeepSeek-R1后,該模型回答出了正確答案,并指出單詞結(jié)尾的兩個(gè)“r”會(huì)被誤認(rèn)為只有一個(gè)。
(圖源:納米AI搜索截圖)
小雷在多次測試后發(fā)現(xiàn),相較于一個(gè)多月前,AI大模型產(chǎn)生AI幻覺的可能性已明顯降低,查詢部分信息時(shí)會(huì)告知用戶尚無該數(shù)據(jù),而非繼續(xù)編造數(shù)據(jù),但偶爾仍會(huì)出現(xiàn)AI幻覺。AI幻覺的存在,讓小雷無法完全相信AI搜索給出的數(shù)據(jù),因而經(jīng)常需要進(jìn)入網(wǎng)址查看,并搜索其他文章,通過對(duì)比確定信息的真實(shí)性。
AI企業(yè)也在通過各種方案降低產(chǎn)生AI幻覺的概率,例如加入RAG技術(shù)(檢索增強(qiáng)生成技術(shù)),讓AI大模型與高質(zhì)量知識(shí)庫掛接,在生成內(nèi)容前先對(duì)照知識(shí)庫的準(zhǔn)確數(shù)據(jù)。通過架構(gòu)優(yōu)化提升AI大模型的長序列處理能力,同樣可以達(dá)到減少AI幻覺的作用。
OpenAI工作人員提出了一種過程監(jiān)督機(jī)制,在AI大模型推理問題時(shí),每個(gè)正確步驟均給出自我獎(jiǎng)勵(lì),優(yōu)化思維鏈,而非回答正確結(jié)果時(shí)才給出自我獎(jiǎng)勵(lì)。
多個(gè)大模型生成的內(nèi)容互相驗(yàn)證(模型對(duì)模型評(píng)估),也是降低AI幻覺的有效方法。如納米AI搜索就推出了多模型協(xié)作方案,通過文心一言、智腦、豆包三個(gè)大模型協(xié)作,成功計(jì)算出了Strawberry單詞中字母“r”的數(shù)量。
(圖源:納米AI搜索截圖)
總而言之,AI幻覺暫時(shí)只能通過優(yōu)化訓(xùn)練方式、思維鏈、大模型架構(gòu)等方案減少產(chǎn)生的概率,無法徹底消除。AI幻覺的存在會(huì)降低AI搜索生成內(nèi)容的準(zhǔn)確性,在生成內(nèi)容后,用戶最好進(jìn)入AI給出的鏈接,確認(rèn)信息的可靠度。
百度為AI搜索接入DeepSeek,目的或許就是借助R1、V3等模型的能力,通過深度思考,與文心大模型互相驗(yàn)證,降低產(chǎn)生幻覺的概率。
AI搜索爆發(fā),百度與DeepSeek互相成就
AI搜索大勢漸成,將逐漸取代傳統(tǒng)搜索模式。盡管AI幻覺依舊存在,可能會(huì)出現(xiàn)數(shù)據(jù)虛假的情況,但AI企業(yè)正在通過各種方式減少產(chǎn)生AI幻覺的可能。而在諸多方案中,多模型互相驗(yàn)證無疑是最簡單有效的方法之一。
國內(nèi)搜索引擎領(lǐng)域的王者百度,將通過DeepSeek和文心的深度思考能力,提高AI搜索生成內(nèi)容的準(zhǔn)確性,360同樣打造出了多模型協(xié)作功能,以提高推理能力。有百度、360打頭陣,預(yù)計(jì)未來會(huì)有更多AI搜索工具選擇此方案。
(圖源:百度截圖)
采用MIT協(xié)議及類OpenRAIL授權(quán)方式開源的DeepSeek,允許第三方自由使用其代碼,且可以修改、復(fù)制、分發(fā),在開源大模型中也是開放性最高的一批。憑借出色的推理能力和開源模式,DeepSeek已然成為國內(nèi)AI企業(yè)合作的主要對(duì)象。
當(dāng)初安卓能夠戰(zhàn)勝iOS之外的其他操作系統(tǒng),開放性正是原因之一。DeepSeek的開源模式或?qū)⒆屍涑蔀锳I領(lǐng)域的谷歌,將R1、V3及未來訓(xùn)練出的開源模型打造成AI領(lǐng)域的安卓,不僅是家電、手機(jī)廠商快速為設(shè)備加入AI功能的最佳選擇,還將成為其他AI企業(yè)實(shí)現(xiàn)模型對(duì)模型評(píng)估的首選。
即將免費(fèi)服務(wù)、開源大模型的文心一言,引入DeepSeek的深度思考能力之后,能夠提升AI搜索生成內(nèi)容的質(zhì)量,從而奠定在搜索領(lǐng)域的地位。百度的影響力也將對(duì)DeepSeek起到加持效果,增加用戶體驗(yàn)DeepSeek-R1模型的機(jī)會(huì)。AI領(lǐng)域冉冉升起的新星DeepSeek與搜索領(lǐng)域的老牌王者百度,在AI搜索時(shí)代將互相成就,向成為與谷歌比肩的全球互聯(lián)網(wǎng)巨頭邁進(jìn)。
不過,正如雷科技創(chuàng)始人羅超所言:AI搜索目前只是“L3級(jí)自動(dòng)駕駛”的感覺,也就是還是需要人“接管”的,因?yàn)?ldquo;幻覺”的存在,AI搜索給出的答案正確與否未知,用戶往往還需要去搜索引擎里面再檢驗(yàn)一下——有不少網(wǎng)友吐槽被DeepSeek錯(cuò)誤答案帶到溝里了。
只要AI搜索準(zhǔn)確率沒有幾個(gè)9(比如99.9999%),傳統(tǒng)搜索引擎就還有存在價(jià)值,實(shí)際上,在使用傳統(tǒng)搜索引擎中,人的判斷力是至關(guān)重要的。人的大腦想要不退化,AI時(shí)代也須還是要去做判斷的,不能什么都用AI給的,否則這跟咸魚有什么區(qū)別呢?
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。