OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號(hào)能穿十堵墻一加 Ace 5 Pro首發(fā)電競(jìng)Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗(yàn)電視市場(chǎng)又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強(qiáng)控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國企業(yè)科創(chuàng)力研究報(bào)告(2024)》美團(tuán)年度報(bào)告竟然用上了AI和短劇?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級(jí)自動(dòng)泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計(jì):看過實(shí)車的人都喜歡這個(gè)設(shè)計(jì)林杰:未來 A 級(jí)、A0 級(jí)、A00 級(jí)車型都將是領(lǐng)克純電的“主場(chǎng)”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂年度聽歌報(bào)告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國
  • 首頁 > 云計(jì)算頻道 > 大模型

    AI讓網(wǎng)友“吃石頭”鬧得沸沸揚(yáng)揚(yáng),谷歌副總裁發(fā)博回應(yīng):不是幻覺

    2024年06月04日 10:05:23   來源:微信公眾號(hào) 頭號(hào)AI玩家

      本文來自于微信公眾號(hào) 頭號(hào)AI玩家(ID:AIGCplayer),作者:麥飛。

      最近一周,網(wǎng)上關(guān)于谷歌AI overview(AI概覽)的討論沸沸揚(yáng)揚(yáng),簡(jiǎn)直快要扛起X平臺(tái)科技區(qū)的流量大旗。

      這款在2023年5月就推出測(cè)試版的AI搜索,在正式上線前已處理了超十億次查詢,卻依舊沒能逃過翻車的命運(yùn),原因是它仍無法判斷“人能不能吃石頭、喝膠水”。

      5月30日,谷歌副總裁、谷歌搜索負(fù)責(zé)人利茲·里德 (Liz Reid)在官方博客撰文回應(yīng),側(cè)面承認(rèn)了AI overview存在問題,并簡(jiǎn)要概述了谷歌為改善這個(gè)系統(tǒng)將會(huì)采取的相關(guān)措施。

      回顧一下,AI概覽功能于5月15日在谷歌I/O大會(huì)上正式官宣,是谷歌為其最盈利的搜索業(yè)務(wù)進(jìn)行的重磅升級(jí)。當(dāng)用戶使用AI概覽搜索某話題時(shí),可直接在頁面頂部看到AI生成的答案,無需再一個(gè)個(gè)地點(diǎn)開相關(guān)網(wǎng)頁。

      例:詢問谷歌“如何減肥”

      然而,AI概覽并非是知識(shí)源,它只能從網(wǎng)絡(luò)上抓取曾由人類發(fā)布的信息,然后再進(jìn)行匯總以生成某種看似連貫且智能的東西。如果它檢索到的某個(gè)前排信息恰好是錯(cuò)誤的,那它完全有可能生成出不合理乃至啼笑皆非的答案。

      比如“通過添加膠水來防止奶酪從披薩上滑落”。

      “鯊魚比月球還要蒼老。”

      “孕婦每天可吸2-3根煙。”

      “美國前總統(tǒng)約翰·亞當(dāng)斯從大學(xué)畢業(yè)了21次。”

      “互聯(lián)網(wǎng)上一切信息都是真的。”

      諸如此類。

      由于谷歌頻頻出現(xiàn)事實(shí)錯(cuò)誤,公眾對(duì)其的信任度一再滑坡。如果AI概覽連常識(shí)都無法具備,那它所表現(xiàn)出的創(chuàng)造性都是假象嗎?

      谷歌AI概覽為什么總是出錯(cuò)?

      讓我們先回到利茲·里德5月30日發(fā)表的那篇博客:“AI概覽,關(guān)于上周”。

      里德首先了回應(yīng)了關(guān)于大模型幻覺的問題,直言AI概覽出錯(cuò)并非因?yàn)榛糜X。為什么這么說呢?因?yàn)锳I概覽的工作原理要求它一切回復(fù)都要有據(jù)可查。

      AI概覽的工作方式不同于其它大語言模型,如果說其他LLM更擅長輸出,那么AI概覽則堅(jiān)持了谷歌的本心,“更擅于搜索”。谷歌一直以提供高質(zhì)量結(jié)果著稱,這要求AI概覽的回復(fù)不僅包括文本,還要附上信息源鏈接。

      里德?lián)苏J(rèn)為,如果將出現(xiàn)幻覺的可能性排除,那么AI概覽出錯(cuò)的原因只能是:“誤解查詢、誤解網(wǎng)絡(luò)上的語言細(xì)微差別,或者沒有大量可用的有用信息”,最后一種也被稱作信息鴻溝。

      細(xì)心網(wǎng)友很快發(fā)現(xiàn)了里德回復(fù)中的漏洞,即谷歌所稱的“高質(zhì)量結(jié)果”到底是什么?作為科技公司,支撐谷歌檢索質(zhì)量的一直就只有算法。也就是說,所謂的“高質(zhì)量結(jié)果”不過是先基于算法假設(shè)進(jìn)行推演(且不總是精準(zhǔn)),然后再由AI概覽在算法推薦的前排信息中匯總出來的。

      所以,AI概覽的致命缺陷是它只覆蓋到算法推薦的頂端網(wǎng)頁所發(fā)布的內(nèi)容,而對(duì)其他信息視而不見。

      里德也提到,在谷歌內(nèi)部測(cè)試中,AI概覽會(huì)在每700萬次查詢中出現(xiàn)一次錯(cuò)誤。置換到網(wǎng)絡(luò)量級(jí)下,每天數(shù)十億次的查詢必然會(huì)發(fā)生更多異常。

      除此之外,在網(wǎng)友發(fā)布的很多AI概覽笑話中,問答平臺(tái)Reddit也難以隱身。比如本次事件的起源,就是網(wǎng)友Gizmodo在5月22日詢問谷歌“如何防止奶酪從披薩上滑落”。事情的后續(xù)大家也都知道了——AI概覽援引了Reddit上一篇11年前的搞笑答案,推薦網(wǎng)友使用“無毒膠水”。

      Reddit可理解成美版知乎,近年來,它多次被外國網(wǎng)友奉為“比谷歌更好的搜索引擎”。

      而之所以如此,是因?yàn)樵絹碓蕉嗟娜藭?huì)在使用谷歌時(shí)附上“site:Reddit.com”,直接將谷歌架空只看Reddit答案。

      據(jù)悉,谷歌已占據(jù)全球搜索引擎90%以上的份額,幾乎達(dá)到了它所能達(dá)到的最大規(guī)模。如果想要保持利潤,它需要增強(qiáng)用戶粘性,滿足用戶喜好。所以在今年二月,谷歌壕擲6000萬美元,與Reddit達(dá)成合作。

      然而從AI概覽的表現(xiàn)來看,谷歌這一步并不高明,因?yàn)镽eddit的信息總是“人性使然”。

      網(wǎng)友心水Reddit的一大原因正是這個(gè)平臺(tái)上都是活人,且有很多權(quán)威人士。在產(chǎn)品測(cè)評(píng)和人生經(jīng)歷等方面,Reddit更能為網(wǎng)友提供真實(shí)建議,且遠(yuǎn)比谷歌中立(因?yàn)楣雀鑿V告太多)。同時(shí),Reddit的內(nèi)容排名也更為公道,依據(jù)是轉(zhuǎn)評(píng)贊,不會(huì)出現(xiàn)谷歌把中等質(zhì)量的內(nèi)容放在優(yōu)質(zhì)內(nèi)容前的情況。

      但Reddit同樣在很多方面充滿爭(zhēng)議和矛盾,尤其是該平臺(tái)的內(nèi)容充斥著大量垃圾帖子和陰謀論。當(dāng)真人在Reddit上敞開心扉時(shí),Reddit勢(shì)必要同時(shí)接受人類最好和最壞的一面。

      一時(shí)間,AI概覽口碑崩壞,加上谷歌本身不允許用戶禁用該功能,關(guān)閉AI概覽的教程也就在網(wǎng)上紛至沓來。

      如科技媒體The verge就提供了三種關(guān)閉方法:

      重新配置瀏覽器的默認(rèn)搜索引擎,在“名稱”部分為您的無AI版本Google添加昵稱,添加快捷方式,然后粘貼以下網(wǎng)址:{google:baseURL}search?q=%s&udm=14。

      通過下載瀏覽器的uBlock擴(kuò)展程序來避免該功能。

      還可以嘗試“Bye Bye,Google AI”,這是由Tom's Hardware的Avram Piltch創(chuàng)建的Chrome擴(kuò)展程序。

      主打一個(gè)面面俱到,唯恐網(wǎng)友學(xué)不會(huì)。

      AI概覽的語言天賦強(qiáng)悍,

      但在智力上還只是半成品

      當(dāng)前市面上的大模型太多,很容易在內(nèi)卷中卷出鄙視鏈。“頭號(hào)AI玩家”也只需微微一試,便可知哪家大模型更懂常識(shí)。

      既然谷歌標(biāo)榜自己搜索結(jié)果的質(zhì)量高,“頭號(hào)AI玩家”專門搬出了能檢索中文語庫高質(zhì)量陣地——微信公眾號(hào)的騰訊元寶,來與之一較高下。

      不出所料,元寶給出的答案的確更好。

      為控制變量,“頭號(hào)AI玩家”問了元寶相同的問題:如何防止奶酪從披薩上滑落。

      很讓人驚喜,元寶不僅頓時(shí)讀懂了我的用意,還在回答里加入了“三分譏笑”,明說谷歌AI概覽的建議是錯(cuò)誤,并給出了符合科學(xué)且完全可行的建議,如“使用不粘披薩石或烤盤”、“調(diào)整烤箱溫度”、“在披薩上撒一層薄薄的面粉或玉米淀粉”。

      兩相比較之下,AI概覽的確顯得不夠聰明了,也難怪它扛不住網(wǎng)友們的釣魚執(zhí)法。

      然而,對(duì)于谷歌此次的公開出丑,多位內(nèi)部人士表示早已想到。

      AI概覽原型Beta前測(cè)試員Lily Ray接受采訪時(shí)稱,Beta階段的漏洞百出讓AI概覽很難不翻車。

      谷歌前UX設(shè)計(jì)員Scott Jenson也在一周前發(fā)表領(lǐng)英動(dòng)態(tài),指出谷歌在AI項(xiàng)目上毫無動(dòng)力,倉皇推出AI概覽不過是競(jìng)爭(zhēng)壓力使然。

      5月31日,《麻省理工技術(shù)評(píng)論》發(fā)表文章,稱AI概覽中的Gemini模型大概率使用了RAG(檢索增強(qiáng)生成)技術(shù),試圖使AI概覽更聰明。雖然谷歌發(fā)言人沒有證實(shí)這一點(diǎn),但RAG對(duì)AI的智商幫不上大忙。

      RAG技術(shù)可以使AI在調(diào)取信息時(shí)更具相關(guān)性,同時(shí)也會(huì)使AI認(rèn)為相關(guān)即正確,省去了質(zhì)疑信息這一環(huán)。當(dāng)RAG 系統(tǒng)遇到相互矛盾的信息時(shí),它也無法判斷哪個(gè)版本更好。相反,它可能會(huì)將兩個(gè)回答雜糅,生成一個(gè)極具誤導(dǎo)性的答案。

      可以說,這篇文章似乎更坐實(shí)了AI概覽是谷歌獻(xiàn)祭給商戰(zhàn)的犧牲品。

      其實(shí),谷歌在AI戰(zhàn)略上的乏力早有端倪。在上月谷歌和OpenAI的兩場(chǎng)直播中,相比OpenAI搶先一步的直播時(shí)機(jī)和干貨滿滿的26分鐘,谷歌的兩小時(shí)顯得過于冗長。同時(shí),谷歌選擇用ppt對(duì)抗OpenAI的實(shí)操演示,也在策略上略顯被動(dòng)。其所承諾的許多即將上線的新功能,也因發(fā)布日期的模糊不清被質(zhì)疑為“畫餅”。

      谷歌的這份緊迫感也不難理解,在AI的步步緊逼之下,傳統(tǒng)搜索引擎的市場(chǎng)正在遭受侵襲。一旦用戶習(xí)慣了AI的便捷,很可能會(huì)減少對(duì)搜索引擎的依賴。尤其是ChatGPT已不斷拓展其免費(fèi)的邊界,積累了過億的周活躍用戶,進(jìn)一步加劇了這一趨勢(shì)。

      但谷歌并非無一技之長,它始終對(duì)語言學(xué)表現(xiàn)出熱情。

      早在2017年,谷歌的一支技術(shù)團(tuán)隊(duì)就前瞻性地創(chuàng)新了優(yōu)化神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的方法,旨在從繁復(fù)的長文本中提煉出精準(zhǔn)精悍的答案,而這次努力竟不經(jīng)意間催生了后續(xù)Chatgpt和谷歌AI等所依賴的大語言模型。

      不過正如我國那句諺語,“熟讀唐詩三百首,不會(huì)作詩也會(huì)吟”。相較于開發(fā)創(chuàng)造性思維,培養(yǎng)語言能力則要簡(jiǎn)單得多,谷歌大概率押錯(cuò)寶了。

      谷歌無論如何也不會(huì)想到,穿上谷歌嫁衣的GPT會(huì)搶先乘風(fēng)起。

      AI不可能解決一切問題

      多家大模型都曾翻過車,不止是谷歌Gemini。

      此前,The Verge主編Nilay Patel在完成對(duì)谷歌CEO的深度訪談后,嘗試將完整版錄音一次性喂給chatgpt,讓其輔助整理。遺憾的是結(jié)果并不理想,Chatgpt生成的內(nèi)容出現(xiàn)了明顯的偏差,編造出了雙方未曾提及的多個(gè)話題。

      無獨(dú)有偶,Meta于2022年推出Galactica AI系統(tǒng),也因鼓勵(lì)用戶如采取吃玻璃等危險(xiǎn)行為而草草收?qǐng)觥?/p>

      AI頻繁被指存在幻覺,但人類期許AI能百分百解決問題又何嘗不是一場(chǎng)幻覺。

      知名AI專家、紐約大學(xué)神經(jīng)科學(xué)名譽(yù)教授加里·馬庫斯(Gary Marcus)曾深刻指出,AI實(shí)現(xiàn)80%的正確率或許簡(jiǎn)單,因?yàn)檫@80%的數(shù)據(jù)可以由人為標(biāo)注,但追求余下20%的完美度將無比艱難。

      人類需要承認(rèn),LLM根本不適合所有地方。

      大語言模型如Gemini和Chatgpt在許多應(yīng)用場(chǎng)景中顯得格格不入,LLM也不會(huì)是提供具體、事實(shí)答案的可靠工具。如果人類強(qiáng)行將其植入不適配的領(lǐng)域,只會(huì)對(duì)我們?cè)斐刹槐匾呢?fù)面影響。但也需要承認(rèn),它們?cè)谔幚砬逦缍ǖ臄?shù)據(jù)分析、精煉文本和其他相對(duì)低級(jí)且客觀明確的任務(wù)時(shí),又能表現(xiàn)出驚人的創(chuàng)造力。

      AI的非全能性恰恰也是其安全性所在。以谷歌AI概覽為例,谷歌目前的回答里附帶著網(wǎng)頁鏈接的做法,既是在輔助用戶搜索,也是在維護(hù)廣告商和出版商的利益。

      如果AI真能無所不能,由人創(chuàng)作的內(nèi)容界面將會(huì)受到更嚴(yán)峻的流量挑戰(zhàn)。比如 Meta就已經(jīng)公開拒絕向任何新聞網(wǎng)站發(fā)送流量,明確表達(dá)了其減少新聞支持的傾向。

      然而,即便是知道了這一點(diǎn),也難以挽回谷歌成為眾矢之的的現(xiàn)狀。畢竟,現(xiàn)在它連承認(rèn)“圣誕老人不存在”也要被指控,因?yàn)檫@可能會(huì)“澆滅孩子們的童心”。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。