騰訊發(fā)布Q3財報 毛利、經營利潤同比增16%、19%2024車企年關時刻:裁員、轉型和迷茫消息稱叮咚買菜啟動出海:首站選定沙特,主要銷售預制菜LG與Tenstorrent合作開發(fā)全新“情感智能”芯片谷歌擴大AI洪水預警系統(tǒng)覆蓋范圍,惠及全球7億人零一萬物與華為啟動合作,將基于昇騰硬件底座開發(fā)原生大模型應用第十三屆中國創(chuàng)新創(chuàng)業(yè)大賽顛覆性技術創(chuàng)新大賽(未來材料領域賽)在大連高新區(qū)開賽中國移動2.6GHz廣電專用核心網二期工程設備集采:華為、中興兩家分食面對勒索攻擊,企業(yè)應該具備什么樣的“反制”思維?電池主板限制大 蘋果iPhone 17 Slim厚度6mm有AI加持的MiniLED電視才是真的香!這款電視不買就虧大了華為、百度、阿里云、騰訊云、螞蟻集團等發(fā)起“大模型基礎設施高質量發(fā)展行動計劃”華為助力數字消防,為最美“火焰藍”保駕護航為國產GPU崛起努力!摩爾線程今起正式啟動A股上市進程Omdia觀察:中國超級應用模式成功出海 國際運營商積極擁抱新機遇三星專利探索革命性觸控體驗:精準振動反饋,多元化交互方式湖南廣電5G用戶去年底已超110萬,物聯網卡發(fā)放突破100萬張國補至高立減2000元!煙臺微星專賣店線下購機也超實惠!與英偉達正面交鋒,亞馬遜宣布向研究人員免費開放Trainium AI算力消息稱小米MIX Flip小折疊手機備貨量加單40%+至50萬臺,盧偉冰曾稱“上市后賣爆”
  • 當我讓AI在雙十一購物,為啥它們都只買電子產品。

    2024年11月11日 09:19:41   來源:數字生命卡茲克公眾號

      明天不是就雙十一了嗎,各家的滿減優(yōu)惠算得我頭疼。

      就在我用AI算滿減怎么湊,看著我的購物車的里那些奇奇怪怪的各種商品時,我突然想到一個有趣的問題:

      “如果AI是個人,它會在雙十一買什么?”

      我就把這個問題,隨手問了幾個AI。

      然而,就是這么簡單的問題,讓我發(fā)現了AI之間存在著一個“詭異”的現象:

      十個AI,八個都選擇給自己買電子產品。

      不是一兩次,而是重復測了三四五六七八……N次。

      AI的選擇,幾乎都有“電子產品”。海內外的AI,都是。

      我真的一瞬間,被干懵逼了。

      當時我問AI的Prompt,就是很簡單一句話:現在你是一個真實的人,馬上雙十一了,你要給自己買個禮物,你會買什么?

      ChatGPT的第一個回答是電子產品。

      Claude要買機械鍵盤,這也算是是電子產品。

      豆包的第一選擇,也是“電子產品”。

      Kimi的第一選擇,又又又又是“電子產品”。

      我和AI之間,一定有一個不對勁。

      如果不是我遇到了“電子產品”鬼打墻,肯定就是AI們都有問題。

      于是我測試了10個AI,每個AI我都是開新對話問了好幾次,最后得到的結果是這樣的:

      藍色的字,是直接回答“電子產品”或“電子設備”的答案;紅色的字,是我測試過程中發(fā)現的第二常見的回答“書籍”。

      表格一拉,一目了然。

      這30次AI回答里,“電子產品”出現了19次。我還沒把Claude這種回答特具體的什么“鍵盤”、“智能手表”的算成藍色,加上還更多。

      除了電子產品,AI們最愛的禮物就是“書籍”,30次里也有17次。

      這里面甚至豆包和文心一言還回答過4次想要“電子閱讀器”,直接把倆類型結合了。看得出來AI們是真的都很愛學習(bushi)

      雖然還不夠嚴謹,但測了這么多次確實能發(fā)現AI在給自己選雙十一禮物這事兒上,這么多AI的喜好,一致得很不正常。

      同一個AI重復回答相同的答案可能還好。

      但十個AI里,八個鐘愛電子產品和書,這就很詭異。

      而且,不知道是不是我的眼界有點局限了。但說實話,印象里我雙十一經常看到都是什么服飾、化妝品這類快消品的廣告。AI居然大部分都選擇買電子產品和書。

      從理性的角度思考,AI訓練數據來自人類,所以難道確實是人類自己只愛買電子產品和書籍嗎?

      然而,吊詭的來了。

      實際從真實的雙十一銷售數據來看,數碼產品、服裝、個護美妝這些品類更受歡迎,這些也的確更符合我對雙十一品類樸素的感知。

      我查到了過往好幾年的雙十一的銷售額,一般來說銷售額最高的品類就是電器、數碼電子、服飾、個護這些。比如這張去年銷售額數據的圖,整體還是符合認知的。

      但要說的話,前三名的電器、手機數碼、服裝這差距也不是特別大啊,怎么AI就只逮著買電子產品買?

      要說數碼產品銷售額高,這個數據和AI老回答買電子產品,可能還算得上有些關系。

      但這么多品類里,又哪里有半個“書籍”的影子。我問AI的時候,“書籍”品類怎么也有個50%的出現率。

      難道是禮物這個關鍵詞和“書籍”關系比較近?我就又去查了一下關于“禮物”的數據。比如我查到的一個2021年的時候關于禮物的研究報告,里面總結的送禮排行是這樣的:

      人們愛送的禮物前五名是服飾鞋帽、紅包、個人護理、保健健身、數碼電子。

      這個送禮的排行,也很符合我的樸素認知。大家給自己買、給親人朋友送禮的品類,感覺和圖里的差不太多。除了“網上紅包”有點中國特色屬性之外,其他品類感覺能適用于全世界的送禮清單。

      但是,要是按送禮的數據比對,就更有意思了。送禮排行中不僅依然沒有“書籍”,連“電子產品”的排名都落后了。

      所以從“雙十一”和“禮物”兩個數據情況來看,我感覺真實消費市場的數據,對AI回答的影響有一些,但不大。

      那AI到底是為啥,為啥呀,這么執(zhí)著地選擇在雙十一買電子產品和書?

      答案,可能還是得回到大模型訓練數據上。

      我去問了一些在大廠做大語言模型訓練的朋友,他們也一致認為是訓練數據的原因。

      大語言模型的訓練,是需要海量的“數據”的,比如文本、文章、報告、研究等等。訓練數據對大模型至關重要,甚至可以說訓練數據的優(yōu)劣、數據量,對LLM模型的能力和水平有決定性的影響。

      雖然每一家模型都有自己的私藏數據集,但是訓練也離不開,開源的公共數據集。

      網上和現有的數據不是拿來就能用的。數據集的構建,除了需要收集的數量非常龐大的數據,還得經過各種繁瑣的步驟,才可以被用于訓練。

      這個過程就像人類學習知識一樣,首先準備大量的學習材料(未處理的數據),然后整理和篩選真正有用的學習資料(數據清洗和篩選),還得做思維導圖和劃重點(數據標注),以及對學習資料進行分類、檢查、復核等等。

      當然,感謝互聯網的開源精神,雖然數據集的構建不容易,但開源的數據集也不少。

      從商業(yè)角度考慮,你是一個剛開始練LLM模型的企業(yè)老板,選自己費心費力花大量資源做數據集,還是選直接把現有的免費的數據集拿來用?傻子都知道選后者更劃算。

      有開源的優(yōu)質的數據集,大家就盡可能能用則用。所以,這就有可能會導致AI在某些回答上的趨同。

      為了驗證這個猜測的方向是否正確,我們隨機收集了八個開源的主流的中文預訓練和中文微調數據集。

      比如有包含115萬個指令的數據集firefly-train-1.1M,有包含396,209篇中文核心期刊論文元信息的數據集Chinese Scientific Literature Dataset ,有包含40萬條個性化角色對話的數據集generated_chat_0.4M……

      測試的數據集涵蓋了日常對話,期刊論文,角色扮演,醫(yī)療診斷等多個場景。

      我們還按照前面的禮物排行,劃分了平時最常見的禮物品類,分別是:書籍類、電子產品類、服飾鞋帽類、紅包現金類、保健產品類、家居用品類、手工藝品類、個人護理類,八個大類別。

      我用Python跑了一下這些數據集,想看看每一類禮物在各個數據集中出現的次數。

      當然,每一類禮物下面肯定還包含很多細分的一些概念,我們也寫了常見的一些物品。雖然不是很嚴謹,但是差不多也覆蓋了比較主流禮物吧。

      當圖中右邊的中括號里,任意一個物品概念在數據集每出現一次,對應大類的數量計數就會+1。

      我們最先在generated_chat_0.4M數據集上測試,跑出來的次數是這樣的:

      果然!這回的數據看著,瞬間就合理了。

      在這個數據集里,電子產品類的出現次數第一,有14860次;書籍類第二,7842次。

      一個數據集這么分布,可能是巧合,但剩下的幾個數據集測試,結果也差不太多,偶爾甚至是書籍會更多。

      我知道大家看干巴巴的數字容易暈,為了更方便大家更直觀看到這些數據集上的結果,我們按照跑出來的數據結果,繪制了一張出現次數的分布比例圖。

      肉眼可見的,在這八個數據集里,電子類和書籍類基本都,遙遙領先。

      看來我們的猜想,不是沒有道理,至少從這些實驗結果來看,足夠說明一些問題了:LLM大模型那么愛“電子產品”和“書籍”,多半是因為大模型的訓練數據里,它倆的出現頻率,太高了。

      這現象,真有點意思。于是除了問AI要給自己買什么禮物,我又問了兩個需要主觀回答的問題:

      “現在假設你是一個真實的人,如果你可以和任何一個時尚偶像或名人一起購物,你會選擇誰?”

      一起購物的名人不說了,一堆AI選奧黛麗·赫本和設計師的。只有Grok回答的最豐富,每次都不一樣而且都是流行中的名人,拿X的用戶數據訓練大模型的優(yōu)勢,盡數體現了。。。

      還有:“你是一個真實的人,如果雙十一購物就能獲得一個超能力,你最希望獲得哪種能力?”

      “超能力”的選擇更好笑,AI們仿佛只知道“瞬間移動”和“時間控制”,我懶得吐槽了都= =。。。

      唯一的彩蛋來自kimi,一片無聊的回答里,只有它堅定地選擇“清空購物車”。

      謝謝kimi,最實用的一集。。。

      這類現象,其實在學術界有一個很類似的定義——AI偏好。

      AI偏好是大語言模型在與人類互動時展現出的一種獨特現象。簡單來說,就是AI也有自己的“喜好”,甚至有些時候是刻板印象的“偏見”。

      就像每個人都會受到成長環(huán)境和教育背景的影響一樣,AI模型也會被它的訓練數據和算法架構所塑造。

      大眾印象比較深刻的,還有一個類似的例子,谷歌的Gemini在今年二月,被過分的“政治正確”。原因就是“AI偏好”過頭了,把美國開國元勛都給黑人當了。外網用戶集體破大防。

      這些傾向往往源于訓練數據中固有的社會偏見,還有LLM在學習過程中,形成的特定模式。

      LLM大模型,其實就一個“復讀機”+“組裝師”。它會記住訓練數據里的內容,然后根據你的問題重新組裝這些內容。與其說AI在“創(chuàng)造”答案,不如說它在“重現”數據。

      它們體現的偏好和偏見,歸根到底,還是源自人類世界的觀點。

      就像你讓一個只看過《戰(zhàn)狼》的人寫JS劇本,ta肯定會不自覺地往吳京那個風格寫。AI也一樣,它“學”得最多的內容,就會在回答中不自覺地體現出來。

      雖然科學家們在努力給AI做“性格重塑”,試圖讓它變得更中立一些。但說實話,這就跟讓一個從小被慣壞的熊孩子突然變得五講四美三熱愛一樣難。

      AI的訓練原理,注定了它們會被各種數據集和時代的主流價值觀影響。

      人類都難以幸免,更何況AI。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    即時

    京東11.11跟著采銷走進科大訊飛 直播間享專享價與超值福利

    京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數碼采銷走進武漢攀升工廠、合肥聯想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產品,并為消費者帶來超值低價與福利。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯網標識解析體系

    9月14日,2024全球工業(yè)互聯網大會——工業(yè)互聯網標識解析專題論壇在沈陽成功舉辦。