最近,人們發(fā)現(xiàn)了一個有趣的現(xiàn)象,即AI模型在選擇數(shù)字時表現(xiàn)出類似人類的購買和避好行為,這證明了模型在回答問題時重復訓練數(shù)據(jù)中的常見內(nèi)容。這種行為具有確定“人性化”的特點,雖然模型本身并不具備人類的認知能力。
在實驗中,一些工程師要求幾個主要的LLM聊天機器人隨機選取0到100之間的數(shù)字。結(jié)果顯示,所有模型都有一個“最喜歡的”數(shù)字,表明它們在選擇數(shù)字時表現(xiàn)出了偏好。即使在“溫度”下,這三個模型在選擇的其他數(shù)字時也表現(xiàn)出類似人類的偏見。這種現(xiàn)象揭示了人工智能模型表現(xiàn)出的“人性化”特征,解答人們與這些系統(tǒng)時需要記住其模仿人類行為的本質(zhì)提供了啟示。
Gramener 的一些工程師進行了一項非正式但仍然引人入勝的實驗,他們簡單地要求幾個主要的 LLM 聊天機器人在0到100之間選擇一個隨機數(shù)字,結(jié)果并不隨機。
三個經(jīng)過測試的模型都有一個 “喜歡” 的數(shù)字,在最確定性的模式下,這個數(shù)字總是它們的答案,但即使在更高的 “溫度” 下,這個數(shù)字也經(jīng)常出現(xiàn),而 “溫度” 是模型通常具有的一種設置,可以增加其結(jié)果的變化性。
OpenAI 的 GPT-3.5Turbo 非常喜歡47。此前,它喜歡42—— 這個數(shù)字當然因道格拉斯・亞當斯在《銀河系漫游指南》中將其定義為生命、宇宙和一切的答案而聞名。Anthropic 的 Claude3 Haiku 選擇了42,Gemini 喜歡72。
更有趣的是,所有三個模型在選擇其他數(shù)字時都展現(xiàn)出類似人類的偏見。
所有模型都傾向避免選擇低位和高位數(shù)字,Claude 從不選擇超過87或低于27的數(shù)字,即使有這樣的數(shù)字,也是異常值。兩位重復的數(shù)也被嚴格避免:沒有33、55或66,但77出現(xiàn)了(以7結(jié)尾)。幾乎沒有以0結(jié)尾的數(shù)字 —— 盡管 Gemini 有時會選擇0。
為什么會這樣呢?AI 不是人類!它們?yōu)槭裁丛谝?“似乎” 隨機?它們最終已經(jīng)獲得了意識,這是它們展示的方式嗎?
不。就像通常的情況一樣,我們過度賦予了擬人化。這些模型并不關(guān)心什么是隨機的。它們不知道 “隨機性” 是什么!它們回答這個問題的方式與回答其他問題的方式相同:查看它們的訓練數(shù)據(jù),重復在看起來像 “選擇一個隨機數(shù)字” 的問題之后最常出現(xiàn)的內(nèi)容。它出現(xiàn)的次數(shù)越多,模型就重復它的次數(shù)越多。
盡管人工智能模型的這種行為被認為是“人性化”的特點,但我們需要意識到這并不代表模型具有真正的認知能力。模型選擇的數(shù)字行為實際上只是模型重復訓練數(shù)據(jù)中的常見內(nèi)容,因為模型本身并不理解隨機性,無法進行有效進行。因此,在這些系統(tǒng)的互動中,人們需要牢記它們只是模仿的人類行為,而并非真正思考或理解。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。