最近,人們發(fā)現(xiàn)了一個有趣的現(xiàn)象,即AI模型在選擇數(shù)字時表現(xiàn)出類似人類的購買和避好行為,這證明了模型在回答問題時重復訓練數(shù)據(jù)中的常見內(nèi)容。這種行為具有確定“人性化”的特點,雖然模型本身并不具備人類的認知能力。
在實驗中,一些工程師要求幾個主要的LLM聊天機器人隨機選取0到100之間的數(shù)字。結果顯示,所有模型都有一個“最喜歡的”數(shù)字,表明它們在選擇數(shù)字時表現(xiàn)出了偏好。即使在“溫度”下,這三個模型在選擇的其他數(shù)字時也表現(xiàn)出類似人類的偏見。這種現(xiàn)象揭示了人工智能模型表現(xiàn)出的“人性化”特征,解答人們與這些系統(tǒng)時需要記住其模仿人類行為的本質提供了啟示。
Gramener 的一些工程師進行了一項非正式但仍然引人入勝的實驗,他們簡單地要求幾個主要的 LLM 聊天機器人在0到100之間選擇一個隨機數(shù)字,結果并不隨機。
三個經(jīng)過測試的模型都有一個 “喜歡” 的數(shù)字,在最確定性的模式下,這個數(shù)字總是它們的答案,但即使在更高的 “溫度” 下,這個數(shù)字也經(jīng)常出現(xiàn),而 “溫度” 是模型通常具有的一種設置,可以增加其結果的變化性。
OpenAI 的 GPT-3.5Turbo 非常喜歡47。此前,它喜歡42—— 這個數(shù)字當然因道格拉斯・亞當斯在《銀河系漫游指南》中將其定義為生命、宇宙和一切的答案而聞名。Anthropic 的 Claude3 Haiku 選擇了42,Gemini 喜歡72。
更有趣的是,所有三個模型在選擇其他數(shù)字時都展現(xiàn)出類似人類的偏見。
所有模型都傾向避免選擇低位和高位數(shù)字,Claude 從不選擇超過87或低于27的數(shù)字,即使有這樣的數(shù)字,也是異常值。兩位重復的數(shù)也被嚴格避免:沒有33、55或66,但77出現(xiàn)了(以7結尾)。幾乎沒有以0結尾的數(shù)字 —— 盡管 Gemini 有時會選擇0。
為什么會這樣呢?AI 不是人類!它們?yōu)槭裁丛谝?“似乎” 隨機?它們最終已經(jīng)獲得了意識,這是它們展示的方式嗎?
不。就像通常的情況一樣,我們過度賦予了擬人化。這些模型并不關心什么是隨機的。它們不知道 “隨機性” 是什么!它們回答這個問題的方式與回答其他問題的方式相同:查看它們的訓練數(shù)據(jù),重復在看起來像 “選擇一個隨機數(shù)字” 的問題之后最常出現(xiàn)的內(nèi)容。它出現(xiàn)的次數(shù)越多,模型就重復它的次數(shù)越多。
盡管人工智能模型的這種行為被認為是“人性化”的特點,但我們需要意識到這并不代表模型具有真正的認知能力。模型選擇的數(shù)字行為實際上只是模型重復訓練數(shù)據(jù)中的常見內(nèi)容,因為模型本身并不理解隨機性,無法進行有效進行。因此,在這些系統(tǒng)的互動中,人們需要牢記它們只是模仿的人類行為,而并非真正思考或理解。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。