蒙大拿大學(xué)的一項新研究表明,人工智能聊天機器人 ChatGPT 可以與人類中排名前 1% 的最頂尖的思考者相媲美。
研究人員將經(jīng)常使用的創(chuàng)造性思維測試 Torrance(TTCT,一種常用的創(chuàng)造力測試)應(yīng)用于 ChatGPT,并記錄了八個回答。他們還收集了蒙大拿大學(xué) 24 名學(xué)生的回答。這些分數(shù)與全美 2700 名參加 TTCT 測試的學(xué)生進行了比較。
所有回答都由學(xué)術(shù)測試服務(wù)機構(gòu)評分,該機構(gòu)并不知道有人工智能的答案提交。
根據(jù)研究人員的說法,AI 的回答和參加測試的最具創(chuàng)造力的真人回答一樣有創(chuàng)造力。實際上,ChatGPT 的表現(xiàn)超過了全國大多數(shù)學(xué)生。
研究的作者、蒙大拿大學(xué)商學(xué)院助理臨床教授 Erik Guzik 告訴 ScienceDaily.com,這一發(fā)現(xiàn)令人驚訝。Guzik 的研究領(lǐng)域包括創(chuàng)業(yè)和創(chuàng)造力的經(jīng)濟方面。
Guzik 說:「對我來說,創(chuàng)造力意味著以不同的方式做事。我喜歡創(chuàng)業(yè)的一種定義,即創(chuàng)業(yè)者是以不同的方式思考。因此,人工智能可能幫助我們將創(chuàng)造性思維應(yīng)用于商業(yè)和創(chuàng)新過程,這讓我著迷。」
TTCT 包含兩種不同的評估:口頭和圖形。兩種評估都衡量發(fā)散性思維,即用于產(chǎn)生創(chuàng)造性想法的思維過程。
在口頭評估中,測試者將獲得圖片/口頭提示,并被要求用書面形式回答。例如,他們可能會看到一個事件的圖片,并被要求假設(shè)結(jié)果。或者他們可能會看到一個產(chǎn)品,并被要求提出改進意見。他們的答案用于評估三種心理特征:
流暢性:相關(guān)想法的數(shù)量
獨創(chuàng)性:想法的獨特性
靈活性:各種不同類型的想法
圖形評估要求測試者用繪圖回答。例如,他們可能會被要求完成一幅圖片。除了流暢性和獨創(chuàng)性,圖形測試還評估以下技能:
闡述能力:在滿足最低要求之外增加想法
抵抗過早結(jié)束:一個人能否容忍足夠的歧義來提出創(chuàng)造性的回答
標題的抽象程度:能否創(chuàng)造性地給圖形命名
在這項研究中,ChatGPT 的回答在流暢性和獨創(chuàng)性方面處于頂級百分位數(shù)。當(dāng)涉及到靈活性時,回答得分進入了 97% 的百分位數(shù)。
「我們一直在探索 ChatGPT,我們注意到它正在做一些我們意想不到的有趣的事情。」Guzik 說。「一些回答是新穎和令人驚訝的。就在那時,我們決定對它進行測試,看看它的創(chuàng)造力到底有多強!
Guzik 并不想過分夸大 ChatGPT 對經(jīng)濟的影響,但他確信它將成為創(chuàng)新的推動力。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數(shù)碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費者帶來超值低價與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。