ChatGPT 的創(chuàng)造性思維可以與排名前 1% 的人類相媲美

2023年07月18日 16:07:47 來源：站長之家

　　蒙大拿大學(xué)的一項(xiàng)新研究表明，人工智能聊天機(jī)器人 ChatGPT 可以與人類中排名前 1% 的最頂尖的思考者相媲美。

　　研究人員將經(jīng)常使用的創(chuàng)造性思維測試 Torrance(TTCT，一種常用的創(chuàng)造力測試)應(yīng)用于 ChatGPT，并記錄了八個(gè)回答。他們還收集了蒙大拿大學(xué) 24 名學(xué)生的回答。這些分?jǐn)?shù)與全美 2700 名參加 TTCT 測試的學(xué)生進(jìn)行了比較。

　　所有回答都由學(xué)術(shù)測試服務(wù)機(jī)構(gòu)評分，該機(jī)構(gòu)并不知道有人工智能的答案提交。

　　根據(jù)研究人員的說法，AI 的回答和參加測試的最具創(chuàng)造力的真人回答一樣有創(chuàng)造力。實(shí)際上，ChatGPT 的表現(xiàn)超過了全國大多數(shù)學(xué)生。

　　研究的作者、蒙大拿大學(xué)商學(xué)院助理臨床教授 Erik Guzik 告訴 ScienceDaily.com，這一發(fā)現(xiàn)令人驚訝。Guzik 的研究領(lǐng)域包括創(chuàng)業(yè)和創(chuàng)造力的經(jīng)濟(jì)方面。

　　Guzik 說：「對我來說，創(chuàng)造力意味著以不同的方式做事。我喜歡創(chuàng)業(yè)的一種定義，即創(chuàng)業(yè)者是以不同的方式思考。因此，人工智能可能幫助我們將創(chuàng)造性思維應(yīng)用于商業(yè)和創(chuàng)新過程，這讓我著迷。」

　　TTCT 包含兩種不同的評估：口頭和圖形。兩種評估都衡量發(fā)散性思維，即用于產(chǎn)生創(chuàng)造性想法的思維過程。

　　在口頭評估中，測試者將獲得圖片/口頭提示，并被要求用書面形式回答。例如，他們可能會(huì)看到一個(gè)事件的圖片，并被要求假設(shè)結(jié)果�；蛘咚麄兛赡軙�(huì)看到一個(gè)產(chǎn)品，并被要求提出改進(jìn)意見。他們的答案用于評估三種心理特征：

　　流暢性：相關(guān)想法的數(shù)量

　　獨(dú)創(chuàng)性：想法的獨(dú)特性

　　靈活性：各種不同類型的想法

　　圖形評估要求測試者用繪圖回答。例如，他們可能會(huì)被要求完成一幅圖片。除了流暢性和獨(dú)創(chuàng)性，圖形測試還評估以下技能：

　　闡述能力：在滿足最低要求之外增加想法

　　抵抗過早結(jié)束：一個(gè)人能否容忍足夠的歧義來提出創(chuàng)造性的回答

　　標(biāo)題的抽象程度：能否創(chuàng)造性地給圖形命名

　　在這項(xiàng)研究中，ChatGPT 的回答在流暢性和獨(dú)創(chuàng)性方面處于頂級(jí)百分位數(shù)。當(dāng)涉及到靈活性時(shí)，回答得分進(jìn)入了 97% 的百分位數(shù)。

　　「我們一直在探索 ChatGPT，我們注意到它正在做一些我們意想不到的有趣的事情�！笹uzik 說�！敢恍┗卮鹗切路f和令人驚訝的。就在那時(shí)，我們決定對它進(jìn)行測試，看看它的創(chuàng)造力到底有多強(qiáng)�！�

　　Guzik 并不想過分夸大 ChatGPT 對經(jīng)濟(jì)的影響，但他確信它將成為創(chuàng)新的推動(dòng)力。