首頁 > 云計算頻道 > 大模型

OpenAI canvas一夜封神，超強AI編碼研究神器，ChatGPT再次顛覆人機交互

2024年10月08日 10:40:27 來源：新智元公眾號

　　ChatGPT橫空出世以來，首次迎來界面史詩級升級!全新canvas界面，開啟了人類與AI協(xié)作研究、編碼的新時代，更代表著終極AGI人機交互形態(tài)。

　　時隔兩年，ChatGPT終迎來界面全新升級!

　　這一次，OpenAI官宣推出canvas。它不再是簡單的對話框，而是能與ChatGPT「并肩作戰(zhàn)」的全新界面。

　　不論是寫作，還是編碼，都可以開啟全新的合作方式。

　　canvas基于GPT-4o構(gòu)建，目前仍在測試階段，可在所有模型中手動選擇。

　　而且所有Plus用戶不用等待，直接可用。未來，OpenAI還計劃向所有免費用戶全面推出。

　　canvas不僅可以讓你與ChatGPT一起做研究，還能寫代碼、郵件等等，最重要的是還能幫你一起腦洞。

　　有趣的是，canvas還可以添加emoji。奧特曼在線發(fā)起投票，看看有多少人喜歡這個功能。

　　另外，canvas面板中，還多了一個快捷菜單，讓協(xié)作更加輕易便捷了。

　　審查代碼、修改bug、添加評論、log等等，一鍵完成。

　　在Canvas界面助力下，GPT-4o編碼性能飛躍18%!

　　這是要紛紛取代了GitHub C o p ilot、Cursor編碼神器了。網(wǎng)友們驚嘆道，OpenAI絕殺了Cursor。

　　還有人說，canvas的推出，是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回?fù)簟?/p>

　　在經(jīng)歷如此巨大人事變動同時，OpenAI近日多次發(fā)布更新，是向外界、投資者給出了我們依舊有實力的反饋。

　　話不多說，看看歷經(jīng)兩年，ChatGPT究竟帶了怎樣劃時代的巨變。

　　肝代碼研究，原來這么輕松

　　canvas項目負(fù)責(zé)人Karina Nguyen表示，我對終極AGI界面的愿景，是一張空白的畫布。

　　隨著時間的推移，它會根據(jù)人類偏好，自我改進。

　　而且，它會創(chuàng)造與人類互動的新方式，重新定義人類與AI，以及整個互聯(lián)網(wǎng)的聯(lián)系。

　　canvas便是，這樣一種終極AGI界面的完美「代言人」。

　　那么，它究竟如何幫人類研究、寫代碼、創(chuàng)作呢?

　　接下來，讓我們一睹為快。

　　做研究

　　當(dāng)你需要完成一項藝術(shù)史研究報告，在canvas便可以完成研究。

　　首先，將你的需求告訴ChatGPT，它便開始搜索一切所有相關(guān)的報道——Rembrandt的自畫像技巧。

　　隨之，canvas在屏幕右側(cè)開啟了全新界面，一篇研究報告，正在速成。

　　當(dāng)你對其中生成的一句話，不太確定是否正確。只需要選中，然后即刻就能喚醒ChatGPT，隨地取問。

　　又或者，當(dāng)你想要更改文中的小標(biāo)題，不如讓ChatGPT給點建議。

　　最驚艷的是，右下角「鉛筆」樣子的圖表，可以開啟文獻的閱讀模式，可以一句一句地瀏覽。

　　最后，你可以讓ChatGPT為你添加參考文獻、書目引用。

　　寫郵件

　　你還可以讓ChatGPT搜索一家最好的餐廳，它會幫你匯總所有在SF城市米其林餐廳。

　　然后讓它在為你寫一封郵件，發(fā)給最好的朋友。

　　寫代碼

　　另外，你還可以在canvas界面中，完成代碼的生成，還是可以編輯的那種。

　　以往ChatGPT只是給出結(jié)果，并不能一同編輯。

　　讓ChatGPT用Rust寫一API網(wǎng)絡(luò)服務(wù)器，它便同以往一般，為你生成了代碼。

　　然后，要求對其中一段代碼，添加登錄注冊路由。

　　并且，你還可以自己改寫其中的內(nèi)容。

　　在界面右下角，還有一個工具欄，可以進行代碼審查、轉(zhuǎn)換語言、修改bug、添加log、還有添加評論功能。

　　比如，針對剛剛生成代碼進行審查，以及修復(fù)bug，ChatGPT瞬間就完成了。

　　發(fā)明新食譜

　　更驚艷的是，在canvas模式下，還可以創(chuàng)造發(fā)明新的idea。

　　比如，你想做一個不一樣的蘋果派，可以讓ChatGPT搜索總結(jié)出，最通用的蘋果派的食譜。

　　假設(shè)你沒有其中一種材料——Nutmeg(肉豆蔻)，然后你們可以一同創(chuàng)作全新的做法。

　　與ChatGPT并肩作戰(zhàn)

　　目前，ChatGPT已常被用于協(xié)助寫作和編碼方面的任務(wù)。

　　盡管聊天界面易于使用并且適用于許多任務(wù)，但對于需要編輯和修訂的項目，仍然有些不便。

　　canvas的推出，正是要為這類工作提供新的界面，而且能讓ChatGPT更好地理解用戶提供的任務(wù)上下文。

　　當(dāng)ChatGPT檢測到可能有幫助的場景時，canvas會自動打開，也可以直接在提示詞中包含「使用canvas」的字樣來處理現(xiàn)有項目。

　　對于寫作任務(wù)，快捷編輯欄中包含5種選項，從下至上依次為:

　　- 建議編輯:ChatGPT為指定內(nèi)容提供內(nèi)聯(lián)建議和反饋

　　- 調(diào)整長度:將文字內(nèi)容編輯得更短或更長

　　- 更改閱讀級別:調(diào)整文字的閱讀難度，從幼兒園到研究生院

　　- 最后潤色:檢查語法、清晰度和一致性

　　- 添加表情符號:為強調(diào)或有顏色標(biāo)記的內(nèi)容添加相關(guān)emoji符號

　　比如，可以高亮特定部分來引起ChatGPT的關(guān)注，并讓模型在考慮整個項目的同時，提供內(nèi)聯(lián)反饋和建議。

　　奧特曼還發(fā)起了在線投票，「添加emoji是不是OpenAI有史以來發(fā)布的最好功能?」

　　對于編碼任務(wù)，快捷鍵又和寫作不同:

　　快捷鍵從下至上依次為:

　　- 檢查代碼:ChatGPT提供內(nèi)聯(lián)建議以改進代碼

　　- 添加日志(logs):插入print語句以幫助調(diào)試和理解代碼

　　- 添加注釋:為代碼添加注釋

　　- 修復(fù)bug:檢測并重寫有問題的代碼以解決bug

　　- 移植到一種語言:將您的代碼轉(zhuǎn)換為JavaScript、TypeScript、Python、Java、C++或PHP

　　「點到哪里改哪里」，修改代碼也將和修改文字一樣直觀簡單。

　　為什么要更新用戶界面?

　　OpenAI在博客中表示，如果要讓人工智能變得更有用、更易用，就需要重新思考我們?nèi)绾闻c它互動。而canvas，就是一種全新的方法，未來還將經(jīng)歷快速迭代。

　　終極AGI界面canvas，GPT-4o也被優(yōu)化了

　　為了讓模型更適應(yīng)canvas模式，團隊也對GPT-4o進行了必要的修法，添加了一些核心行為:

　　- 觸發(fā)canvas的打開，進行書寫和編碼

　　- 生成多樣化的內(nèi)容類型

　　- 進行有針對性的編輯

　　- 重寫文檔

　　- 提供內(nèi)聯(lián)形式的修改意見

　　值得一提的是，對GPT-4o進行的這些訓(xùn)練采用了OpenAI的合成數(shù)據(jù)生成技術(shù)，包含了從o1模型中提取的輸出。

　　此外，團隊還使用了20多項自動內(nèi)部評估來衡量進展情況。

　　首先，一個關(guān)鍵的挑戰(zhàn)是定義何時觸發(fā)canvas。模型既需要靈敏識別有檢查、修改需求的任務(wù)，比如「寫一篇關(guān)于咖啡豆歷史的博客文章」，同時也要避免過度觸發(fā)，比如「幫我做一份新的晚餐食譜」這種一般的任務(wù)就不太需要canvas。

　　與帶有提示指令的基線模型相比，調(diào)整后的GPT-4o的觸發(fā)決策正確率分別達到了83%和94%

　　第二個挑戰(zhàn)涉及在canvas被觸發(fā)后調(diào)整模型的編輯行為，特別是決定何時進行有針對性的編輯而不是重寫整個內(nèi)容。

　　這就要訓(xùn)練模型，在用戶明確選擇文本時，更傾向于執(zhí)行有針對性的編輯而非重寫。隨著模型不斷完善，這種行為的能力也在不斷發(fā)展。

　　相比基線模型，帶有canvas的GPT-4o在寫作和編碼任務(wù)上有18%的性能提升

　　最后，訓(xùn)練模型以生成高質(zhì)量的代碼注釋同樣需要細致的迭代過程。

　　這個評估任務(wù)與前兩種情況不同。canvas是否觸發(fā)以及是否進行了有針對性的編輯行為，很容易進行自動化評估，但以自動化方式衡量代碼注釋的質(zhì)量，因此團隊選擇了人工評估。

　　相比基線模型，集成canvas后的GPT-4o在注釋準(zhǔn)確性方面有30%的提升，質(zhì)量提高了16%。

　　這表明，與帶有詳細指令的零樣本提示相比，合成數(shù)據(jù)的訓(xùn)練顯著提高了模型的響應(yīng)質(zhì)量和行為。

　　網(wǎng)友玩瘋了

　　canvas一經(jīng)發(fā)布，已在全網(wǎng)掀起熱議。

　　Every初創(chuàng)公司創(chuàng)始人表示，很明顯，OpenAI不僅僅是在構(gòu)建聊天機器人，他們還試圖為AI時代構(gòu)建一種全新的操作系。

　　一名開發(fā)者表示，canvas界面是游戲改變者。

　　他剛剛通過canvas和ThreeJS一起創(chuàng)建了一個tesseract/Hypercube可視化工具，并稱自己喜歡統(tǒng)一的UX聊天、在線評論和觀看GPT-4o在代碼上發(fā)揮其魔力，所有這些都在一個地方完成完成，永不過時。

　　還有網(wǎng)友表示，canvas界面做的非常好，而且一切都是實時流暢的。

　　不過，它讓我們意識到一個重要的問題，我們還不確定與AI協(xié)作寫作的最佳方式是什么。

　　話雖如此，canvas讓工作更加集成集成(cyborglike)，而不是簡單地輪流進行任務(wù)(centaurlike)。

　　還有人紛紛悼念Cursor。

　　核心貢獻團隊

　　canvas背后核心團隊也隨之全部公布。

　　研究主管是Karina Nguyen，還有3位核心研究人員Kai Chen， Michael Wu， Tarun Gogineni，12位核心工程/產(chǎn)品/設(shè)計師。

　　值得一提的是，提供支持技術(shù)領(lǐng)導(dǎo)人當(dāng)中，還有離職的CTO Mira Murati。

　　在加入OpenAI之前，Karina Nguyen曾在Anthropic任職，專注研究模型對齊能力和誠實研究，以減少LLM的幻覺。

　　值得一提的是，她曾領(lǐng)到了Claude Instant1.2訓(xùn)練，在API中制作了該模型。

　　此前，作為一名設(shè)計工程師，Nguyen與Primer.ai、Dropbox、Square和《紐約時報》的團隊在研發(fā)原型、新聞工具和產(chǎn)品功能方面進行了合作。

　　Kai Chen

　　Kai Chen在賓夕法尼亞大學(xué)獲得了計算機科學(xué)本科學(xué)士學(xué)位。

　　她于2023年初加入OpenAI，此前Kai Chen還聯(lián)合創(chuàng)辦了兩家公司，一個是AI助手領(lǐng)域的Dispatch、還有一家自動化勞動任務(wù)項目的Port Tecjnologies。

　　Michael Wu

　　Michael Wu目前是OpenAI的應(yīng)用研究員。

　　此前，他曾以應(yīng)用研究科學(xué)家身份，在Facebook工作了三年，任職期間訓(xùn)練了自然語言理解和深度學(xué)習(xí)模型。

　　此外，他還在Primer AI擔(dān)任機器學(xué)習(xí)工程師、Dropbox擔(dān)任軟件工程師，在Naver Corp擔(dān)任機器學(xué)習(xí)實習(xí)生，在蘋果公司擔(dān)任機器學(xué)習(xí)實習(xí)生。

　　2015年，Michael Wu在麻省理工學(xué)院獲得了計算機科學(xué)和數(shù)學(xué)學(xué)士學(xué)位。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信

即時

BenQ DesignVue攜新品重磅亮相「創(chuàng)意界奧斯卡」Adobe Max

2024年的Adobe MAX 2024發(fā)布會上，Adobe推出了最新版本的Adobe Creative Cloud。

游戲體驗天花板一加Ace 5系列正式定檔12月26日

“耐玩戰(zhàn)神”真我Neo7今日開售：2099元起，堅持質(zhì)價比不動

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网

OpenAI canvas一夜封神，超強AI編碼研究神器，ChatGPT再次顛覆人機交互

即時

BenQ DesignVue攜新品重磅亮相「創(chuàng)意界奧斯卡」Adobe Max

新聞

明火炊具市場：三季度健康屬性貫穿全類目

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

3C消費

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器，高能實力，創(chuàng)

研究

中國信通院羅松：深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

專題

OpenAI canvas一夜封神，超強AI編碼研究神器，ChatGPT再次顛覆人機交互

擴展閱讀

OpenAI canvas一夜封神，超強AI編碼研究神器，ChatGPT再次顛覆人機交互