行業(yè)唯一!海爾熱聲熱泵技術(shù)獲全國顛覆性技術(shù)創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計:看過實車的人都喜歡這個設(shè)計林杰:未來 A 級、A0 級、A00 級車型都將是領(lǐng)克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領(lǐng)觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報告出爐2024年結(jié)束,哪里是原創(chuàng)動畫的應(yīng)許之地?
  • 首頁 > 云計算頻道 > 大模型

    OpenAI canvas一夜封神,超強AI編碼研究神器,ChatGPT再次顛覆人機交互

    2024年10月08日 10:40:27   來源:新智元公眾號

      ChatGPT橫空出世以來,首次迎來界面史詩級升級!全新canvas界面,開啟了人類與AI協(xié)作研究、編碼的新時代,更代表著終極AGI人機交互形態(tài)。

      時隔兩年,ChatGPT終迎來界面全新升級!

      這一次,OpenAI官宣推出canvas。它不再是簡單的對話框,而是能與ChatGPT「并肩作戰(zhàn)」的全新界面。

      不論是寫作,還是編碼,都可以開啟全新的合作方式。

      canvas基于GPT-4o構(gòu)建,目前仍在測試階段,可在所有模型中手動選擇。

      而且所有Plus用戶不用等待,直接可用。未來,OpenAI還計劃向所有免費用戶全面推出。

      canvas不僅可以讓你與ChatGPT一起做研究,還能寫代碼、郵件等等,最重要的是還能幫你一起腦洞。

      有趣的是,canvas還可以添加emoji。奧特曼在線發(fā)起投票,看看有多少人喜歡這個功能。

      另外,canvas面板中,還多了一個快捷菜單,讓協(xié)作更加輕易便捷了。

      審查代碼、修改bug、添加評論、log等等,一鍵完成。

      在Canvas界面助力下,GPT-4o編碼性能飛躍18%!

      這是要紛紛取代了GitHub C o p ilot、Cursor編碼神器了。網(wǎng)友們驚嘆道,OpenAI絕殺了Cursor。

      還有人說,canvas的推出,是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回?fù)簟?/p>

      在經(jīng)歷如此巨大人事變動同時,OpenAI近日多次發(fā)布更新,是向外界、投資者給出了我們依舊有實力的反饋。

      話不多說,看看歷經(jīng)兩年,ChatGPT究竟帶了怎樣劃時代的巨變。

      肝代碼研究,原來這么輕松

      canvas項目負(fù)責(zé)人Karina Nguyen表示,我對終極AGI界面的愿景,是一張空白的畫布。

      隨著時間的推移,它會根據(jù)人類偏好,自我改進。

      而且,它會創(chuàng)造與人類互動的新方式,重新定義人類與AI,以及整個互聯(lián)網(wǎng)的聯(lián)系。

      canvas便是,這樣一種終極AGI界面的完美「代言人」。

      那么,它究竟如何幫人類研究、寫代碼、創(chuàng)作呢?

      接下來,讓我們一睹為快。

      做研究

      當(dāng)你需要完成一項藝術(shù)史研究報告,在canvas便可以完成研究。

      首先,將你的需求告訴ChatGPT,它便開始搜索一切所有相關(guān)的報道——Rembrandt的自畫像技巧。

      隨之,canvas在屏幕右側(cè)開啟了全新界面,一篇研究報告,正在速成。

      當(dāng)你對其中生成的一句話,不太確定是否正確。只需要選中,然后即刻就能喚醒ChatGPT,隨地取問。

      又或者,當(dāng)你想要更改文中的小標(biāo)題,不如讓ChatGPT給點建議。

      最驚艷的是,右下角「鉛筆」樣子的圖表,可以開啟文獻的閱讀模式,可以一句一句地瀏覽。

      最后,你可以讓ChatGPT為你添加參考文獻、書目引用。

      寫郵件

      你還可以讓ChatGPT搜索一家最好的餐廳,它會幫你匯總所有在SF城市米其林餐廳。

      然后讓它在為你寫一封郵件,發(fā)給最好的朋友。

      寫代碼

      另外,你還可以在canvas界面中,完成代碼的生成,還是可以編輯的那種。

      以往ChatGPT只是給出結(jié)果,并不能一同編輯。

      讓ChatGPT用Rust寫一API網(wǎng)絡(luò)服務(wù)器,它便同以往一般,為你生成了代碼。

      然后,要求對其中一段代碼,添加登錄注冊路由。

      并且,你還可以自己改寫其中的內(nèi)容。

      在界面右下角,還有一個工具欄,可以進行代碼審查、轉(zhuǎn)換語言、修改bug、添加log、還有添加評論功能。

      比如,針對剛剛生成代碼進行審查,以及修復(fù)bug,ChatGPT瞬間就完成了。

      發(fā)明新食譜

      更驚艷的是,在canvas模式下,還可以創(chuàng)造發(fā)明新的idea。

      比如,你想做一個不一樣的蘋果派,可以讓ChatGPT搜索總結(jié)出,最通用的蘋果派的食譜。

      假設(shè)你沒有其中一種材料——Nutmeg(肉豆蔻),然后你們可以一同創(chuàng)作全新的做法。

      與ChatGPT并肩作戰(zhàn)

      目前,ChatGPT已常被用于協(xié)助寫作和編碼方面的任務(wù)。

      盡管聊天界面易于使用并且適用于許多任務(wù),但對于需要編輯和修訂的項目,仍然有些不便。

      canvas的推出,正是要為這類工作提供新的界面,而且能讓ChatGPT更好地理解用戶提供的任務(wù)上下文。

      當(dāng)ChatGPT檢測到可能有幫助的場景時,canvas會自動打開,也可以直接在提示詞中包含「使用canvas」的字樣來處理現(xiàn)有項目。

      對于寫作任務(wù),快捷編輯欄中包含5種選項,從下至上依次為:

      - 建議編輯:ChatGPT為指定內(nèi)容提供內(nèi)聯(lián)建議和反饋

      - 調(diào)整長度:將文字內(nèi)容編輯得更短或更長

      - 更改閱讀級別:調(diào)整文字的閱讀難度,從幼兒園到研究生院

      - 最后潤色:檢查語法、清晰度和一致性

      - 添加表情符號:為強調(diào)或有顏色標(biāo)記的內(nèi)容添加相關(guān)emoji符號

      比如,可以高亮特定部分來引起ChatGPT的關(guān)注,并讓模型在考慮整個項目的同時,提供內(nèi)聯(lián)反饋和建議。

      奧特曼還發(fā)起了在線投票,「添加emoji是不是OpenAI有史以來發(fā)布的最好功能?」

      對于編碼任務(wù),快捷鍵又和寫作不同:

      快捷鍵從下至上依次為:

      - 檢查代碼:ChatGPT提供內(nèi)聯(lián)建議以改進代碼

      - 添加日志(logs):插入print語句以幫助調(diào)試和理解代碼

      - 添加注釋:為代碼添加注釋

      - 修復(fù)bug:檢測并重寫有問題的代碼以解決bug

      - 移植到一種語言:將您的代碼轉(zhuǎn)換為JavaScript、TypeScript、Python、Java、C++或PHP

      「點到哪里改哪里」,修改代碼也將和修改文字一樣直觀簡單。

      為什么要更新用戶界面?

      OpenAI在博客中表示,如果要讓人工智能變得更有用、更易用,就需要重新思考我們?nèi)绾闻c它互動。而canvas,就是一種全新的方法,未來還將經(jīng)歷快速迭代。

      終極AGI界面canvas,GPT-4o也被優(yōu)化了

      為了讓模型更適應(yīng)canvas模式,團隊也對GPT-4o進行了必要的修法,添加了一些核心行為:

      - 觸發(fā)canvas的打開,進行書寫和編碼

      - 生成多樣化的內(nèi)容類型

      - 進行有針對性的編輯

      - 重寫文檔

      - 提供內(nèi)聯(lián)形式的修改意見

      值得一提的是,對GPT-4o進行的這些訓(xùn)練采用了OpenAI的合成數(shù)據(jù)生成技術(shù),包含了從o1模型中提取的輸出。

      此外,團隊還使用了20多項自動內(nèi)部評估來衡量進展情況。

      首先,一個關(guān)鍵的挑戰(zhàn)是定義何時觸發(fā)canvas。模型既需要靈敏識別有檢查、修改需求的任務(wù),比如「寫一篇關(guān)于咖啡豆歷史的博客文章」,同時也要避免過度觸發(fā),比如「幫我做一份新的晚餐食譜」這種一般的任務(wù)就不太需要canvas。

      與帶有提示指令的基線模型相比,調(diào)整后的GPT-4o的觸發(fā)決策正確率分別達到了83%和94%

      第二個挑戰(zhàn)涉及在canvas被觸發(fā)后調(diào)整模型的編輯行為,特別是決定何時進行有針對性的編輯而不是重寫整個內(nèi)容。

      這就要訓(xùn)練模型,在用戶明確選擇文本時,更傾向于執(zhí)行有針對性的編輯而非重寫。隨著模型不斷完善,這種行為的能力也在不斷發(fā)展。

      相比基線模型,帶有canvas的GPT-4o在寫作和編碼任務(wù)上有18%的性能提升

      最后,訓(xùn)練模型以生成高質(zhì)量的代碼注釋同樣需要細致的迭代過程。

      這個評估任務(wù)與前兩種情況不同。canvas是否觸發(fā)以及是否進行了有針對性的編輯行為,很容易進行自動化評估,但以自動化方式衡量代碼注釋的質(zhì)量,因此團隊選擇了人工評估。

      相比基線模型,集成canvas后的GPT-4o在注釋準(zhǔn)確性方面有30%的提升,質(zhì)量提高了16%。

      這表明,與帶有詳細指令的零樣本提示相比,合成數(shù)據(jù)的訓(xùn)練顯著提高了模型的響應(yīng)質(zhì)量和行為。

      網(wǎng)友玩瘋了

      canvas一經(jīng)發(fā)布,已在全網(wǎng)掀起熱議。

      Every初創(chuàng)公司創(chuàng)始人表示,很明顯,OpenAI不僅僅是在構(gòu)建聊天機器人,他們還試圖為AI時代構(gòu)建一種全新的操作系。

      一名開發(fā)者表示,canvas界面是游戲改變者。

      他剛剛通過canvas和ThreeJS一起創(chuàng)建了一個tesseract/Hypercube可視化工具,并稱自己喜歡統(tǒng)一的UX聊天、在線評論和觀看GPT-4o在代碼上發(fā)揮其魔力,所有這些都在一個地方完成完成,永不過時。

      還有網(wǎng)友表示,canvas界面做的非常好,而且一切都是實時流暢的。

      不過,它讓我們意識到一個重要的問題,我們還不確定與AI協(xié)作寫作的最佳方式是什么。

      話雖如此,canvas讓工作更加集成集成(cyborglike),而不是簡單地輪流進行任務(wù)(centaurlike)。

      還有人紛紛悼念Cursor。

      核心貢獻團隊

      canvas背后核心團隊也隨之全部公布。

      研究主管是Karina Nguyen,還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni,12位核心工程/產(chǎn)品/設(shè)計師。

      值得一提的是,提供支持技術(shù)領(lǐng)導(dǎo)人當(dāng)中,還有離職的CTO Mira Murati。

      在加入OpenAI之前,Karina Nguyen曾在Anthropic任職,專注研究模型對齊能力和誠實研究,以減少LLM的幻覺。

      值得一提的是,她曾領(lǐng)到了Claude Instant1.2訓(xùn)練,在API中制作了該模型。

      此前,作為一名設(shè)計工程師,Nguyen與Primer.ai、Dropbox、Square和《紐約時報》的團隊在研發(fā)原型、新聞工具和產(chǎn)品功能方面進行了合作。

      Kai Chen

      Kai Chen在賓夕法尼亞大學(xué)獲得了計算機科學(xué)本科學(xué)士學(xué)位。

      她于2023年初加入OpenAI,此前Kai Chen還聯(lián)合創(chuàng)辦了兩家公司,一個是AI助手領(lǐng)域的Dispatch、還有一家自動化勞動任務(wù)項目的Port Tecjnologies。

      Michael Wu

      Michael Wu目前是OpenAI的應(yīng)用研究員。

      此前,他曾以應(yīng)用研究科學(xué)家身份,在Facebook工作了三年,任職期間訓(xùn)練了自然語言理解和深度學(xué)習(xí)模型。

      此外,他還在Primer AI擔(dān)任機器學(xué)習(xí)工程師、Dropbox擔(dān)任軟件工程師,在Naver Corp擔(dān)任機器學(xué)習(xí)實習(xí)生,在蘋果公司擔(dān)任機器學(xué)習(xí)實習(xí)生。

      2015年,Michael Wu在麻省理工學(xué)院獲得了計算機科學(xué)和數(shù)學(xué)學(xué)士學(xué)位。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。