上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運(yùn)行時安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購物體驗(yàn)全面升級機(jī)器人公司1X推出世界模型Apple Intelligence測試版現(xiàn)已開放革命性AI對話系統(tǒng)Moshi問世:機(jī)器也能說人話了?阿里國際推出最新多模態(tài)大模型 Ovis,看菜品就能提供烹飪步驟華為發(fā)布智聯(lián)集成行業(yè)解決方案,助力客戶打造行業(yè)領(lǐng)先的目標(biāo)網(wǎng)絡(luò)AI 3D生成天花板再拉升!清華團(tuán)隊(duì)煉成3D Scaling Law正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個“0元開店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?
  • GPT-4o恩怨開局,Google再次躺槍

    2024年05月20日 14:56:01   來源:零態(tài)LT

      要說全世界戲最多的AI,非OpenAI莫屬。

      這家公司簡直就是熱搜制造機(jī),剛推出新產(chǎn)品,就送走老領(lǐng)導(dǎo),剛和蘋果結(jié)盟,就逼跌谷歌股價;連OpenAI高管的一個離職動態(tài),都能引發(fā)網(wǎng)上的OpenAI離職潮。

      短短幾天時間,以O(shè)penAI為中心,接連引發(fā)地震級別的事件。不僅可能對OpenAI這家公司的未來產(chǎn)生重大影響,甚至有可能導(dǎo)致整個科技行業(yè)的重新洗牌。

      1、僅憑語音對話就撐起無限可能的GPT-4o

      美國時間5月13日,OpenAI推出了全新旗艦產(chǎn)品GPT-4o。在發(fā)布會上,OpenAI僅僅展示了GPT-4o的語音對話能力,沒有炫酷的視覺效果、沒有狂拽的新功能,但仍然再次引發(fā)了一波行業(yè)地震,因?yàn)镚PT-4o向全世界展示了其它AI產(chǎn)品可能敢想,但沒敢干的事情。

      用上GPT-4o后,用戶可以隨時打斷AI的施法,不要額外任何操作。而AI則能夠根據(jù)新的對話內(nèi)容,結(jié)合上下文繼續(xù)進(jìn)行交流,甚至可以通過語氣腔調(diào)來識別用戶的情緒,并以此給出反饋。

      用過AI對話產(chǎn)品的家人,應(yīng)該對下面那個“終止”按鈕不陌生。

      ▲圖:ChatGPT iOS app

      這個按鈕是用來讓AI閉嘴的。比如你讓AI講個故事,聽了個開頭想讓它換一個,就需要用到這個按鈕。如果是隔空喊話的AI,則需要喊出一個“安全詞”,比如“hey siri”“小度小度”等。

      這種體驗(yàn)對日常交互來說非常難受,但還有難受的。

      用過AI產(chǎn)品的家人,應(yīng)該對AI那種塵世閑游級別的響應(yīng)速度不陌生。

      舉個例子,GPT-3.5的延遲大概是2.8秒,GPT-4的延遲高達(dá)5.4秒。相比而言,特斯拉Model 3的百公里加速是2.1秒。

      這是因?yàn)橐郧暗墓ぷ髁鞒淌窍扔梢粋語音轉(zhuǎn)文字的模型,將輸入的語音轉(zhuǎn)成文字,再由負(fù)責(zé)生成答案的模型輸出文字內(nèi)容,最后由文字轉(zhuǎn)語音的模型把文字轉(zhuǎn)成語音。這三個模型互不干涉。這就導(dǎo)致在整個過程中,大量背景信息丟失了。

      看過綜藝節(jié)目里的“傳聲筒”游戲吧?

      ▲圖:傳聲筒游戲

      AI比這個更搞笑。因?yàn)槲淖植荒苷故菊Z音語調(diào),所以當(dāng)很多人一起說話的時候,GPT沒辦法判斷說“俺也一樣”的是關(guān)羽還是張飛,也不知道“我在5點(diǎn)20睡覺13點(diǎn)14準(zhǔn)時醒”是生活習(xí)慣還是歌詞。

      如果你想讓AI根據(jù)聲音給出反饋,比如讓GPT-4幫忙判斷一下深呼吸做的到不到位,它只會甩給你一篇教程,讓你自己對照體會。

      這其實(shí)是目前是市面上AI的通病,但GPT-4o的出現(xiàn),讓事情發(fā)生了巨大的轉(zhuǎn)變。

      技術(shù)層面,GPT-4o把3個互不相關(guān)的模型整合成了一個Omni模型,文字、圖像、聲音的輸入和輸出均由這個模型進(jìn)行處理。這樣就提高了GPT的響應(yīng)速度,根據(jù)OpenAI官方介紹,GPT-4o對音頻輸入的平均響應(yīng)時間只有0.3秒。實(shí)際體驗(yàn)是,和GPT-4o對話的時候,基本感覺不到延遲。

      不僅如此,因?yàn)镚PT-4o掌握了所有背景信息,從而能夠識別說話主體,甚至還能識別情緒,并根據(jù)情感狀態(tài)給出反饋。

      換句話說,AI從此具備了“察言觀色”的能力。想象一下,以后AI能根據(jù)你說話的語氣判斷你的情緒,聽到你聲音虛弱馬上幫你想好請假話術(shù);男/女朋友在場的時候自動屏蔽前任信息提示;甚至在你翹班蹦迪的時候,模仿你的腔調(diào)去應(yīng)付老板…

      這么智能的AI目前OpenAI也不敢想。實(shí)際上,他們在官網(wǎng)上謙虛的表示,公司頭一次嘗試GPT-4o這種模式,自己也在摸索這個模型的能力和短板。

      目前GPT-4o已經(jīng)可以被用戶使用了,不過免費(fèi)用戶每天使用GPT-4o的次數(shù)是有限的,而GPT-3.5則是不限量供應(yīng)。兩者的區(qū)別在于,可能不是那么容易感受出區(qū)別。另外ChatGPT也將迎來桌面端app,用戶在電腦上也可以和ChatGPT對話了。

      ▲圖:GPT-4o版本ChatGPT

      2、一邊推出新產(chǎn)品,一邊送走老領(lǐng)導(dǎo)

      就在OpenAI為新產(chǎn)品造勢的時候,團(tuán)隊(duì)創(chuàng)始成員之一、奧特曼罷免風(fēng)波關(guān)鍵人物、OpenAI超對齊項(xiàng)目創(chuàng)始人、首席科學(xué)家Ilya Sutskever宣布退出。幾個小時后,超對齊項(xiàng)目負(fù)責(zé)人Jan Leike宣布離職。

      Leike的離職動態(tài)迅速引發(fā)了一股“I resigned from @OpenAI”的“離職潮”,更具體的內(nèi)容可以觀看我們的視頻。

      而離開OpenAI后的第一天,也就是美國時間5月17日下午,Leike發(fā)了一連串動態(tài),表示自己一直都非常熱愛自己的團(tuán)隊(duì)和工作,此次無奈離職,是因?yàn)楹同F(xiàn)在核心管理層的理念分歧到達(dá)了無可調(diào)和的地步。

      他說自己來OpenAI是沖著這里的學(xué)術(shù)氛圍和對AI安全的宏愿,然而現(xiàn)在的OpenAI高層只在乎出爆款。

      他還表達(dá)了對OpenAI走向AGI的擔(dān)憂,強(qiáng)調(diào)OpenAI必須是一個安全先行的AGI公司,話里話外都透露出了絲絲苦澀。

      ▲圖:Jan Leike對OpenAI的最后寄托

      安全,同樣也是Ilya的執(zhí)念。正是出于對AGI不可知的未來的擔(dān)憂,才有了OpenAI的超對齊項(xiàng)目。

      如今,隨著兩位負(fù)責(zé)人的離開,超對齊項(xiàng)目組已經(jīng)徹底解散,項(xiàng)目組成員被拆散到不同研究領(lǐng)域。相當(dāng)于是為現(xiàn)在每個研究領(lǐng)域,都配備了一個安保人員。

      相比Leike,Ilya的理由平平無奇。他表示“將投身于某個對我個人來說,具有非凡意義的項(xiàng)目”,項(xiàng)目細(xì)節(jié)將會在未來公開。

      在分手信中,Ilya不出意外的表揚(yáng)了薩姆奧特曼、Greg Brockman、Mira Murita對OpenAI的貢獻(xiàn),同時也“堅信在三位的領(lǐng)導(dǎo)下,OpenAI將會構(gòu)建一個安全高效的AGI”。

      這句話現(xiàn)在聽起來,既是客氣,也是懇求。

      ▲圖:OpenAI領(lǐng)導(dǎo)團(tuán)隊(duì)

      而奧特曼在夸獎了Ilya并表示遺憾后,宣布Ilya的位置將有上圖中左一Jakub Pachocki接手。

      盡管分手雙方都表現(xiàn)出了應(yīng)有的風(fēng)度,不過經(jīng)歷了種種風(fēng)波后,相信各位看官應(yīng)該都心照不宣。

      緊接著,Google AI老大Jeff Dean就在Ilya下面回復(fù)了一條非常曖昧的評論:我好喜歡和你相遇,即便只是一起喝杯咖啡。

      看得出,Google這次是真的有點(diǎn)著急。

      3、蘋果OpenAI結(jié)盟在即,谷歌孤立無援四面楚歌

      曾經(jīng)一度是AI領(lǐng)頭羊的Google,如今卻被OpenAI吊打:只要OpenAI趕在Google后面推出新產(chǎn)品,Google必然被搶風(fēng)頭;只要Google晚OpenAI一步推出新產(chǎn)品,必然淹沒在GPT的熱浪中。

      就在OpenAI推出GPT-4o的第二天,谷歌在Google I/O上推出了Gemini 1.5 Pro。相比OpenAI的Spring Update,Google I/O要正式的多,推出了對標(biāo)Sora的視頻生成工具Veo等,并展示了被Gemini 1.5 pro加強(qiáng)后的產(chǎn)品,包括Google助手、搜索、Photos等等。

      首席執(zhí)行官Sundar Pichai表示,新產(chǎn)品“提供了迄今為止所有基礎(chǔ)模型中最長的上下文窗口”。

      谷歌副總裁兼Gemini體驗(yàn)總經(jīng)理Sissie Hsiao表示,Gemini 1.5 Pro很快將能夠處理一小時的視頻內(nèi)容或超過3萬行的代碼庫。

      Google AI助手的新功能Project Astra讓人印象深刻。通過手機(jī)攝像頭,智能助手可以識別出鏡頭中的物體,無論桌面上的橘子、電腦屏幕里的代碼,還是手繪在白板上的圖案。

      尤其是在問了一圈AI各種問題后,演示人員突然問AI“你看見我的眼鏡了嗎?”AI表示看見了,并且指出了位置,瞬間引爆全場。

      更讓人激動的是,現(xiàn)在我們有機(jī)會在Google搜索體驗(yàn)AI功能了,只不過可能需要一點(diǎn)小法術(shù)才能召喚出來。

      ▲圖:想用上Google的AI搜索需要一點(diǎn)小花招

      然而,他們最有熱度的消息,是讓Gemini觀看GPT-4o的發(fā)布會。

      或許Gemini最能證明自己、最能刷出存在感的途徑,就是整合到iPhone中。這樣一來,蘋果提升了產(chǎn)品的AI濃度,Gemini也實(shí)現(xiàn)了破圈。但跟蘋果的談判八字還沒一撇呢,又被OpenAI截胡了。

      據(jù)彭博社報道,蘋果即將與OpenAI達(dá)成合作協(xié)議,蘋果用戶有望在iOS 18上用上被GPT加強(qiáng)過的Siri。消息一出,Google股價大跌。

      可想而知,一旦OpenAI和蘋果建立合作關(guān)系,作為OpenAI背后的最大金主,微軟必將給Google的搜索業(yè)務(wù)帶來更大的長期風(fēng)險。

      不過,在OpenAI沒有完全搞明白GPT的思維邏輯之前,預(yù)言Google的敗局似乎還為時過早。

      4、GPT仍然沒能解決幻覺和胡編的問題

      GPT-4o中的o,是拉丁文Omni的首字母,意為“全部的”“每一個”或“全面的”,意味著該產(chǎn)品在處理多種語言和模態(tài)(如文本、音頻和視覺)方面,具有十分全面的能力。

      盡管OpenAI表示,GPT-4o的出現(xiàn),標(biāo)志著我們向“更自然的人機(jī)交互”又近了一步。然而其背后的運(yùn)行方式、思維邏輯仍然成謎,OpenAI自己對GPT突然獲得“指數(shù)級進(jìn)化”的預(yù)測能力,毫無頭緒。

      于是你就看到了這樣的搞笑一幕。

      當(dāng)你用英文詢問GPT“第一頭游過英吉利海峽的大象是誰”,GPT會煞有介事的告訴你,是一只叫做Jumbo的亞洲象。但同一個問題,換成中文就會得到一個十分合理的回答。

      ▲圖:GPT-4o亂回答

      ▲圖:GPT-4o合理的回答

      也就是說,盡管GPT可以在不同語言之間自由切換,但它們理解一個問題的方式似乎存在著差異,不免讓人對Omni產(chǎn)生懷疑。

      尤其是當(dāng)你用同樣的問題問另外一個AI,它卻給出了完全合理的回答的時候。

      ▲圖:另一款A(yù)I的回答

      類似的奇怪回答層出不窮,比如問它圓周率最后5位數(shù)字,是這么回答的。

      ▲圖:2串?dāng)?shù)字都是真實(shí)的,但不一定符合用戶的需求

      盡管OpenaI很快修復(fù)了這些“熱門bug”,但也不免讓人產(chǎn)生一個疑問:GPT-4o背后,到底有多少只能多少人工?GPT-4o到底是離AGI更近了一步,還是圍著AGI又繞了一圈呢?

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。