昨日,OpenAI發(fā)布可實時進行音頻、視覺和文本推理的新一代AI模型GPT-4o引發(fā)廣泛關注。今日,360集團創(chuàng)始人、董事長周鴻祎發(fā)表視頻分享了自己對于GPT-4o技術原理的理解和潛在的社會影響。
在談及GPT-4o的技術原理時,周鴻祎指出,據(jù)OpenAI發(fā)布會上簡短的技術原理介紹,區(qū)別于傳統(tǒng)將把語音先翻譯成文字處理后再翻譯成語音的做法,這次的技術是直接把語音進行了處理,形成了一個整合的大模型引擎,實現(xiàn)對語音輸入的直接理解——包括把語音中飽含的情緒、感情、語調(diào)、口音這些細節(jié)都進行了理解,同時是直接輸出語音。
“這就帶來了一個全新的體驗,就是時延大概只有300毫秒左右,達到了人類和人類談話的響應速度,這樣不僅能聽得懂你話里的情緒,在輸出回答的時候也可以伴隨著高興、悲傷、失望、興奮或者是更復雜的感情。”周鴻祎表示。
周鴻祎還指出,除了語音處理層面帶來的驚艷之外,有一個容易被忽視的地方是,實際上GPT-4o的還可以直接打開手機攝像頭,直接通過手機攝像頭賦予它更強大的眼睛的能力。這個可能還比不上Sora,但是它比GPT-4.5的版本可以輸入圖片輸入表格的能力又提升了一步。“所以總結(jié)來講就是,GPT-4.0相當于給人工智能賦予了對知識理解的能力,相當于有了一個大腦,然后GPT-4.5相當于給了一些初級的看見的能力,而GPT-4o實際上是給它增加了真正能看懂這個世界的眼睛,和能聽明白人說話的耳朵,而且嘴巴還能夠自由自在地表達自己情緒和情感的能力。”。
在周鴻祎看來,有些人會對此次發(fā)布OpeanAI沒有推出GPT-5.0覺得比較失望,但是通向通用人工智能不僅是要在超級的推理能力、知識能力、邏輯能力上要趕超人類,更重要的能力還包括跟人交互的能力。所以,當AI能通過無論是手機攝像頭還是無處不在的物聯(lián)網(wǎng)攝像頭更看明白這個世界,而且能以跟人一樣的響應速度進行交互的時候,這件事就變得非?膳铝,“也就是它就讓人工智能真正的更像人了”。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。