雖然目前 Siri 可以嘗試描述信息中的圖像,但效果并不穩(wěn)定。不過,蘋果公司并沒有放棄人工智能領(lǐng)域的探索。在最近的一篇研究論文中,蘋果的人工智能團隊描述了一種可以顯著提升 Siri 智能的模型,而且他們認為這個名為 ReALM 的模型在測試中優(yōu)于 OpenAI 的知名語言模型 GPT-4.0。
ReALM 的特別之處在于,它可以同時理解用戶屏幕上的內(nèi)容和正在進行的操作。論文將信息分為以下三種類型:
屏幕實體:指的是當(dāng)前顯示在用戶屏幕上的內(nèi)容。
對話實體:指的是與對話相關(guān)的內(nèi)容。例如,用戶說“打電話給媽媽”,那么媽媽的聯(lián)系人信息就是對話實體。
背景實體:指的是與用戶當(dāng)下操作或屏幕顯示內(nèi)容可能并不直接相關(guān)的實體,比如正在播放的音樂或即將響起的鬧鈴。
如果能夠完美運行,ReALM 將使 Siri 變得更加智能和實用。他們將 ReALM 與 OpenAI 的 GPT-3.5 和 GPT-4.0 進行了性能對比:
“我們同時測試了 OpenAI 提供的 GPT-3.5 和 GPT-4.0 模型,并為它們提供了上下文信息,讓它們預(yù)測一系列可能的實體。GPT-3.5 只接受文本輸入,因此我們只提供了文字提示。而 GPT-4 能夠理解圖像信息,因此我們?yōu)樗峁┝似聊唤貓D,這顯著提升了它的屏幕實體識別性能。”
那么蘋果的 ReALM 表現(xiàn)如何呢?
“我們的模型在識別不同類型實體方面均取得了顯著進步,即使是最小的模型,在屏幕實體識別上的準(zhǔn)確率也比原有系統(tǒng)提升了 5% 以上。與 GPT-3.5 和 GPT-4.0 的對比中,我們最小的模型與 GPT-4.0 的性能相當(dāng),而更大的模型則明顯優(yōu)于它。”
論文的結(jié)論之一是,ReALM 即使擁有比 GPT-4 少得多的參數(shù),也能在性能上與之匹敵,并且在處理特定領(lǐng)域的用戶指令時表現(xiàn)更加出色,這使得 ReALM 成為一種可以在設(shè)備端運行的、實用高效的實體識別系統(tǒng)。
對于蘋果而言,如何在不影響性能的情況下將這項技術(shù)應(yīng)用于設(shè)備似乎是關(guān)鍵所在,隨著 WWDC 2024 開發(fā)者大會即將于 6 月 10 日召開,外界普遍期待蘋果將在 iOS 18 等新系統(tǒng)中展示更多的人工智能技術(shù)成果。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。