終端創(chuàng)企Nothing擬募資1億美元 一加聯(lián)合創(chuàng)始人創(chuàng)立恩智浦獲歐洲投資銀行 10 億歐元貸款,用于在歐多國研發(fā)創(chuàng)新工作入手松下ZS99相機(jī)新品首選京東 售價2998元可先人一步入手1月20日打開京東搜索「1」 3C數(shù)碼“瘋狂星期一”爆款低至1元當(dāng)代年輕人用上AI,從夸克開始消息稱iPhone SE 4將有白色和黑色 預(yù)計3月份推出全球PC市場迎來溫和復(fù)蘇:2024年出貨量增長1.3%,聯(lián)想和蘋果表現(xiàn)亮眼比亞迪已在韓國推出Atto 3 預(yù)計2月中旬開始交付發(fā)展新質(zhì)生產(chǎn)力 賦能健康產(chǎn)品力 ——勁牌有限公司2024年度科技責(zé)任(成果)報告美光減產(chǎn)后 SK海力士也計劃將上半年NAND閃存產(chǎn)量削減一成趙明離職信曝光:離開榮耀是人生中最艱難的決定消息稱京東服飾換帥,阿里前高管擔(dān)任負(fù)責(zé)人這年頭,誰在互聯(lián)網(wǎng)上學(xué)這么“硬核”的AI?開戰(zhàn)2025,本地生活商家「另辟蹊徑」年底Mini LED電視到底怎么選?認(rèn)準(zhǔn)這些新技術(shù)不踩雷!數(shù)據(jù)顯示:ChatGPT Plus成為AI訂閱服務(wù)留存率冠軍宇樹科技公布G1人形機(jī)器人新升級:可柔順行走、仿人奔跑B站年度盤點(diǎn):誰是大金主?誰在賺“小”錢?我國網(wǎng)民規(guī)模首次超過11.08億人:互聯(lián)網(wǎng)普及率78.6%紅魔手機(jī)國補(bǔ)官宣:1月20日起享15%補(bǔ)貼 到手價3399元起
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    Siri 們的“智障”終于有救了?

    2023年05月03日 09:03:50   來源:微信公眾號:字母榜

      “今天北京比上海熱嗎?”

      摸著良心講,問這個問題的時候,并沒有想刁難Siri。但是Siri它就是回答不上來。

      “今天似乎是晴天。”Siri天真(但驢唇不對馬嘴)地回答,配以用戶所在的上海的天氣卡片。

      用同樣的問題去問必應(yīng)機(jī)器人,它雖然沒有直接回答是或否,但至少給出了兩地的氣溫數(shù)據(jù)。

      不光是Siri,語音助手們十年間似乎一點(diǎn)長進(jìn)都沒有。用戶也已經(jīng)習(xí)慣于對它們降低要求,給出明確、直接的指令:“音量小一些”“關(guān)燈”“下一首”。

      但ChatGPT的出現(xiàn)改變了一切。人們感受著ChatGPT、新必應(yīng)機(jī)器人、谷歌Bard等一眾大語言模型驅(qū)動的機(jī)器人切題、流暢、豐富的對話能力,Siri們的呆板從未如此明顯。

      語音助手背后的大公司們也感受到了壓力。

      北京時間4月28日,亞馬遜發(fā)布2023年*財季財報,CEO安迪·賈西(Andy Jassy)在電話會議上表示:“我們已經(jīng)在Alexa下面建立了一個大語言模型,但我們正在構(gòu)建一個更大、更通用、更有能力的大語言模型,我認(rèn)為這將會加速我們成為世界上*的個人助理的愿景。”

      幾乎同一時間,The Information爆出消息,蘋果的工程師正在醞釀將LLM大語言模型與Siri結(jié)合,推出更聰明的Siri,隨此后的iOS更新與用戶見面。

      谷歌似乎將資源在谷歌助手與Bard間進(jìn)行了重新分配,在架構(gòu)上將二者融合。

      國內(nèi),在本月早些時候,阿里宣布所有產(chǎn)品未來將接入“通義千問”大模型,其中當(dāng)然也包括天貓精靈。在官方演示Demo中,新天貓精靈支持自由對話,根據(jù)用戶需求和場景隨時生成內(nèi)容,比如“合成1小時歌單,50%穿插搖滾風(fēng)格的歌曲”。

      從令人振奮,到令人失望,從代表未來,到明日黃花,Siri們走過了十幾個春秋,終于站在了抉擇的路口。

      2011年10月,蒂姆·庫克(Tim Cook)迎來自己接任蘋果CEO后的*場大型發(fā)布會。

      全世界期待的iPhone 5沒有如約而至,庫克拿出的是中間代產(chǎn)品iPhone 4s。拯救那次新品發(fā)布的,是蘋果全新的數(shù)字語音助理產(chǎn)品Siri。

      在此之前,手機(jī)內(nèi)嵌語音指令功能并不是個新鮮事。中國用戶印象最深的也許是“金立語音王”,按住按鈕說出想撥打電話的用戶名,手機(jī)就會把電話打出去。

      但這種語音功能能做的事情很少(基本就是打電話),對指令的識別率也不高,你必須嚴(yán)格說出“打電話給XXX”才行,“給XXX打個電話”都行不通。

      Siri顯然是另一個維度的產(chǎn)品:用自然的語言,更靈活的指令,使喚設(shè)備做更多的事情,如查天氣、查地圖、讀短信、設(shè)置提醒事項和鬧鐘等等。

      結(jié)果大家都知道了,iPhone 4s成為蘋果手機(jī)史上的一個經(jīng)典機(jī)型,推出的那個季度銷量是上一個季度的兩倍有余,分析師也紛紛上調(diào)后續(xù)的銷量預(yù)期。據(jù)當(dāng)時Sterne Agee公司發(fā)表的投資者聲明,Siri正是推動銷量的重要原因。

      亞馬遜在2014年將 Alexa 安裝到最初的 Echo 揚(yáng)聲器上,自那以后,Echo 設(shè)備迅速擴(kuò)張,*代兩年銷量超過500萬臺。Alexa語音助手也從智能音箱走向更多終端設(shè)備。

      而谷歌也在2016年推出,作為 Google Now 的一個擴(kuò)展,它不僅提供個性化元素——從 Google 日歷、 Gmail 和其他 Google 服務(wù)中獲取信息——還能理解上下文,識別不同的語音配置文件,并支持諸如“持續(xù)對話”和“翻譯模式”等功能。

      基于安卓的手機(jī)廠商們,也紛紛定制自己的語音助手,如三星于2017年推出Bixby,同年小米推出“小愛同學(xué)”。如今,主流手機(jī)廠商幾乎都會給設(shè)備內(nèi)置個語音助手,如華為的小藝,OPPO的小布,Vivo的小V等。這些助手也被同步進(jìn)廠商的其他產(chǎn)品如電腦、平板電腦、智能手表中。

      智能音箱作為語音助手最直接的載體,也成為大廠們爭相布局的領(lǐng)域,谷歌有Nest Audio,蘋果也推出了HomePod,國內(nèi)阿里有天貓精靈,小米則有小愛音箱。

      在消費(fèi)電子領(lǐng)域,內(nèi)置語音助手已經(jīng)相對普及。據(jù)TechInsights,2022年內(nèi)置語音助手的消費(fèi)電子設(shè)備出貨量為22億臺,包括智能手機(jī)、智能電視、無線音箱、平板電腦、可穿戴設(shè)備等。其中手機(jī)占50%,可穿戴設(shè)備為第二大細(xì)分市場。

      另據(jù)Statista,2022年美國大約有1.42億語音助手用戶,幾乎占全國人口的一半。

      遺憾的是,有不代表好用,語音助手大行其道的另一面,是其被嫌棄的一生。

      雖然Siri的推出引來人們的嘗試熱情,但失望接踵而來,而且隨著時間的推移,這種失望在不斷擴(kuò)大。

      早在其剛推出的那幾年,網(wǎng)絡(luò)上就有很多關(guān)于Siri奇葩回答的討論。2012年,也就是Siri發(fā)布的次年,投資銀行Piper Jaffray分析師基尼·蒙斯特(Gene Munster)最近對Siri進(jìn)行了一系列測試,發(fā)現(xiàn)在1600多項語音測試中,Siri的回答準(zhǔn)確率只有68%,而在喧鬧的室外環(huán)境,這一數(shù)字還會降低。

      但在那個時候,多數(shù)人還是對Siri滿意的。彼時研究公司Parks Associates分析總監(jiān)約翰·巴里特(John Barrett)對482名iPhone用戶進(jìn)行了調(diào)查,有55%給予Siri高分評價,21%很滿意,只有10%完全不滿意。

      然而到了2017年,Adobe的研究報告顯示,37%的受訪用戶認(rèn)為他們與語音助手的互動“并不好”或者“非常糟糕”,26%的用戶表示體驗“還行”,只有37%的用戶持積極態(tài)度。

      到了2018年,調(diào)研公司Creative Strartegies的調(diào)查報告顯示,Siri的用戶滿意度僅為20%。

      一個具有代表性的事件是,亞馬遜的Alexa在2018年還搞出了個“賽博靈異事件”。多位用戶表示Alexa在毫無預(yù)警的情況下發(fā)出詭異的笑聲,亞馬遜不僅發(fā)表公開聲明解釋原因(可能是將環(huán)境噪音錯誤識別為“Alexa,笑一個”),還緊急上線了產(chǎn)品補(bǔ)丁。

      同樣的情況也發(fā)生在其他語音助手上:自己突然說話、答非所問、不聽指揮等等。

      到了如今,智能語音助手已經(jīng)不能符合人們對“智能”的想象。但這些吐槽和抱怨,似乎沒有推動語音助手的明顯進(jìn)化。語音助手的“愚蠢”就像房間里的大象,被科技大公司們集體忽視了。

      一個最明顯的例子是,如果你去觀看2011年蘋果發(fā)布會上的Siri演示,會發(fā)現(xiàn)其用法和處理能力和今天相比沒有什么明顯的差別。

      直到ChatGPT的出現(xiàn),才讓這個“大象”被看見。雖然自己也曾推出PC語音助手Cortana,但乘上ChatGPT快車的微軟毫不手軟,直接點(diǎn)出了問題。

      3月,在接受英國《金融時報》采訪時,微軟CEO薩蒂亞·納德拉(Satya Nadella)表示:“無論是Cortana、Alexa、Google Assistant還是Siri,這些語音助手笨得像塊石頭(dumb as a rock)。我們最新推出的產(chǎn)品(必應(yīng)聊天機(jī)器人),具備這些語音助手所無法提供的功能。”

      Siri們的“愚笨”,或者說與ChatGPT相比之下的呆板,直接原因自然是背后的技術(shù)。

      ChatGPT為代表的新一代聊天機(jī)器人由大型語言模型(LLM)驅(qū)動,這些模型系統(tǒng)經(jīng)過大量網(wǎng)絡(luò)數(shù)據(jù)集的訓(xùn)練,能識別和生成基于數(shù)據(jù)集的文本,在此基礎(chǔ)上生成完整的句子。

      而Siri、Alexa和谷歌助手基本上都屬于所謂的命令和控制系統(tǒng)。這些系統(tǒng)智能理解有限的問題和請求,如果用戶所提出的問題不在其代碼中,助手就無能為力。

      根據(jù)《紐約時報》的一篇報道,曾在蘋果負(fù)責(zé)Siri項目的工程師約翰·柏基(John Burkey)表示,由于設(shè)計的繁瑣,為Siri添加新功能很難。

      他曾于2014年受命對Siri進(jìn)行改進(jìn),而它的數(shù)據(jù)庫就像一個“巨大的雪球”,要在Siri的數(shù)據(jù)庫里添加哪怕一個單詞,“實際上就是在一大堆無序的數(shù)據(jù)庫中再添加一些數(shù)據(jù)。”

      同樣的問題,Alexa和谷歌助手也有。

      作為硅谷頭部科技巨頭,調(diào)用人才和財力為語音助手改頭換面不就行了?可惜事情沒有那么簡單。

      *個問題是,他們有沒有動力這么做?

      用戶自然是希望語音助手更聰明,自從ChatGPT出現(xiàn),互聯(lián)網(wǎng)上就不斷有“如何將ChatGPT接入我的手機(jī)”這樣的提問。而且,目前也已經(jīng)有基于GPT的語音助手應(yīng)用推出。

      但這并不足以讓巨頭們做出戰(zhàn)略決策。Alexa雖然幫助亞馬遜搶占了智能音箱市場的份額,但卻并沒有清晰的商業(yè)化路徑,甚至是在做賠本買賣。亞馬遜的野心是通過語音助手將用戶引至電商消費(fèi),但隨著時間的推移,大部分的用戶只不過用Alexa執(zhí)行諸如“聽音樂”“關(guān)燈”等基礎(chǔ)指令。

      去年底,亞馬遜宣布裁員1.7萬人,其中,負(fù)責(zé)Alexa的“全球數(shù)字”部門成為了裁員重災(zāi)區(qū),部分高管離開了公司。據(jù)BusinessInsider,這個部門僅在2022年*季度就虧損了30億美元,罪魁禍?zhǔn)拙褪茿lexa,這是其他部門虧損總和的兩倍。

      Alexa

      該報道還稱,硬件團(tuán)隊2022年預(yù)計虧損100億美元。

      谷歌助手雖然在語音助手中占比很高,在美國是市場份額*的語音助手,但似乎被亞馬遜誤導(dǎo),走了同樣的彎路。從2016年到2021年的5年里,谷歌發(fā)布了8個主要的內(nèi)嵌主搜的音箱/智能顯示器硬件產(chǎn)品,自那以后似乎就陷入停滯。

      2022年,谷歌移除了助手對兩個內(nèi)部產(chǎn)品線的支持,NestWifi路由器和Fitbit可穿戴設(shè)備。同年,The Information報道稱,胡歌欲減少在開發(fā)谷歌助手語音輔助搜索功能方面的投資。

      谷歌助手和Alexa一樣,沒有什么賺錢的路徑,無廣告,無訂閱模式,就是一個兢兢業(yè)業(yè)的助手,還經(jīng)常幫不到點(diǎn)子上。

      將ChatGPT、Bard等聊天機(jī)器人背后的大型語言模型應(yīng)用在語音助手上,自然對功能體驗有提升,但仍然無法解決產(chǎn)品商業(yè)化的問題。

      至于蘋果,則深深受制于“保護(hù)用戶隱私”。幾年前Siri因為“偷聽”丑聞,收回了所有Siri項目的外包公司,對用戶和Siri之間對話的私密性更加尊重。但這對于大語言模型來說,就意味著訓(xùn)練數(shù)據(jù)的匱乏。

      第二個問題是,身形龐大的科技巨頭,轉(zhuǎn)起身來有困難。

      不管是Siri、Alexa還是谷歌助手,都已經(jīng)發(fā)展多年,要做大變革,最容易被外界忽略,卻也最棘手的問題,便是內(nèi)部的資源分配。

      蘋果的Siri從一開始就歷經(jīng)坎坷,喬布斯剛開始親自指導(dǎo)該項目,卻在產(chǎn)品上線第二天去世。到了發(fā)布一年之后,Siri就已經(jīng)經(jīng)歷三位負(fù)責(zé)人,而內(nèi)部的分歧不斷。不僅有管理方式的分歧,也有搜索、語音識別、自然語義的派系紛爭。

      到了2022年,又有三位關(guān)鍵人物 Srinivasan Venkatachary、Steven Baker 和 Anand Shukla離開,他們是機(jī)器學(xué)習(xí)初創(chuàng)公司Laselike的創(chuàng)始人,后被蘋果以1.5億美元收購。這次離開,他們投入了谷歌的懷抱。

      讓Siri進(jìn)行大轉(zhuǎn)向,勢必又要涉及到內(nèi)部人員和資源的重新分配:誰來領(lǐng)導(dǎo)項目?走什么路徑?過往人員是去是留?這都是擺在庫克面前的老大難問題。

      谷歌倒是已經(jīng)做出了選擇。

      3月底,CNBC報道了谷歌的團(tuán)隊變化,根據(jù)一份泄露的內(nèi)部備忘錄,谷歌助理似乎為公司新的超級巨星Bard讓路。

      這份名為“助理和Bard團(tuán)隊的變化”的備忘錄顯示,公司將把Bard作為高度優(yōu)先事項。曾擔(dān)任谷歌助理項目副總裁的Jianchang Mao離職,該項目另一位副總裁則將負(fù)責(zé)Bard團(tuán)隊的工作,此前負(fù)責(zé)Bard項目的高管繼續(xù)擔(dān)任Bard“區(qū)域技術(shù)領(lǐng)導(dǎo)”。

      看起來,谷歌已經(jīng)做好了將Bard和谷歌助理融合的準(zhǔn)備。

      至于亞馬遜,在長久的沉默之后,終于宣布要用LLM給Alexa做升級,但具體怎么做,并沒有對外透露。剛剛經(jīng)歷了裁員重創(chuàng)的內(nèi)部團(tuán)隊要如何重振希望,是賈西要解決的難題。

      Siri們已經(jīng)意識到了ChatGPT的威脅,不進(jìn)則退的局面已經(jīng)形成。至于怎么進(jìn),這是個問題。

      希望有天我們可以拿起手機(jī)問Siri:“今天北京比上海熱嗎?”并得到令人滿意的有效回答。

      參考資料:

      1、澎湃新聞:《谷歌被曝調(diào)整虛擬助理部門領(lǐng)導(dǎo)架構(gòu),未來或集成Bard技術(shù)》

      2、愛范兒:《 從*到落后,蘋果 Siri 和它動蕩的 7 年時光》

      3、大數(shù)據(jù)文摘:《從“全村的希望”到“大裁員”,亞馬遜是如何摧毀Alexa 的?》

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。