云天勵飛正式發(fā)布AI硬件品牌“嚕咔博士”,引領(lǐng)兒童探索新未來雷軍今年已發(fā)布192條短視頻 月均產(chǎn)出17條短視頻預(yù)算超60億美元、進度落后5年,消息稱美國宇航局有50%幾率放棄SLS火箭項目聯(lián)想集團第二財季營收 178.5 億美元 同比增長 24%ISG業(yè)務(wù)營收同比大增65% 聯(lián)想服務(wù)器在全球賣爆民航局發(fā)布民用無人駕駛航空器飛行動態(tài)數(shù)據(jù)報送要求微軟發(fā)布 Win11 23H2 RP 22631.4534 預(yù)覽版深藍航天明年將啟動“筷子夾火箭”試驗廣汽傳祺E9超級快充版上市 售價32.28-39.28萬元樂言科技:智能客服機器人雙11期間總服務(wù)人數(shù)超1.9億運營能力令人側(cè)目 聯(lián)想手機業(yè)務(wù)同比增長43%震撼視覺與沉浸聽覺的完美融合!大屏電視這么買才不會錯報告稱AMD首次在數(shù)據(jù)中心收入上超越英特爾網(wǎng)傳華為Mate 70將使用F1發(fā)光材料:護眼能力更強雙11觀察:直驅(qū)洗衣機成用戶首選!中國新能源汽車首破年度1000萬輛 AI大模型加速下半場智能化發(fā)展國家級法律 AI 基座模型發(fā)布:可大大降低公共法律服務(wù)門檻文遠知行在新加坡連獲兩款自動駕駛環(huán)衛(wèi)產(chǎn)品許可證2024年10月車企銷量完整版,比亞迪奪冠,本田第7,現(xiàn)代第41上海頒發(fā)首批無人駕駛車牌
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 業(yè)界新聞

    語音交互中的“等待體驗”研究

    2017年12月20日 12:53:31   來源:中國網(wǎng)

    image.png

      回顧人機交互發(fā)展史,人類先后經(jīng)歷了基于命令行的CLI時代,基于鼠標(biāo)鍵盤的GUI時代,基于觸摸的初級NUI時代。后面每一個階段比前一個階段更自然,學(xué)習(xí)成本更低,綜合效率更高。

    image.png

      進入AI時代,人工智能給機器帶來三種能力:感知能力、認知能力、自然語言輸出能力。感知能力使機器能聽得懂人類語言,認知能力使機器能思考如何回答人類問題,自然語言輸出能力使機器可以像人類一樣表達——三種能力的綜合運用將人機交互帶入語音交互階段。語音交互是最自然的人機交互方式,它極大地降低了人們與機器交互時的學(xué)習(xí)成本,將人機交互綜合效率帶上新的臺階,已成為非常重要的人機交互方式。

      一、“等待體驗”——語音交互體驗的三分之一

      生活中人與人的對話場景,對話是由“向?qū)Ψ秸f出一句話”、“等待對方回復(fù)”、“對方給出回復(fù)”三個階段不斷循環(huán)構(gòu)成。其中“等待對方回復(fù)”是對話體驗的“三分之一”,會對回復(fù)的滿意度造成直接影響。在等待回復(fù)階段,如果對方處于認真思考的狀態(tài),會讓我們覺得被重視;然而,如果在等待過程中對方的注意力不在對話本身,即便對方給出的回復(fù)再好,我們也會心存疑慮。

    image.png

      對應(yīng)到人機語音交互中的三個部分——“輸入體驗”、“等待體驗”、“回復(fù)體驗”,“等待體驗”同樣處于整個體驗循環(huán)鏈的中間環(huán)節(jié),在語音交互體驗中起到了承上啟下的重要作用。但是,關(guān)于語音交互中的“等待體驗”在行業(yè)尚未被系統(tǒng)的研究,依舊處于模糊狀態(tài)。

      1.響應(yīng)時間一定是越短越好嗎?

      數(shù)字性能管理平臺Dynatrace對用戶瀏覽網(wǎng)頁的行為進行了研究,發(fā)現(xiàn)當(dāng)網(wǎng)頁加載速度提升0.5秒,可促進用戶在網(wǎng)站的行為轉(zhuǎn)化核心數(shù)據(jù)提升10%。因此,在網(wǎng)頁設(shè)計和App設(shè)計中,盡量縮短等待時間是產(chǎn)品設(shè)計的不懈追求。

      不同于基于視覺的交互,語音交互天然附帶情感屬性。然而,情感的體驗是復(fù)雜的,它不只受效率這個單一變量的控制。大多數(shù)情況下,在生活中人與人對話時,一個過快的回答會給用戶帶來輕浮感和搶話感,而一個過慢的回答會給用戶帶來遲緩感和愚鈍感。

    image.png

      那么,在語音交互中,究竟什么樣的響應(yīng)時間能有最佳的體驗?zāi)?響應(yīng)時間的體驗趨勢是怎樣的呢?

      2.等待體驗受哪些變量的影響?

      在視覺設(shè)計領(lǐng)域,當(dāng)設(shè)計頁面的loading態(tài)時,為降低用戶的跳出率,設(shè)計師時常會通過給出進度條,或采用趣味性的情感化設(shè)計來消除用戶的不安情緒。

      但是在語音交互領(lǐng)域,語音的承載體是無形的,或不確定形態(tài)的,我們甚至沒有承載loading態(tài)的界面。在這種情況下等待體驗又受哪些變量影響呢?影響的程度怎樣呢?

      綜上,可以說在語音交互領(lǐng)域,等待體驗雖然重要,但目前仍是“一團迷霧”。鑒于此,我們以目前語音交互的主要載體——智能音箱產(chǎn)品為例,對AI產(chǎn)品中的等待體驗問題進行專題研究。

      二、智能音箱的等待體驗研究

      目前的智能音箱,主要采用先語音喚醒后輸入指令的語音交互流程。鑒于此,我們可以將智能音箱的使用過程分為兩個主要階段:

      1)喚醒階段:用戶通過指定的喚醒詞將音箱從等待態(tài)轉(zhuǎn)換為就緒態(tài),音箱被喚醒后才可以接收用戶的語音指令。

      2)用戶請求及反饋階段:用戶給出語音指令內(nèi)容以及智能音箱反饋結(jié)果滿足用戶的需求。

    image.png

      針對這兩個階段,我們先后通過以下三個實驗進行研究。

      實驗一:喚醒階段的響應(yīng)時間對等待體驗的影響;

      實驗二:用戶請求及反饋階段的響應(yīng)時間對等待體驗的影響;

      實驗三:視覺、聲音等不同反饋方式對等待體驗的影響。

      下面我們對每個實驗的結(jié)論進行逐一詳述:

      實驗一:喚醒階段的響應(yīng)時間對等待體驗的影響

      為了全面考察喚醒階段各種因素對等待體驗的影響,在實驗中,我們?yōu)橛脩籼峁┝瞬煌瑔拘秧憫?yīng)時間和不同喚醒反饋方式的智能音箱。用戶完成實驗任務(wù)后,需要對音箱的喚醒響應(yīng)速度進行評價(5點量表:太快了,接受不了;有點快,能夠接受;剛剛好;有點慢,能夠接受;太慢了,接受不了)。

    image.png

      實驗一的結(jié)果表明最佳的喚醒響應(yīng)時間與喚醒反饋方式有關(guān),不同喚醒反饋方式下,最佳響應(yīng)時間不同:

      1)當(dāng)喚醒反饋為"燈光"反饋時,喚醒響應(yīng)速度越快越好,在200ms時,用戶響應(yīng)舒適度最高(對響應(yīng)時間評價為剛剛好的用戶比例),73%的用戶對速度滿意。

      2)當(dāng)喚醒反饋為"燈光+音效"時,喚醒響應(yīng)速度的舒適時間為300ms左右,76%的用戶對速度滿意。

      3)當(dāng)喚醒反饋為"燈光+人聲"時,喚醒響應(yīng)速度的舒適時間為500ms左右,74%的用戶對速度滿意。(注意:本次實驗設(shè)置了市面上主流的三種喚醒反饋方式:燈光、燈光+音效、燈光+人聲,以給不同反饋情況的響應(yīng)時間感受作參考,但對最優(yōu)反饋方式,除了響應(yīng)時間還受其他因素影響,將另著篇章探討。)

    image.png

      實驗二:用戶請求及反饋階段響應(yīng)時間對等待體驗的影響

      由于用戶請求及反饋階段的響應(yīng)在技術(shù)實現(xiàn)和用戶預(yù)期上,與喚醒階段的響應(yīng)存在差異,因此我們通過第二個實驗對用戶請求及反饋階段的最佳響應(yīng)時間范圍進行研究。在實驗中,我們?yōu)橛脩籼峁┝瞬煌憫?yīng)時間設(shè)置的智能音箱。

    image.png

      實驗二的主要研究發(fā)現(xiàn):

      1)1250ms以內(nèi)是用戶認為響應(yīng)速度較優(yōu)的區(qū)間,其中650ms為最佳體驗值。在450ms時,少量用戶覺得響應(yīng)速度太快了,用戶會感覺到緊迫感和壓力,難以接受。

      2)在1450ms時,有53%的用戶開始感覺響應(yīng)有延時,但仍能夠接受。

      3)從2150ms開始,有20%的用戶認為音箱響應(yīng)太慢,不能夠接受。我們認為20%的用戶不滿意,已經(jīng)不足以被稱為一個優(yōu)秀的產(chǎn)品。

    image.png

      實驗三:視覺、聲音等不同反饋方式對等待體驗的影響

      由于目前市場上的智能音箱在請求反饋階段的響應(yīng)時間普遍在1.5秒以上,并沒有達到實驗二研究的理想響應(yīng)區(qū)間。因此,我們通過實驗三進一步研究反饋方式設(shè)計對用戶響應(yīng)速度感知的影響,我們?yōu)橛脩籼峁┝宋褰M具有不同反饋方式設(shè)計的方案。

    image.png

      在實驗三的五組方案中,每組方案分別進行了不同響應(yīng)時間設(shè)置。

    image.png

      實驗三的主要研究發(fā)現(xiàn),不同反饋方式設(shè)計會影響人們對音箱響應(yīng)速度的感知:

    image.png

      1)1250ms以內(nèi),方案D感受較差,人聲反饋會產(chǎn)生搶話的感受,部分用戶認為音箱響應(yīng)太快。

    image.png

      2)1350ms到2150ms,方案D、E感知舒適的用戶比例較高,加入人聲/音效后,如方案D的語音應(yīng)答“好的”,有助于緩解用戶延遲感受,提升速度感知體驗。

    image.png

      3)在3150ms及以上的響應(yīng)時間,響應(yīng)方式設(shè)計對緩解延時的作用已經(jīng)不明顯,應(yīng)該盡量避免此類情況發(fā)生。

      此外,實驗三還發(fā)現(xiàn)響應(yīng)速度預(yù)期與用戶性別、任務(wù)類型有關(guān)。與男性相比,女性用戶對響應(yīng)時間容忍度更低,她們最長在音箱無反饋時可以容忍的平均響應(yīng)時間長度低于男性,即她們希望在更短的時間內(nèi)得到音箱的響應(yīng)反饋。

    image.png

      與音樂類、問答類等任務(wù)相比,用戶對控制類任務(wù)的響應(yīng)時間容忍度更低,用戶希望在控制類任務(wù)中有更加及時的響應(yīng)反饋。

    image.png

      三、小結(jié)

      本文針對語音交互中的等待體驗進行了討論,并以智能音箱為例,重點對喚醒階段和請求反饋階段的響應(yīng)時間和反饋方式進行了人類工效學(xué)實驗研究。由于實驗設(shè)定的條件和樣本數(shù)量等限制因素,實驗研究結(jié)論可能不能代表所有智能音箱用戶在家居環(huán)境的全部感受,但希望通過我們的研究和探索,可以指導(dǎo)人工智能語音對話產(chǎn)品響應(yīng)時間和反饋方式的設(shè)計,幫助打造自然和極致的語音對話體驗。

      百度人工智能交互設(shè)計院微信公眾號:百度AI交互設(shè)計院,歡迎掃碼關(guān)注:

    image.png

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    唯品會雙11銷量前十品牌中有7個國貨品牌

    11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費前列,女士夾克銷量同比增長72%,女士棉衣、女士羊毛衫銷量同比增長50%以上。男士外套銷量同比增長30%以上。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。