Sugr的回答:智能音箱只是開始,中美語音交互有何不同?
Sugr的CEO宋少鵬在西南偏南的臺上講了一個故事:他的一個客戶找到他,想要修復剛剛壞掉的智能音箱,宋少鵬提出給他換一臺新設備,卻被拒絕;用戶的理由溫情融暖,十歲的孩子一直都在用這臺音箱,孩子把它當做伙伴,舍不得。
似乎剛剛走向普及的語音交互技術,等不及太久,竟然一下子從“工具”進化成了“伴侶”。
2014 年,亞馬遜發(fā)布搭載 Alexa 的 Echo 智能音箱,語音交互有了更合適的落地場景。經過幾年的功能迭代,生態(tài)鏈逐漸成熟。2017 年人工智能技術飛速發(fā)展,語音交互在AI的帶動下變得越來越智能,智能音箱走進了千家萬戶。
據相關調查報告顯示,大約有3900萬美國人擁有智能音箱產品,這個數字占到了美國總人口的六分之一。
這股風潮當然也刮到了中國。在Echo發(fā)布后,Sugr主動擁抱Alexa平臺,成為國內第一個通過亞馬遜認證的智能音箱產品,并與Alexa平臺合作,向其他客戶提供多款完整的智能語音交互解決方案Sugr Sense,可以滿足包括智能家居、IOT、車載等不同應用場景的產品開發(fā)與快速量產。
在美國西南偏南大會(SXSW),這個科技和音樂的藝術盛典上,宋少鵬帶來了他的分享,探討語音交互的未來、中美語音交互使用習慣的差異,以及語音交互在中國的落地。
Sugr CEO宋少鵬在西南偏南演講
西南偏南 極客公園IF大會現場
語音交互是下一代操作系統(tǒng)
Sugr團隊認為,語音交互會成為下一代的操作系統(tǒng)。宋少鵬提到,這和人機交互的進化規(guī)律有關。從 PC 時代的鍵盤鼠標,到智能手機時代的觸屏,人操控外界環(huán)境的效率一直在上升,能耗在降低,而語音交互是一種更簡單、更自然的交互方式,也符合這樣的規(guī)律。所以,語音交互會成為下一代的操作系統(tǒng)。
從音樂產品的迭代來看,也可以印證這個規(guī)律。在古代,熱愛音樂的人去欣賞音樂,需要駕著馬車到音樂廳或者歌劇院。后來留聲機的發(fā)明讓人們可以躺在家里聽音樂。到了 iPod,大家可以把1000首歌裝進口袋,手指一滑,就可以欣賞喜歡的音樂。到 2014 年 亞馬遜發(fā)布Echo智能音箱,人們只需要動動嘴就能得到自己想要的音樂,能量消耗進一步減少。
語音交互降低了人跟物理世界交互所需的能耗,這個趨勢是符合產品迭代規(guī)律的。
中美的智能語音交互和而不同,場景和用戶習慣會塑造產品形態(tài)
雖然Sugr團隊認定語音交互會成為下一代操作系統(tǒng),但智能音箱在中國的落地并不能完全照搬美國的做法。環(huán)境變化,對產品的需求自然也不一樣。
在宋少鵬看來,音樂消費的DNA不同,導致了行為習慣的差異。他提到,美國的音樂消費者是成長于汽車上的黃金一代,汽車上都配備收音機,他們的音樂消費是從聽收音機開始的。大家習慣了這種背景式的、實時存在式的播放,在任何一個生活場景里面都想要有音樂的存在。這種情況下,他們更喜歡歌單推薦、流媒體的音樂形式。
中國的音樂消費者最初接觸音樂是源于80年代初期改革開放,港臺音樂以盒帶和卡帶形式大量流入內地,大家接觸音樂是一個歌手的完整專輯,里面有各種各樣的曲風,但很少有合集和混編。所以他們更習慣于點播式的音樂消費。
智能音箱在美國的誕生并不是偶然,它解決了家庭環(huán)境聽音樂的痛點,可以讓音樂一天不停地播放,而流媒體形式的聽歌習慣不需要太多操控,對語音交互的語義理解能力要求就沒那么高。所以美國的公司才能以「最小化可實現原型」的形式,迅速推出智能音箱這樣一個產品,來滿足用戶的需求。
音箱本來是被動播放音樂的產品,人工智能和語音助手的加入使它能夠主動獲取信息,并和人產生交互,成為一個流量的入口。隨著技術的進步,它又開始加入家居產品的控制功能,逐步成為智能家居的中控,這樣就有了很大的想象空間。
Amazon有Alexa,Google有Google Assistant,Apple有Siri,騰訊百度阿里巴巴也都有自己的智能語音助手。巨頭的加入讓整個生態(tài)鏈更加完善,智能語音交互也開始有了更多的應用場景,從智能家居、兒童看護、IOT物聯(lián)網、車載;隨之而來的,還有更多適應這些場景的產品落地形態(tài)。
不只產品,而是完整體驗
在目標明確,道路明晰之后,Sugr將精力投入到語音交互產品的落地工作中。他們的音箱成為國內第一個經過Alexa認證的智能音箱產品,后來開始和亞馬遜團隊進行合作,給想進入Alexa平臺的產品提供技術解決方案。Sugr 團隊將自己在語音交互產品上的經驗打包,從做C端產品轉型為做B端的方案。
Sugr 團隊推出的 Sugr Sense 方案是一個完整的智能音箱解決方案,包括 Wi-Fi 模塊,底層技術,操作系統(tǒng),還有語音 Skill,是軟硬結合的全棧式解決方案。這其中有一套單麥克風的解決技術,是目前全球唯一一套可以通過Amazon嚴格測試并認證的單麥克風解決方案。這項單麥克風解決方案在Amazon的測試環(huán)境里擁有不錯的成績,在9英尺的環(huán)境下(2.74 米),普通辦公或者是家居環(huán)境下,喚醒響應率能達到 100%,在9英尺的距離,在設備自身播放音樂,AEC(自適應回聲消除)場景下,正確響應率達到了98%。
除此之外,還有多款可適用于智能家居、IOT、車載等不同應用場景的完整解決方案,不但可以降低行業(yè)門檻,還可以提升整個行業(yè)的效率。
從產品接入Alexa,到和亞馬遜合作,幫助其他的產品接入Alexa,Sugr認識到 Echo 的成功不能簡單歸結為單純的產品或技術進步,而是一整套用戶體驗方案的解決。而這些經驗對智能音箱在中國的落地有很大的借鑒意義。
正如前面所說,在中國點播音樂是常態(tài),這需要更強大的語義理解能力,更豐富、更深入的音樂知識圖譜,以及更完善的音樂版權和曲庫。還有使用場景的不同,美國家庭大多是中央空調系統(tǒng),而中國的空調大部分為獨立的壁掛式、落地式空調,如果音箱作為智能家居的中控,對于空調的控制場景是不同的。在中國做智能語音交互產品,照搬亞馬遜是不行的,需要融入更多關于產品使用場景、用戶交互習慣方面的思考。
未來是智能語音交互的時代
當冰冷的科技與人文發(fā)生碰撞而開始有了溫度,陪伴的意義就超出了技術的范疇。
伴隨著智能手機、觸屏長大的孩子們,看見什么都想點一點;而我們的下一代將是成長在語音交互時代的。也許,智能語音交互會改變的,不僅僅是我們和數碼產品之間的交流方式,也正在悄悄的影響著我們人與人之間的互動。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
11月11日,據網經社數字零售臺(DR.100EC.CN)數據顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費前列,女士夾克銷量同比增長72%,女士棉衣、女士羊毛衫銷量同比增長50%以上。男士外套銷量同比增長30%以上。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。