終端創(chuàng)企Nothing擬募資1億美元 一加聯(lián)合創(chuàng)始人創(chuàng)立恩智浦獲歐洲投資銀行 10 億歐元貸款,用于在歐多國研發(fā)創(chuàng)新工作入手松下ZS99相機(jī)新品首選京東 售價(jià)2998元可先人一步入手1月20日打開京東搜索「1」 3C數(shù)碼“瘋狂星期一”爆款低至1元當(dāng)代年輕人用上AI,從夸克開始消息稱iPhone SE 4將有白色和黑色 預(yù)計(jì)3月份推出全球PC市場迎來溫和復(fù)蘇:2024年出貨量增長1.3%,聯(lián)想和蘋果表現(xiàn)亮眼比亞迪已在韓國推出Atto 3 預(yù)計(jì)2月中旬開始交付發(fā)展新質(zhì)生產(chǎn)力 賦能健康產(chǎn)品力 ——勁牌有限公司2024年度科技責(zé)任(成果)報(bào)告美光減產(chǎn)后 SK海力士也計(jì)劃將上半年NAND閃存產(chǎn)量削減一成趙明離職信曝光:離開榮耀是人生中最艱難的決定消息稱京東服飾換帥,阿里前高管擔(dān)任負(fù)責(zé)人這年頭,誰在互聯(lián)網(wǎng)上學(xué)這么“硬核”的AI?開戰(zhàn)2025,本地生活商家「另辟蹊徑」年底Mini LED電視到底怎么選?認(rèn)準(zhǔn)這些新技術(shù)不踩雷!數(shù)據(jù)顯示:ChatGPT Plus成為AI訂閱服務(wù)留存率冠軍宇樹科技公布G1人形機(jī)器人新升級:可柔順行走、仿人奔跑B站年度盤點(diǎn):誰是大金主?誰在賺“小”錢?我國網(wǎng)民規(guī)模首次超過11.08億人:互聯(lián)網(wǎng)普及率78.6%紅魔手機(jī)國補(bǔ)官宣:1月20日起享15%補(bǔ)貼 到手價(jià)3399元起
  • 首頁 > 延展閱讀 > 2017歸檔

    云知聲+斐訊:智能音箱產(chǎn)品開發(fā)“十步法”

    2018年03月12日 11:36:44   來源:中文科技資訊

      作者:云知聲

      正當(dāng)AWE在上海如火如荼的時(shí)候,遠(yuǎn)在澳門傳來了一個(gè)非常吸引眼球的新消息,斐訊首款人工智能音箱R1正式亮相。在筆者去年寫《10步,智能音箱從入門到放棄》時(shí),其實(shí)筆者所在的云知聲公司正在與斐訊、哈曼共同打造R1,當(dāng)時(shí)這篇文章也算是針對市場形形色色的音箱有感而發(fā)。目前R1已經(jīng)正式發(fā)布,正好可以做個(gè)回顧,看看R1走了這十步后,到底是從入門到放棄了,還是到精通了。

      1. 市場定位

      #FormatImgID_1#

      斐訊采用RK3229,Android平臺,RMB2499的定價(jià),在發(fā)布時(shí)間遠(yuǎn)遠(yuǎn)落后于國內(nèi)一些巨頭的產(chǎn)品情況下,可以說這個(gè)對于自身的定位非常大膽了,筆者分析,其至少有2個(gè)底氣:

      首先,此次發(fā)布會有多個(gè)產(chǎn)品同時(shí)發(fā)布,說明斐訊對于這款音箱定位是AI智能中控,這也符合云知聲對于智能設(shè)備發(fā)展的一貫觀點(diǎn),大家都從單品智能,到中控智能,最后發(fā)展為主動智能,而且演示過程中對于各個(gè)設(shè)備的控制,也印證了這一點(diǎn)。

      其次,斐訊的0元購形式非常有吸引力,在互聯(lián)網(wǎng)流量紅利接近尾聲的情況下,斐訊通過高品質(zhì)的產(chǎn)品質(zhì)量結(jié)合0元購模式,確實(shí)是探索在IoT時(shí)代如何快速獲取用戶的一個(gè)有益嘗試。

      當(dāng)然,最終用戶是否買單,還是要看真正的產(chǎn)品設(shè)計(jì)和功能,這一塊我們按照剩下9步,一個(gè)個(gè)看過來。

      2. 外觀設(shè)計(jì)

      音箱外觀是第一眼印象,在這一點(diǎn)上,斐訊R1從配色,到手感,到光線,可以說是非常用心的。這一點(diǎn)通過現(xiàn)場圖片讓大家感受一下。個(gè)人還是比較喜歡這個(gè)藍(lán)色光環(huán)的。

      3. 聲學(xué)結(jié)構(gòu)

      斐訊發(fā)布會上宣布與哈曼簽署戰(zhàn)略合作,這說明斐訊確實(shí)抓到了AI音箱這個(gè)產(chǎn)品的核心。無論有多么智能,當(dāng)用戶懶散地躺在沙發(fā)上,希望靜靜地聽歌的時(shí)候,音質(zhì)永遠(yuǎn)是第一位的。

      正如之前文章所說,聲學(xué)結(jié)構(gòu)需要同時(shí)考慮音質(zhì)效果和語音喚醒之間的雙重要求,可以說當(dāng)前這個(gè)聲學(xué)結(jié)構(gòu)是斐訊、哈曼、云知聲三個(gè)團(tuán)隊(duì)不斷討論,論證,實(shí)驗(yàn)的結(jié)果,很多要求都互相影響甚至互相矛盾,比如為了環(huán)繞重低音立體聲效果,必然要進(jìn)行音頻的相應(yīng)處理,相對于普通音質(zhì)一般的音箱而言,在這個(gè)要求下依然滿足極高的喚醒率,需要做更多的調(diào)優(yōu)工作。

      同時(shí)筆者親測的效果,R1的高音分貝極高,如何確保依然可以有效喚醒,如何確保不顯得笨重情況下確保高音下的機(jī)械結(jié)構(gòu)穩(wěn)定,都需要在結(jié)構(gòu)上做更多的工作?梢哉f這個(gè)聲學(xué)結(jié)構(gòu)是三方團(tuán)隊(duì)共同打怪通關(guān)的結(jié)晶啦。

      4. 內(nèi)容整合

      #FormatImgID_4#

      這一塊R1非常有信心地打出了國內(nèi)最全地音樂源的招牌,云知聲可以負(fù)責(zé)任地說,同意!因?yàn)槲覀冇?xùn)練過的音樂名文本已經(jīng)超過國內(nèi)POI的總數(shù)了。其實(shí)最初云知聲與斐訊溝通合作的過程中,雙方就一致認(rèn)識到,如果無法解決音樂源,這個(gè)項(xiàng)目就不可能成功,雙方甚至不用開始。正是在這個(gè)認(rèn)知地驅(qū)動下,才有了當(dāng)前的結(jié)果。順便說一下,云知聲拒掉了無數(shù)尋求音箱合作的客戶,音樂源一直是最直接原因。

      同時(shí),AI音箱目前內(nèi)容方便也在不斷擴(kuò)展,除了音樂,更多的內(nèi)容都接了進(jìn)來,而且云知聲為斐訊提供的AI云平臺,也可以非常方便地整合更多的第三方內(nèi)容,這將推進(jìn)R1的不斷演進(jìn)。

      5. 系統(tǒng)優(yōu)化

      說起系統(tǒng)調(diào)優(yōu),其實(shí)主要集中在兩個(gè)方面,首先當(dāng)然是系統(tǒng)啟動時(shí)間,這一個(gè)是用戶感受最明顯的一塊。作為一款A(yù)ndroid平臺的AI音箱,R1在這一點(diǎn)可以說做得相當(dāng)不錯。畢竟Android平臺無法與Linux和RTOS進(jìn)行啟動時(shí)間的直接對比,但是R1通過系統(tǒng)裁剪和反復(fù)迭代,已經(jīng)在當(dāng)前RK3229硬件平臺上,做到了接近極致體驗(yàn)了。

      其次是聯(lián)網(wǎng)方式,這一塊對于很多AI音箱其實(shí)是一個(gè)極度影響客戶體驗(yàn)的關(guān)鍵點(diǎn),在這一塊,R1考慮非常全面,正如下圖所示,它一共提供了三種聯(lián)網(wǎng)方式,在用戶傾向性方面盡量做到全面照顧了。

      6. 遠(yuǎn)場Mic陣列

      讓我們來重新復(fù)習(xí)一下支撐整個(gè)智能音箱的AI系統(tǒng),涉及到感知技術(shù),認(rèn)知技術(shù)以及交互技術(shù)。下圖給大家一個(gè)整體印象。

      這一步R1可以說是多快好省的典范,相對目前業(yè)界部分AI音箱采用的6+1Mic,斐訊和云知聲配合,在4Mic上做到了相同,甚至更好的遠(yuǎn)講拾音效果,而且聲學(xué)結(jié)構(gòu)設(shè)計(jì)更為簡單,產(chǎn)生Mic差異性概率更低,數(shù)目更少的Mic,其后期維護(hù)難度也隨之降低?梢哉f,這完全是以實(shí)際量產(chǎn)為目標(biāo)的接地氣設(shè)計(jì)。

      7. 離線喚醒

      #FormatImgID_9#

      作為一家非常低調(diào)的AI企業(yè),我們云知聲小伙伴一致認(rèn)為發(fā)布會上斐訊這張圖比較高調(diào)。不過我們依然認(rèn)為離線喚醒作為云知聲在家居行業(yè)的看門功夫之一,確實(shí)做到了以下三點(diǎn):

      快——反應(yīng)速度快,R1就像是個(gè)隨叫隨到的助手,很有feel。

      準(zhǔn)——目前體驗(yàn)測試和benchmark測試,均有翔實(shí)數(shù)據(jù)支持。尤其是音樂播放下的打斷和周邊噪聲環(huán)境下的喚醒,可以說我們還是比較滿意的。

      穩(wěn)——誤喚醒這塊更是把家電行業(yè)的嚴(yán)格標(biāo)準(zhǔn)直接用過作為測試指標(biāo)了。

      8. 語用計(jì)算

      云知聲所提的語用計(jì)算(Context-aware NLU),就是基于場景化感知的自然語言理解(NLU)。通過5W&1H(Who,When,Where,Which,What&How)原則理解是什么人在什么時(shí)候,什么地方對著什么設(shè)備說了什么話,然后由語用決定如何回應(yīng)。

      R1作為一個(gè)能實(shí)現(xiàn)中控智能的AI音箱,在對接不同的設(shè)備時(shí)候,通過拓?fù)湓O(shè)計(jì),將家庭環(huán)境下不同設(shè)備都做了相應(yīng)的標(biāo)識,以確保用戶的命令能被精準(zhǔn)識別,或者準(zhǔn)確反饋從而實(shí)現(xiàn)進(jìn)一步的確認(rèn)。“您是要打開臥室的燈,還是客廳的燈?”將是R1可能會和用戶確認(rèn)的一件事了。

      9. 流式交互

      R1的交互還沒有實(shí)現(xiàn)完全的流式交互,但是在AI音箱界也是一股清流了。比如在播放音樂過程中進(jìn)行快捷地切換,用戶無需再次喚醒,這一塊也是建立在堅(jiān)實(shí)地喚醒/誤喚醒技術(shù)指標(biāo)之上地交互設(shè)計(jì)了。

      與此同時(shí),上下文的理解,針對音樂場景的針對性理解,這些細(xì)節(jié)都在R1上有相應(yīng)體現(xiàn),這一塊還是請各位小伙伴親自體驗(yàn)吧。

      10. 開放平臺

      開放平臺這事,作為斐訊地合作方之一,我們非常佩服斐訊的規(guī)劃和想象,可以說,直接把當(dāng)下最熱的區(qū)塊鏈和AI最困難的數(shù)據(jù)問題,一攬子解決了。通過區(qū)塊鏈方式,讓R1用戶更深度地參與到R1整體AI智能體系建設(shè)中,加速了R1的自我演進(jìn)。

      這一塊我們好好學(xué)習(xí)!

      結(jié)束語:作為斐訊合作方,云知聲非常有幸能參與到R1中并為此做出自己的貢獻(xiàn),分析了這么多,最后還是吶喊一句,祝R1大賣!

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [編號: ]
    分享到微信

    即時(shí)

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。