首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 互聯(lián)網(wǎng)＋

云知聲的多模態(tài)場(chǎng)景突圍：軟硬結(jié)合，端云互動(dòng)

2019年01月28日 11:47:29 來(lái)源：中文科技資訊

　　半年前，云知聲發(fā)布了首款面向物聯(lián)網(wǎng)的 AI 芯片雨燕(Swift);半年后，云知聲宣布了多模態(tài) AI 芯片戰(zhàn)略，曝光了正在研發(fā)的三款 AI 芯片：第二代物聯(lián)網(wǎng)語(yǔ)音 AI 芯片雨燕 Lite、面向智慧城市的支持圖像與語(yǔ)音計(jì)算的多模態(tài) AI 芯片海豚(Dolphin)，以及面向智慧出行的車規(guī)級(jí)多模態(tài) AI 芯片雪豹(Leopard)。

　　從 2015 年芯片項(xiàng)目確立并搭建團(tuán)隊(duì)「正規(guī)軍」，2017 年「造芯」項(xiàng)目進(jìn)入攻堅(jiān)階段，再到 2018 年 1 月做出第一個(gè) MPW(多項(xiàng)目晶圓)，2018 年 5 月份做了發(fā)布首款芯片，6 月份啟動(dòng)量產(chǎn)，9 月份發(fā)布了基于雨燕的開(kāi)源方案，云知聲的腳步?jīng)]有停歇。緊跟著，芯片設(shè)計(jì)團(tuán)隊(duì)從語(yǔ)音技術(shù)轉(zhuǎn)戰(zhàn)至圖像 IP 設(shè)計(jì)。

　　在經(jīng)歷了 2018 年的商業(yè)化洗禮后，國(guó)內(nèi)人工智能企業(yè)愈發(fā)重視技術(shù)和產(chǎn)品方案的完整性和普適性。當(dāng)人工智能在應(yīng)用場(chǎng)景的加速落地，AI 芯片的價(jià)值毋庸贅言，而「多模態(tài)」一詞開(kāi)始被越來(lái)越多地提及。

　　商業(yè)變現(xiàn)更進(jìn)一竿

　　隨著技術(shù)迭代和場(chǎng)景需求疊加，AI 芯片的邊界發(fā)生著微妙變化。2015 年云知聲決心做硬件時(shí)，專門為此在深圳設(shè)立分公司。一套完整的芯片開(kāi)發(fā)過(guò)程相對(duì)漫長(zhǎng)，期間不可避免地會(huì)涉及算法迭代，對(duì)芯片的研制速率造成影響。雨燕從設(shè)計(jì)到研發(fā)，直至最終量產(chǎn)，時(shí)間周期為 3 年。要保證 2015 年立項(xiàng)的芯片，仍適用于時(shí)下主流的算法，云知聲聯(lián)合創(chuàng)始人李霄寒并不否認(rèn)這項(xiàng)任務(wù)的艱巨性。憑經(jīng)驗(yàn)對(duì)算法預(yù)判之外，團(tuán)隊(duì)還要拿出勇氣和魄力唯此一搏。

　　作為云知聲的芯片品牌，「雨燕」是 UniOne 芯片矩陣中的初代產(chǎn)品，它圍繞智能家居和智能音箱等場(chǎng)景，集成 IoT 人機(jī)交互的各項(xiàng)技術(shù)，云知聲發(fā)布這款芯片時(shí)稱贊「雨燕」是以 1/10 的價(jià)格挑戰(zhàn) 50 倍的性能。

　　「第一代 AI 芯片雨燕的架構(gòu)非常典型。云知聲做了兩件事情：一是專門設(shè)計(jì)的具備自主知識(shí)產(chǎn)權(quán)的高性能 DSP，做音頻數(shù)據(jù)處理，二是做面向音頻的人工智能數(shù)據(jù)/神經(jīng)處理器。當(dāng)把這個(gè)人工處理器集成進(jìn)去以后效果是顯而易見(jiàn)的，相對(duì)于通用方案提升了 50 倍。在硬件設(shè)備方面，因?yàn)檫@個(gè)芯片是高度集成的，所以外圍的線路使得很大的成本降低三分之一」，他說(shuō)。

　　黃偉表示，云知聲在芯片上下足了功夫，為 B 端客戶提供了一套完整的解決方案。其不僅利用人工智能引擎對(duì)「雨燕」進(jìn)行調(diào)優(yōu)，還專門為硬件產(chǎn)品設(shè)計(jì) app�？蛻艏促I即用，無(wú)需再找其他供應(yīng)商，這是云知聲今后芯片提供銷售服務(wù)模式。

　　去年 9 月，云知聲推出了基于「雨燕」的解決方案，并進(jìn)行開(kāi)源，正式推出正對(duì)智能家居和智能音箱場(chǎng)景下的解決方案。截至目前，基于「雨燕」的全棧解決方案已導(dǎo)入的各類方案商及合作伙伴已超過(guò) 10 家，包括美的、奧克斯、海信、京東、360、中國(guó)平安、硬蛋科技等，相關(guān)產(chǎn)品有望在今年第一季度上市。

　　「在 2015 年的這個(gè)時(shí)間點(diǎn)，我們真心沒(méi)有想過(guò) 2018 年我們會(huì)推出自研芯片，不光做出來(lái)而且還賣出去了�！裹S偉透露，云知聲 2018 全年數(shù)億元的營(yíng)收較上年 3 倍的增長(zhǎng)，幾乎全部仰仗于芯片的功勞和正確的商業(yè)化路徑，預(yù)計(jì)在 2019 年?duì)I收再翻 2-3 倍。而看似幾個(gè)億的營(yíng)業(yè)額背后，實(shí)則撬動(dòng)了幾十億甚至上百個(gè)億的產(chǎn)值。

　　另一場(chǎng)革命

　　在 2012 年公司成立之后，同年 9 月云知聲就推出了語(yǔ)音識(shí)別功能，專門面向端云互動(dòng)。經(jīng)過(guò) 6 年多發(fā)展，云知聲已經(jīng)擁有成面向物聯(lián)網(wǎng)單日用量達(dá)到 5 億次的云平臺(tái)，并為平臺(tái)開(kāi)發(fā)了 ADPC 模式，它是云知聲 AI 深度處理的核心。

　　2014 年初，團(tuán)隊(duì)把語(yǔ)音識(shí)別技術(shù)分別切入到「AI 生活」和「AI 服務(wù)」兩個(gè)場(chǎng)景中。很快，算法平臺(tái)化的雛形初現(xiàn)，創(chuàng)始團(tuán)隊(duì)很快意識(shí)到，光有能力是不夠的�！杆懔退惴ǖ娜诤�，同理于技術(shù)與場(chǎng)景結(jié)合」，于是云知聲便有了「云端芯一體化」的產(chǎn)品技術(shù)架構(gòu)。

　　當(dāng)云、端、芯被認(rèn)作物聯(lián)網(wǎng)產(chǎn)品端的三要素，云知聲立即展開(kāi)對(duì) IDM 產(chǎn)品的開(kāi)發(fā)，并于在 2015 正式量產(chǎn)，出貨量呈規(guī)模性增長(zhǎng)。

　　與此同時(shí)，2015 年，云知聲遭遇來(lái)自業(yè)務(wù)端的「戰(zhàn)術(shù)端的挑戰(zhàn)」，主要有兩方面：

　　第一是來(lái)自數(shù)據(jù)處理的挑戰(zhàn)。在跟用戶打交道的過(guò)程中，注定有大量新數(shù)據(jù)的導(dǎo)入，語(yǔ)音、頭像、手勢(shì)等數(shù)據(jù)需要處理，深度互聯(lián)對(duì)算力的要求更高。追求高效就要采用基于深度神經(jīng)網(wǎng)絡(luò)的算法，這意味著云知聲需要在終端提供更加充分的算力。

　　另外一個(gè)約束來(lái)自成本。為解決算力問(wèn)題，云知聲不得不采用更好的算法，導(dǎo)致了成本大幅提升，這對(duì)于硬件來(lái)說(shuō)十分敏感。成本之外，更強(qiáng)的算力還意味著更多的功耗。非插電產(chǎn)品的「續(xù)航焦慮」指望電池性能得到提升顯然不現(xiàn)實(shí)。

　　那么主要矛盾如何化解?云知聲認(rèn)為，基于深度學(xué)習(xí)的新硬件，即「邊緣側(cè)的人工智能芯片」勢(shì)在必行，這場(chǎng)「自我革命」是 2015 年芯片項(xiàng)目的整體思路。

　　眼下，只強(qiáng)調(diào)算法優(yōu)勢(shì)的 AI 企業(yè)，很難再滿足 B 端客戶的場(chǎng)景需求，致使企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力和話語(yǔ)權(quán)逐步衰減。盡管云知聲創(chuàng)始人兼 CEO 黃偉接受采訪時(shí)沒(méi)有明確表態(tài)「不做芯片就會(huì)被淘汰」，但必須承認(rèn)，軟硬結(jié)合才是 AI 企業(yè)未來(lái)立足之根本。

　　在產(chǎn)品落地的過(guò)程中，算法和芯片二者不可或缺�！溉绻忻嫔嫌羞m用的芯片還好，如果沒(méi)有我們就要造」，黃偉指出，「造芯」是云知聲的自我選擇。這不是它擅長(zhǎng)的事，但云知聲還是做出來(lái)了。去年 5 月 16 日，云知聲把第一代 AI 芯片雨燕(Swift)擺在眾人面前。黃偉放言，即便是現(xiàn)在，「雨燕」的各項(xiàng)指標(biāo)仍保持業(yè)內(nèi)領(lǐng)先。

　　多模態(tài)的進(jìn)擊

　　新年伊始，云知聲正在開(kāi)發(fā)的 3 款芯片，會(huì)在年內(nèi)投產(chǎn)上市。一款是面向語(yǔ)音場(chǎng)景的第二代 AI 芯片雨燕(Swift)-Lite，其主要特點(diǎn)是更加輕薄;另一款是面向智慧城市場(chǎng)景的多模態(tài) AI 芯片海豚(Dolphin)，這款芯片是云知聲在 2019 年非常大的投入，繼承云知聲的 DeepNet2.0，它不僅僅支持雨燕的功能，還支持?jǐn)z像頭、ISP、OD 和人臉識(shí)別;第三款是云知聲與億咖通科技合作推行的車載多模態(tài) AI 芯片雪豹(Leopard)，它更加著重本地算力，提供本地語(yǔ)音搜索，無(wú)網(wǎng)絡(luò)的狀況下也可通過(guò)語(yǔ)音導(dǎo)航選址，并具備一定的圖像處理能力。

　　作為一家靠語(yǔ)音技術(shù)做強(qiáng)的公司，云知聲看到多模態(tài)場(chǎng)景的大勢(shì)所趨。2018 年，云知聲進(jìn)入圖像領(lǐng)域，并投入了不少資源。李霄寒解釋，云知聲已經(jīng)完全具備硬件平臺(tái)能力和分布式機(jī)器學(xué)習(xí)能力，以及數(shù)據(jù)高速處理和迭代能力。做這些事情不是興趣始然，而是為了滿足物聯(lián)網(wǎng)場(chǎng)景下，芯片設(shè)計(jì)的需要。

　　當(dāng)前，云知聲圖像識(shí)別的準(zhǔn)確率高達(dá) 99.8%。除人臉識(shí)別外，云知聲還有物體識(shí)別、表情分析、顏值分析、標(biāo)簽化能力，這背后得益于 DeepNet2.0 的算力加持。

　　DeepNet 是云知聲開(kāi)發(fā)的深度神經(jīng)網(wǎng)絡(luò)處理器，DeepNet 1.0 面向語(yǔ)音技術(shù)，DeepNet 2.0 面向多模態(tài)，后者既支持圖像處理，同時(shí)支持語(yǔ)音處理。目前云知聲 DeepNet2.0 已在 FPGA 上得到驗(yàn)證，其算力將在 AI 芯片海豚 Leopard 上得以體現(xiàn)。

　　較 1.0 版本相比，DeepNet 2.0 首先是兼容性更好，可支持 LSTM、CNN、RNN、TDN 等網(wǎng)絡(luò);其次是支持可重構(gòu)計(jì)算，DeepNet2.0 計(jì)算單元可以拼接應(yīng)對(duì)計(jì)算模式，模式切換也可以快速組合，用單條指令來(lái)計(jì)算公式;第三是支持 Winograd，芯片做乘法的耗時(shí)遠(yuǎn)遠(yuǎn)高于加法，基于這一點(diǎn)，Winograd 把乘法耗時(shí)降低為原來(lái)的 1/2，進(jìn)一步提升效率。

　　此外，李霄寒介紹了 AI 芯片在算法應(yīng)用方面取得的新進(jìn)展——「超聽(tīng)限同向降噪技術(shù)」。所謂「超聽(tīng)限」顧名思義，就是讓機(jī)器識(shí)別到人類聽(tīng)覺(jué)范圍以外的聲音，而「同相降噪」可滿足在嘈雜的遠(yuǎn)場(chǎng)環(huán)境下，保證芯片靈敏精準(zhǔn)地捕捉到人聲。

　　云知聲現(xiàn)階段的目標(biāo)明確，就是在物聯(lián)網(wǎng)技術(shù)面前，選擇某個(gè)重點(diǎn)場(chǎng)景切入，將算力和應(yīng)用服務(wù)更好地結(jié)合。而李霄寒篤信，物聯(lián)網(wǎng)時(shí)代的重要命題，是將「能力下沉到設(shè)備端」。

　　展望未來(lái)的物聯(lián)網(wǎng) AI 芯片的發(fā)展路徑，云知聲團(tuán)隊(duì)一致認(rèn)為，連接方式、安全性、PPA(Power，Performance，Area)是核心。但 AI 物聯(lián)網(wǎng)芯片僅僅考慮這三要素還不夠，場(chǎng)景化、多模態(tài)、端云互動(dòng)這三大方面將深刻地影響 AI 芯片的設(shè)計(jì)、定位、成本、功耗和芯片需求。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. S015-2]
分享到微信