CES 2025有哪些新品值得關(guān)注?京東采銷攜影視颶風(fēng)帶來(lái)科技最新資訊智算中心,為何比拼拎包入住報(bào)道稱2025年百度OKR更新:降本增效、KPI化雷克沙SILVER PRO,定義攝影新速度:從4K到高速連拍1月20日起來(lái)京東購(gòu)手機(jī)、平板享國(guó)家補(bǔ)貼每件最高500元小紅書回應(yīng)增加一鍵翻譯功能:已收到相關(guān)反饋 正在跟進(jìn)iPhone 16系列能疊加手機(jī)“國(guó)家補(bǔ)貼”嗎?看完這些就懂了任天堂Switch 2神秘“C”按鈕功能曝光!與付費(fèi)訂閱相關(guān)小紅書崩了上熱搜:部分網(wǎng)友APP首頁(yè)圖片不顯示2024年國(guó)內(nèi)日系車銷量排行:僅豐田有所增長(zhǎng),其余均遭滑鐵盧同比增長(zhǎng)71.8% 比亞迪2024年汽車出口增速位列中國(guó)汽車品牌第一消息稱去年全球PC GPU出貨超2.5億顆 較CPU高出兩成蘋果迎頭趕上:iPhone 17系列將搭載VC均熱板,提升散熱性能2024年中國(guó)智能手機(jī)市場(chǎng)回暖:vivo領(lǐng)跑,華為增長(zhǎng)37%,蘋果下滑17%英偉達(dá)與聯(lián)發(fā)科聯(lián)手打造Windows on Arm旗艦SoC,瞄準(zhǔn)PC市場(chǎng)新藍(lán)海三星Exynos旗艦芯片量產(chǎn)受阻,臺(tái)積電拒絕為其代工 擔(dān)憂商業(yè)機(jī)密泄露M4芯片MacBook Air有望成蘋果今年首款新品 最快1月份發(fā)布微軟入局量子計(jì)算 帶動(dòng)量子概念股暴力反彈消息稱東鵬飲料正與大摩和瑞銀接觸 即將赴港上市盒馬換帥300天:狂飆拓店、加速下沉、開(kāi)放加盟
  • 首頁(yè) > 產(chǎn)經(jīng)新聞?lì)l道 > 互聯(lián)網(wǎng)+

    云知聲的多模態(tài)場(chǎng)景突圍:軟硬結(jié)合,端云互動(dòng)

    2019年01月28日 11:47:29   來(lái)源:中文科技資訊

      半年前,云知聲發(fā)布了首款面向物聯(lián)網(wǎng)的 AI 芯片雨燕(Swift);半年后,云知聲宣布了多模態(tài) AI 芯片戰(zhàn)略,曝光了正在研發(fā)的三款 AI 芯片:第二代物聯(lián)網(wǎng)語(yǔ)音 AI 芯片雨燕 Lite、面向智慧城市的支持圖像與語(yǔ)音計(jì)算的多模態(tài) AI 芯片海豚(Dolphin),以及面向智慧出行的車規(guī)級(jí)多模態(tài) AI 芯片雪豹(Leopard)。

      從 2015 年芯片項(xiàng)目確立并搭建團(tuán)隊(duì)「正規(guī)軍」,2017 年「造芯」項(xiàng)目進(jìn)入攻堅(jiān)階段,再到 2018 年 1 月做出第一個(gè) MPW(多項(xiàng)目晶圓),2018 年 5 月份做了發(fā)布首款芯片,6 月份啟動(dòng)量產(chǎn),9 月份發(fā)布了基于雨燕的開(kāi)源方案,云知聲的腳步?jīng)]有停歇。緊跟著,芯片設(shè)計(jì)團(tuán)隊(duì)從語(yǔ)音技術(shù)轉(zhuǎn)戰(zhàn)至圖像 IP 設(shè)計(jì)。

      在經(jīng)歷了 2018 年的商業(yè)化洗禮后,國(guó)內(nèi)人工智能企業(yè)愈發(fā)重視技術(shù)和產(chǎn)品方案的完整性和普適性。當(dāng)人工智能在應(yīng)用場(chǎng)景的加速落地,AI 芯片的價(jià)值毋庸贅言,而「多模態(tài)」一詞開(kāi)始被越來(lái)越多地提及。

      商業(yè)變現(xiàn)更進(jìn)一竿

      隨著技術(shù)迭代和場(chǎng)景需求疊加,AI 芯片的邊界發(fā)生著微妙變化。2015 年云知聲決心做硬件時(shí),專門為此在深圳設(shè)立分公司。一套完整的芯片開(kāi)發(fā)過(guò)程相對(duì)漫長(zhǎng),期間不可避免地會(huì)涉及算法迭代,對(duì)芯片的研制速率造成影響。雨燕從設(shè)計(jì)到研發(fā),直至最終量產(chǎn),時(shí)間周期為 3 年。要保證 2015 年立項(xiàng)的芯片,仍適用于時(shí)下主流的算法,云知聲聯(lián)合創(chuàng)始人李霄寒并不否認(rèn)這項(xiàng)任務(wù)的艱巨性。憑經(jīng)驗(yàn)對(duì)算法預(yù)判之外,團(tuán)隊(duì)還要拿出勇氣和魄力唯此一搏。

      作為云知聲的芯片品牌,「雨燕」是 UniOne 芯片矩陣中的初代產(chǎn)品,它圍繞智能家居和智能音箱等場(chǎng)景,集成 IoT 人機(jī)交互的各項(xiàng)技術(shù),云知聲發(fā)布這款芯片時(shí)稱贊「雨燕」是以 1/10 的價(jià)格挑戰(zhàn) 50 倍的性能。

      「第一代 AI 芯片雨燕的架構(gòu)非常典型。云知聲做了兩件事情:一是專門設(shè)計(jì)的具備自主知識(shí)產(chǎn)權(quán)的高性能 DSP,做音頻數(shù)據(jù)處理,二是做面向音頻的人工智能數(shù)據(jù)/神經(jīng)處理器。當(dāng)把這個(gè)人工處理器集成進(jìn)去以后效果是顯而易見(jiàn)的,相對(duì)于通用方案提升了 50 倍。在硬件設(shè)備方面,因?yàn)檫@個(gè)芯片是高度集成的,所以外圍的線路使得很大的成本降低三分之一」,他說(shuō)。

      黃偉表示,云知聲在芯片上下足了功夫,為 B 端客戶提供了一套完整的解決方案。其不僅利用人工智能引擎對(duì)「雨燕」進(jìn)行調(diào)優(yōu),還專門為硬件產(chǎn)品設(shè)計(jì) app?蛻艏促I即用,無(wú)需再找其他供應(yīng)商,這是云知聲今后芯片提供銷售服務(wù)模式。

      去年 9 月,云知聲推出了基于「雨燕」的解決方案,并進(jìn)行開(kāi)源,正式推出正對(duì)智能家居和智能音箱場(chǎng)景下的解決方案。截至目前,基于「雨燕」的全棧解決方案已導(dǎo)入的各類方案商及合作伙伴已超過(guò) 10 家,包括美的、奧克斯、海信、京東、360、中國(guó)平安、硬蛋科技等,相關(guān)產(chǎn)品有望在今年第一季度上市。

      「在 2015 年的這個(gè)時(shí)間點(diǎn),我們真心沒(méi)有想過(guò) 2018 年我們會(huì)推出自研芯片,不光做出來(lái)而且還賣出去了!裹S偉透露,云知聲 2018 全年數(shù)億元的營(yíng)收較上年 3 倍的增長(zhǎng),幾乎全部仰仗于芯片的功勞和正確的商業(yè)化路徑,預(yù)計(jì)在 2019 年?duì)I收再翻 2-3 倍。而看似幾個(gè)億的營(yíng)業(yè)額背后,實(shí)則撬動(dòng)了幾十億甚至上百個(gè)億的產(chǎn)值。

      另一場(chǎng)革命

      在 2012 年公司成立之后,同年 9 月云知聲就推出了語(yǔ)音識(shí)別功能,專門面向端云互動(dòng)。經(jīng)過(guò) 6 年多發(fā)展,云知聲已經(jīng)擁有成面向物聯(lián)網(wǎng)單日用量達(dá)到 5 億次的云平臺(tái),并為平臺(tái)開(kāi)發(fā)了 ADPC 模式,它是云知聲 AI 深度處理的核心。

      2014 年初,團(tuán)隊(duì)把語(yǔ)音識(shí)別技術(shù)分別切入到「AI 生活」和「AI 服務(wù)」兩個(gè)場(chǎng)景中。很快,算法平臺(tái)化的雛形初現(xiàn),創(chuàng)始團(tuán)隊(duì)很快意識(shí)到,光有能力是不夠的!杆懔退惴ǖ娜诤,同理于技術(shù)與場(chǎng)景結(jié)合」,于是云知聲便有了「云端芯一體化」的產(chǎn)品技術(shù)架構(gòu)。

      當(dāng)云、端、芯被認(rèn)作物聯(lián)網(wǎng)產(chǎn)品端的三要素,云知聲立即展開(kāi)對(duì) IDM 產(chǎn)品的開(kāi)發(fā),并于在 2015 正式量產(chǎn),出貨量呈規(guī)模性增長(zhǎng)。

      與此同時(shí),2015 年,云知聲遭遇來(lái)自業(yè)務(wù)端的「戰(zhàn)術(shù)端的挑戰(zhàn)」,主要有兩方面:

      第一是來(lái)自數(shù)據(jù)處理的挑戰(zhàn)。在跟用戶打交道的過(guò)程中,注定有大量新數(shù)據(jù)的導(dǎo)入,語(yǔ)音、頭像、手勢(shì)等數(shù)據(jù)需要處理,深度互聯(lián)對(duì)算力的要求更高。追求高效就要采用基于深度神經(jīng)網(wǎng)絡(luò)的算法,這意味著云知聲需要在終端提供更加充分的算力。

      另外一個(gè)約束來(lái)自成本。為解決算力問(wèn)題,云知聲不得不采用更好的算法,導(dǎo)致了成本大幅提升,這對(duì)于硬件來(lái)說(shuō)十分敏感。成本之外,更強(qiáng)的算力還意味著更多的功耗。非插電產(chǎn)品的「續(xù)航焦慮」指望電池性能得到提升顯然不現(xiàn)實(shí)。

      那么主要矛盾如何化解?云知聲認(rèn)為,基于深度學(xué)習(xí)的新硬件,即「邊緣側(cè)的人工智能芯片」勢(shì)在必行,這場(chǎng)「自我革命」是 2015 年芯片項(xiàng)目的整體思路。

      眼下,只強(qiáng)調(diào)算法優(yōu)勢(shì)的 AI 企業(yè),很難再滿足 B 端客戶的場(chǎng)景需求,致使企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力和話語(yǔ)權(quán)逐步衰減。盡管云知聲創(chuàng)始人兼 CEO 黃偉接受采訪時(shí)沒(méi)有明確表態(tài)「不做芯片就會(huì)被淘汰」,但必須承認(rèn),軟硬結(jié)合才是 AI 企業(yè)未來(lái)立足之根本。

      在產(chǎn)品落地的過(guò)程中,算法和芯片二者不可或缺!溉绻忻嫔嫌羞m用的芯片還好,如果沒(méi)有我們就要造」,黃偉指出,「造芯」是云知聲的自我選擇。這不是它擅長(zhǎng)的事,但云知聲還是做出來(lái)了。去年 5 月 16 日,云知聲把第一代 AI 芯片雨燕(Swift)擺在眾人面前。黃偉放言,即便是現(xiàn)在,「雨燕」的各項(xiàng)指標(biāo)仍保持業(yè)內(nèi)領(lǐng)先。

      多模態(tài)的進(jìn)擊

      新年伊始,云知聲正在開(kāi)發(fā)的 3 款芯片,會(huì)在年內(nèi)投產(chǎn)上市。一款是面向語(yǔ)音場(chǎng)景的第二代 AI 芯片雨燕(Swift)-Lite,其主要特點(diǎn)是更加輕薄;另一款是面向智慧城市場(chǎng)景的多模態(tài) AI 芯片海豚(Dolphin),這款芯片是云知聲在 2019 年非常大的投入,繼承云知聲的 DeepNet2.0,它不僅僅支持雨燕的功能,還支持?jǐn)z像頭、ISP、OD 和人臉識(shí)別;第三款是云知聲與億咖通科技合作推行的車載多模態(tài) AI 芯片雪豹(Leopard),它更加著重本地算力,提供本地語(yǔ)音搜索,無(wú)網(wǎng)絡(luò)的狀況下也可通過(guò)語(yǔ)音導(dǎo)航選址,并具備一定的圖像處理能力。

      作為一家靠語(yǔ)音技術(shù)做強(qiáng)的公司,云知聲看到多模態(tài)場(chǎng)景的大勢(shì)所趨。2018 年,云知聲進(jìn)入圖像領(lǐng)域,并投入了不少資源。李霄寒解釋,云知聲已經(jīng)完全具備硬件平臺(tái)能力和分布式機(jī)器學(xué)習(xí)能力,以及數(shù)據(jù)高速處理和迭代能力。做這些事情不是興趣始然,而是為了滿足物聯(lián)網(wǎng)場(chǎng)景下,芯片設(shè)計(jì)的需要。

      當(dāng)前,云知聲圖像識(shí)別的準(zhǔn)確率高達(dá) 99.8%。除人臉識(shí)別外,云知聲還有物體識(shí)別、表情分析、顏值分析、標(biāo)簽化能力,這背后得益于 DeepNet2.0 的算力加持。

      DeepNet 是云知聲開(kāi)發(fā)的深度神經(jīng)網(wǎng)絡(luò)處理器,DeepNet 1.0 面向語(yǔ)音技術(shù),DeepNet 2.0 面向多模態(tài),后者既支持圖像處理,同時(shí)支持語(yǔ)音處理。目前云知聲 DeepNet2.0 已在 FPGA 上得到驗(yàn)證,其算力將在 AI 芯片海豚 Leopard 上得以體現(xiàn)。

      較 1.0 版本相比,DeepNet 2.0 首先是兼容性更好,可支持 LSTM、CNN、RNN、TDN 等網(wǎng)絡(luò);其次是支持可重構(gòu)計(jì)算,DeepNet2.0 計(jì)算單元可以拼接應(yīng)對(duì)計(jì)算模式,模式切換也可以快速組合,用單條指令來(lái)計(jì)算公式;第三是支持 Winograd,芯片做乘法的耗時(shí)遠(yuǎn)遠(yuǎn)高于加法,基于這一點(diǎn),Winograd 把乘法耗時(shí)降低為原來(lái)的 1/2,進(jìn)一步提升效率。

      此外,李霄寒介紹了 AI 芯片在算法應(yīng)用方面取得的新進(jìn)展——「超聽(tīng)限同向降噪技術(shù)」。所謂「超聽(tīng)限」顧名思義,就是讓機(jī)器識(shí)別到人類聽(tīng)覺(jué)范圍以外的聲音,而「同相降噪」可滿足在嘈雜的遠(yuǎn)場(chǎng)環(huán)境下,保證芯片靈敏精準(zhǔn)地捕捉到人聲。

      云知聲現(xiàn)階段的目標(biāo)明確,就是在物聯(lián)網(wǎng)技術(shù)面前,選擇某個(gè)重點(diǎn)場(chǎng)景切入,將算力和應(yīng)用服務(wù)更好地結(jié)合。而李霄寒篤信,物聯(lián)網(wǎng)時(shí)代的重要命題,是將「能力下沉到設(shè)備端」。

      展望未來(lái)的物聯(lián)網(wǎng) AI 芯片的發(fā)展路徑,云知聲團(tuán)隊(duì)一致認(rèn)為,連接方式、安全性、PPA(Power,Performance,Area)是核心。但 AI 物聯(lián)網(wǎng)芯片僅僅考慮這三要素還不夠,場(chǎng)景化、多模態(tài)、端云互動(dòng)這三大方面將深刻地影響 AI 芯片的設(shè)計(jì)、定位、成本、功耗和芯片需求。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    [No. S015-2]
    分享到微信

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。