全球首款第二代酷睿Ultra處理器筆記本!聯(lián)想YOGA Air 15 Aura AI元啟版開啟預售中國品牌,讓東南亞感受“消費升級”小紅書本地“坐抖望團”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應商導致 1TB 數據泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數字化轉型重慶:力爭今年智能網聯(lián)新能源汽車產量突破 100 萬輛,到 2027 年建成萬億級產業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或將停產沖上熱搜!閑魚相關搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網銷量及銷售額領先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術邂逅千年色彩美學!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領域三星新專利探索AR技術新應用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術的革新者
  • 首頁 > 產經新聞頻道 > 互聯(lián)網+

    云知聲的多模態(tài)場景突圍:軟硬結合,端云互動

    2019年01月28日 11:47:29   來源:中文科技資訊

      半年前,云知聲發(fā)布了首款面向物聯(lián)網的 AI 芯片雨燕(Swift);半年后,云知聲宣布了多模態(tài) AI 芯片戰(zhàn)略,曝光了正在研發(fā)的三款 AI 芯片:第二代物聯(lián)網語音 AI 芯片雨燕 Lite、面向智慧城市的支持圖像與語音計算的多模態(tài) AI 芯片海豚(Dolphin),以及面向智慧出行的車規(guī)級多模態(tài) AI 芯片雪豹(Leopard)。

      從 2015 年芯片項目確立并搭建團隊「正規(guī)軍」,2017 年「造芯」項目進入攻堅階段,再到 2018 年 1 月做出第一個 MPW(多項目晶圓),2018 年 5 月份做了發(fā)布首款芯片,6 月份啟動量產,9 月份發(fā)布了基于雨燕的開源方案,云知聲的腳步沒有停歇。緊跟著,芯片設計團隊從語音技術轉戰(zhàn)至圖像 IP 設計。

      在經歷了 2018 年的商業(yè)化洗禮后,國內人工智能企業(yè)愈發(fā)重視技術和產品方案的完整性和普適性。當人工智能在應用場景的加速落地,AI 芯片的價值毋庸贅言,而「多模態(tài)」一詞開始被越來越多地提及。

      商業(yè)變現(xiàn)更進一竿

      隨著技術迭代和場景需求疊加,AI 芯片的邊界發(fā)生著微妙變化。2015 年云知聲決心做硬件時,專門為此在深圳設立分公司。一套完整的芯片開發(fā)過程相對漫長,期間不可避免地會涉及算法迭代,對芯片的研制速率造成影響。雨燕從設計到研發(fā),直至最終量產,時間周期為 3 年。要保證 2015 年立項的芯片,仍適用于時下主流的算法,云知聲聯(lián)合創(chuàng)始人李霄寒并不否認這項任務的艱巨性。憑經驗對算法預判之外,團隊還要拿出勇氣和魄力唯此一搏。

      作為云知聲的芯片品牌,「雨燕」是 UniOne 芯片矩陣中的初代產品,它圍繞智能家居和智能音箱等場景,集成 IoT 人機交互的各項技術,云知聲發(fā)布這款芯片時稱贊「雨燕」是以 1/10 的價格挑戰(zhàn) 50 倍的性能。

      「第一代 AI 芯片雨燕的架構非常典型。云知聲做了兩件事情:一是專門設計的具備自主知識產權的高性能 DSP,做音頻數據處理,二是做面向音頻的人工智能數據/神經處理器。當把這個人工處理器集成進去以后效果是顯而易見的,相對于通用方案提升了 50 倍。在硬件設備方面,因為這個芯片是高度集成的,所以外圍的線路使得很大的成本降低三分之一」,他說。

      黃偉表示,云知聲在芯片上下足了功夫,為 B 端客戶提供了一套完整的解決方案。其不僅利用人工智能引擎對「雨燕」進行調優(yōu),還專門為硬件產品設計 app?蛻艏促I即用,無需再找其他供應商,這是云知聲今后芯片提供銷售服務模式。

      去年 9 月,云知聲推出了基于「雨燕」的解決方案,并進行開源,正式推出正對智能家居和智能音箱場景下的解決方案。截至目前,基于「雨燕」的全棧解決方案已導入的各類方案商及合作伙伴已超過 10 家,包括美的、奧克斯、海信、京東、360、中國平安、硬蛋科技等,相關產品有望在今年第一季度上市。

      「在 2015 年的這個時間點,我們真心沒有想過 2018 年我們會推出自研芯片,不光做出來而且還賣出去了!裹S偉透露,云知聲 2018 全年數億元的營收較上年 3 倍的增長,幾乎全部仰仗于芯片的功勞和正確的商業(yè)化路徑,預計在 2019 年營收再翻 2-3 倍。而看似幾個億的營業(yè)額背后,實則撬動了幾十億甚至上百個億的產值。

      另一場革命

      在 2012 年公司成立之后,同年 9 月云知聲就推出了語音識別功能,專門面向端云互動。經過 6 年多發(fā)展,云知聲已經擁有成面向物聯(lián)網單日用量達到 5 億次的云平臺,并為平臺開發(fā)了 ADPC 模式,它是云知聲 AI 深度處理的核心。

      2014 年初,團隊把語音識別技術分別切入到「AI 生活」和「AI 服務」兩個場景中。很快,算法平臺化的雛形初現(xiàn),創(chuàng)始團隊很快意識到,光有能力是不夠的!杆懔退惴ǖ娜诤,同理于技術與場景結合」,于是云知聲便有了「云端芯一體化」的產品技術架構。

      當云、端、芯被認作物聯(lián)網產品端的三要素,云知聲立即展開對 IDM 產品的開發(fā),并于在 2015 正式量產,出貨量呈規(guī)模性增長。

      與此同時,2015 年,云知聲遭遇來自業(yè)務端的「戰(zhàn)術端的挑戰(zhàn)」,主要有兩方面:

      第一是來自數據處理的挑戰(zhàn)。在跟用戶打交道的過程中,注定有大量新數據的導入,語音、頭像、手勢等數據需要處理,深度互聯(lián)對算力的要求更高。追求高效就要采用基于深度神經網絡的算法,這意味著云知聲需要在終端提供更加充分的算力。

      另外一個約束來自成本。為解決算力問題,云知聲不得不采用更好的算法,導致了成本大幅提升,這對于硬件來說十分敏感。成本之外,更強的算力還意味著更多的功耗。非插電產品的「續(xù)航焦慮」指望電池性能得到提升顯然不現(xiàn)實。

      那么主要矛盾如何化解?云知聲認為,基于深度學習的新硬件,即「邊緣側的人工智能芯片」勢在必行,這場「自我革命」是 2015 年芯片項目的整體思路。

      眼下,只強調算法優(yōu)勢的 AI 企業(yè),很難再滿足 B 端客戶的場景需求,致使企業(yè)的市場競爭力和話語權逐步衰減。盡管云知聲創(chuàng)始人兼 CEO 黃偉接受采訪時沒有明確表態(tài)「不做芯片就會被淘汰」,但必須承認,軟硬結合才是 AI 企業(yè)未來立足之根本。

      在產品落地的過程中,算法和芯片二者不可或缺!溉绻忻嫔嫌羞m用的芯片還好,如果沒有我們就要造」,黃偉指出,「造芯」是云知聲的自我選擇。這不是它擅長的事,但云知聲還是做出來了。去年 5 月 16 日,云知聲把第一代 AI 芯片雨燕(Swift)擺在眾人面前。黃偉放言,即便是現(xiàn)在,「雨燕」的各項指標仍保持業(yè)內領先。

      多模態(tài)的進擊

      新年伊始,云知聲正在開發(fā)的 3 款芯片,會在年內投產上市。一款是面向語音場景的第二代 AI 芯片雨燕(Swift)-Lite,其主要特點是更加輕薄;另一款是面向智慧城市場景的多模態(tài) AI 芯片海豚(Dolphin),這款芯片是云知聲在 2019 年非常大的投入,繼承云知聲的 DeepNet2.0,它不僅僅支持雨燕的功能,還支持攝像頭、ISP、OD 和人臉識別;第三款是云知聲與億咖通科技合作推行的車載多模態(tài) AI 芯片雪豹(Leopard),它更加著重本地算力,提供本地語音搜索,無網絡的狀況下也可通過語音導航選址,并具備一定的圖像處理能力。

      作為一家靠語音技術做強的公司,云知聲看到多模態(tài)場景的大勢所趨。2018 年,云知聲進入圖像領域,并投入了不少資源。李霄寒解釋,云知聲已經完全具備硬件平臺能力和分布式機器學習能力,以及數據高速處理和迭代能力。做這些事情不是興趣始然,而是為了滿足物聯(lián)網場景下,芯片設計的需要。

      當前,云知聲圖像識別的準確率高達 99.8%。除人臉識別外,云知聲還有物體識別、表情分析、顏值分析、標簽化能力,這背后得益于 DeepNet2.0 的算力加持。

      DeepNet 是云知聲開發(fā)的深度神經網絡處理器,DeepNet 1.0 面向語音技術,DeepNet 2.0 面向多模態(tài),后者既支持圖像處理,同時支持語音處理。目前云知聲 DeepNet2.0 已在 FPGA 上得到驗證,其算力將在 AI 芯片海豚 Leopard 上得以體現(xiàn)。

      較 1.0 版本相比,DeepNet 2.0 首先是兼容性更好,可支持 LSTM、CNN、RNN、TDN 等網絡;其次是支持可重構計算,DeepNet2.0 計算單元可以拼接應對計算模式,模式切換也可以快速組合,用單條指令來計算公式;第三是支持 Winograd,芯片做乘法的耗時遠遠高于加法,基于這一點,Winograd 把乘法耗時降低為原來的 1/2,進一步提升效率。

      此外,李霄寒介紹了 AI 芯片在算法應用方面取得的新進展——「超聽限同向降噪技術」。所謂「超聽限」顧名思義,就是讓機器識別到人類聽覺范圍以外的聲音,而「同相降噪」可滿足在嘈雜的遠場環(huán)境下,保證芯片靈敏精準地捕捉到人聲。

      云知聲現(xiàn)階段的目標明確,就是在物聯(lián)網技術面前,選擇某個重點場景切入,將算力和應用服務更好地結合。而李霄寒篤信,物聯(lián)網時代的重要命題,是將「能力下沉到設備端」。

      展望未來的物聯(lián)網 AI 芯片的發(fā)展路徑,云知聲團隊一致認為,連接方式、安全性、PPA(Power,Performance,Area)是核心。但 AI 物聯(lián)網芯片僅僅考慮這三要素還不夠,場景化、多模態(tài)、端云互動這三大方面將深刻地影響 AI 芯片的設計、定位、成本、功耗和芯片需求。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    [No. S015-2]
    分享到微信

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。