A系列最大電池!OPPO A5入網(wǎng):6330mAh超越A5 ProOPPO Find X8 Ultra渲染圖首曝:外觀與Pro版幾乎一致微軟重申Win10將結(jié)束支持!督促趕緊升級Win11:不升用不了Microsoft 365六年磨一劍!iPhone 17 Air真機泄露:橫向三攝設(shè)計大變革小米超級小愛升級計劃公布:小米13/K60等也能用上 1月27日前推送摩托羅拉新款折疊屏手機或提前發(fā)布 型號XT2551獲印度BIS認(rèn)證攬獲多項CES 2025科技大獎,蟬聯(lián)全球消費電子品牌TOP10國產(chǎn)動畫電影《哪吒之魔童鬧!沸既姹旧嫌常褐С諭MAX、CINITY等多制式擎朗智能攜手科大訊飛,共啟具身智能服務(wù)機器人新征程“借機玩!?多家互聯(lián)網(wǎng)公司在小紅書發(fā)英文貼攬客OPPO Find X8 Ultra渲染圖曝光:外觀設(shè)計基本保持不變1月16日發(fā)布!真我14 Pro系列官宣:全球首款溫感變色手機三星Galaxy S25 Slim細(xì)節(jié)曝光:厚度僅6.5mm 對標(biāo)iPhone 17 Air斥資134億!TCL買下LG顯示廣州廠訊飛星火X1成為全國產(chǎn)算力平臺上唯一的深度推理大模型董明珠稱格力自研芯片設(shè)計制造封裝全鏈條完成微軟再次強調(diào)Win10將于10月14日終止支持,敦促用戶免費升級至Win11Arm曾考慮將授權(quán)價格提高300% 并曾探討設(shè)計自有芯片OpenAI推出新功能“Tasks” ChatGPT可變身成AI私人助理三星Galaxy S25系列手機AI創(chuàng)作新境界:語音/文字加持“草圖轉(zhuǎn)圖像”
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 互聯(lián)網(wǎng)+

    曠視研究院院長孫劍講述:中國技術(shù)何以打敗Facebook、Google拿下世界第一

    2017年11月20日 10:59:22   來源:極客網(wǎng)

      我們以前做研究就講究填補國家空白,其實左邊一個空白我們看到了,然后我們今年提出來一個網(wǎng)絡(luò)叫ShuffleNet,它是為了給定計算量下或者比較小的計算量下,特別是計算量只有5到10個的TFLOP/S的時候,特別是手機上你怎么做深度學(xué)習(xí)網(wǎng)絡(luò)的推斷。

    image.png

      這里是ShuffleNet的一些基本機構(gòu),左邊是最早的網(wǎng)絡(luò),然后ResNet、然后Bottleneck,ResNet,還有 MobileNets,然后右邊是ShuffleNet。

    image.png

      核心思想就是把計算量最昂貴的1乘1的卷集分成很多組引入Shuffle 的一個操作,我們可以達到非常好的性能。例如說我們比傳統(tǒng)的AlexNet在同樣精度上可以快15到20倍,這速度并不是理論復(fù)雜度,而是真正在手機上的實測速度,理論復(fù)雜度比這還要小。

    image.png

      我們把這東西用在什么地方呢?第一我們用在FGPA(可編程門陣列)芯片上,中間是FGPA智能抓拍機,把這FGPA塞到相機里,就是智能的抓拍機。右邊視頻向大家展示一下成本非常便宜的FGPA上如何做智能人像抓拍,這智能人像抓拍機目前是業(yè)界第一款全畫幅、全幀率的人像抓拍機。這是保證視頻里人臉都不漏掉的重要因素。

    image.png

      我們還把Shufflenet用在手機上。iPhoneX 有3D人臉解鎖,其實我們也已經(jīng)幫助安卓手機廠商,包括VIVO、小米還有錘子手機,都使用了Face++的人臉解鎖技術(shù),其實就是Shufflenet背后提供的計算,能夠讓人臉解鎖在手機上的時間小于0.1秒,拿起手機只要看一下屏幕馬上就可以解鎖,這速度會帶來非常不一樣的體驗,大家有機會可以試試不同款的手機。

      落地:城市大腦及其他

    image.png

      另外一個就是剛才華先勝博士講的城市大腦。以前我也玩游戲,玩的一個游戲叫《模擬城市》其實就是你怎么去構(gòu)造、管理這個城市。今天,隨著人工智能和各種技術(shù)的發(fā)展,我們有機會去做真實的模擬城市的工作,右邊是我們做的計算機視覺方面的進展,是如何在一個城市里面把所有的人和車進行檢測跟蹤,把所有屬性都抽取出來,這是城市大腦傳感器最重要的一部分。

    image.png

      另外,視覺計算還有非常廣的商業(yè)用途,我們的一個產(chǎn)品就是用刷臉做身份認(rèn)證的平臺,目前這個平臺叫FaceID,它是世界上最大的人臉識別云平臺。它在線上為中國上百家互聯(lián)網(wǎng)金融公司提供服務(wù)。右邊是很好的商業(yè)探索,今天帶手機而不掃二維碼也可以用人臉支付,這是杭州肯德基第一個線下用人臉支付的案例。

    image.png

      還包括我們今天的無人店和新零售的一些探索,這里面是一個視頻展示一下Face++的技術(shù)如何幫助新零售行業(yè)做更好的線下商業(yè)銷售。

    image.png

      最后總結(jié)一下,雖然我們做了很多商業(yè)上的應(yīng)用,特別是把核心算法用起來。但是做計算機視覺和人工智能的人都知道,真正觸及人工智能冰山一角還是非常困難的。在這過程中,我們內(nèi)部就講幾個字,做公司的話,“技術(shù)、商業(yè)、數(shù)據(jù)”這個循環(huán)要轉(zhuǎn)起來。同樣,對于做算法,“熱情、洞察、耐心”是我們最重要的三個方向。

      人才是根本:巨大的腦力ALL IN,AI 潛力巨大

    image.png

      中間這一張照片是我一個朋友分享的,我用這張照片表示人工智能還是很遙遠(yuǎn),前面的路還不知道怎么走,但是我們非常有信心,信心來自于哪里呢?信心來自于人的智力投入,左邊這一張是去年GTC NVIDIA年會拍的照片,右邊是今年計算機視覺年會CVPR的照片,每一個會議參與者都超過了5千人,這標(biāo)志著世界上所有最聰明的人都在做這一件事情,我相信所有人的聰明才智集合在一起,一定能夠非?焖俚赝苿舆@一件事情的發(fā)展。

    image.png

      最后我再回顧一下,上周日我們請了姚期智院士來擔(dān)任我們Face++學(xué)術(shù)委員會的首席顧問。我們探討的主題是人工智能的本質(zhì)創(chuàng)新。探討了非常多的話題后,最后回到了根本問題:人才。我們分別讓每一個人回答了一下對于人才的最重要要求。姚院士說希望在我們公司里,所有的研究員都能夠人盡其用。我自己在曠視研究院,最大使命是創(chuàng)造一個好的環(huán)境,讓每一個人才人盡其用。印奇是我們的CEO,他的使命是為公司找到最大的人工智能應(yīng)用場景,同時匯聚交叉學(xué)科的人才,因為我們知道人工智能不是只做計算機視覺或語音語意理解,而是做認(rèn)知、做機器人,甚至腦科學(xué)的人都應(yīng)該匯聚在一起,才真正有可能把人工智能的問題一點點理清楚,定義好問題才能更加踏實地向前走。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。