首頁 > 產(chǎn)經(jīng)新聞頻道 > 互聯(lián)網(wǎng)＋

曠視研究院院長孫劍講述：中國技術(shù)何以打敗Facebook、Google拿下世界第一

2017年11月20日 10:59:22 來源：極客網(wǎng)

　　COCO 2017競賽，在曠視科技首席科學(xué)家、研究院院長孫劍博士的帶領(lǐng)下，曠視研究院一舉奪得三個冠軍：參與了COCO物體檢測、物體分割和人體關(guān)鍵點檢測三項任務(wù)的挑戰(zhàn)，取得了兩項第一(物體檢測、人體關(guān)鍵點)，一項第二(物體分割);還在Places語義分割環(huán)節(jié)戰(zhàn)勝谷歌奪得第一。孫劍博士也是深度殘差網(wǎng)絡(luò)ResNet作者之一，最近倍受關(guān)注的AlphaGo Zero的一個關(guān)鍵技術(shù)便是ResNet。

　　2017年11月8日，孫劍博士出席了由新智元舉辦的 AI World 2017世界人工智能大會上，并發(fā)表了《視覺端計算：從ResNet到ShuffleNet》的主題演講。

　　孫劍博士此前提到，曠視成功的秘訣是創(chuàng)新，不斷地創(chuàng)新，持續(xù)不斷地創(chuàng)新。在接受新智元專訪時，他分享了如何做到本質(zhì)創(chuàng)新的秘訣：本質(zhì)創(chuàng)新是希望能觸及問題的本質(zhì)，但也分兩個層次。

　　“大層次來看，算法要解決問題，有兩種: 一種是定義問題、理解問題。今天，人工智能很多問題是不清楚的，因為人工智能屬于跨學(xué)科的研究，以機(jī)器學(xué)習(xí)為基礎(chǔ)，有計算機(jī)視覺、語音處理等等問題牽扯在一起，其中很多問題沒有定義清楚。所以在講算法創(chuàng)新的時候，首先要看需要解決什么問題。我認(rèn)為最高層次的算法創(chuàng)新是對問題的理解以及新的看法。所以首先要理解清楚問題，才能夠有本質(zhì)創(chuàng)新。換句話說，只有方向正確了，才可能做出好的算法，這是比較高的層次。

　　另外，對問題的理解需要挺長時間。如果想真正深刻理解一個問題的話，非常聰明的人可能要花兩三年，不聰明的人可能需要五年，這樣才可能對問題有非常深刻的理解。理解以前都做了什么?你現(xiàn)在做的這個東西是不是有意義的?這是上一層的算法創(chuàng)新，深入理解和清楚定義問題本質(zhì)之后，算法才有意義。

　　下面一層的算法創(chuàng)新是說，今天在一定時期內(nèi)發(fā)現(xiàn)了一個新問題，然后去找一個算法把這個問題又快又好地解決。

　　這里遵守兩條準(zhǔn)則，第一條準(zhǔn)則是這個算法必須有一定的推廣性，不能太特殊。比如說做物體識別，舉個例子，原來我們曾經(jīng)做過貓頭檢測，利用貓的耳朵比較尖的特性做了算法，這個問題解決了，但沒有通用性，影響力就不大。

　　第二個原則就是別人會不會用、會不會重復(fù)使用你的算法。如果你是在學(xué)術(shù)界或者要公開算法的話，只有別人主動愿意用你的算法，才能形成網(wǎng)絡(luò)效應(yīng)。你自己很看好，但是別人不看好，或者說別人并不去主動用你這個東西，說明你的這個東西沒有觸到用戶的痛點。其實，你的同行也是你算法的用戶，如果他們不得不主動使用你的算法，這就說明真正觸及到了問題的本質(zhì)，這條是非常重要的。我們以前在大公司做的一些算法，今天還有很多人用。我們今天在Face++做的算法(ShuffleNet)，第二天就有公開的開源社區(qū)，去實現(xiàn)這個算法，他們在不少大公司和創(chuàng)業(yè)公司都第一時間用了這個算法。這就說明你的算法特別好用，這樣的東西就是本質(zhì)性創(chuàng)新。”

　　曠視研究院院長的帶兵之道：讀《孫子兵法》，鼓勵出論文，不在乎數(shù)量

　　孫劍博士曾談到，在帶領(lǐng)團(tuán)隊拿到COCO競賽冠軍方面，做好了三件事：建團(tuán)隊、激勵團(tuán)隊、培養(yǎng)團(tuán)隊。在接受新智元專訪時，孫劍詳細(xì)分享了如何帶領(lǐng)好一個團(tuán)隊，吸引更多的人才。

　　他說：“帶團(tuán)隊這件事情其實是多層次的。我最近看《孫子兵法》上講的，為將者首先要智勇雙全，要仁、要嚴(yán)、要信，還要做到明，誰做得對、誰做得不對要非常明。大致就是建立一個很好的文化，建立一些大的框架，哪些是我們應(yīng)該做的，哪些是不應(yīng)該做的。要圍繞著我們公司的價值觀，我們公司價值觀叫“追求、極致、簡單、可靠”，這幾個字對一個團(tuán)隊非常重要。“追求、極致”有兩個含義，一個是說我們要做到最好，另一個是說做這件事情的時候要付出最大的努力，把所有的潛力都發(fā)揮出來。”

　　“從人才觀上的話，我們當(dāng)然是希望找最聰明的人，我們要求并不高，你只要數(shù)學(xué)還不錯就可以。你如果線性代數(shù)還可以，編程還可以的話就可以做這件事情。我們的環(huán)境非常扁平化，所有的數(shù)據(jù)代碼基本上都是共享的，所有的知識都是共通的，包括我們內(nèi)部的MegBrain。你如果想了解每個細(xì)節(jié)，就可以找MegBrain的開發(fā)者，他會給你講細(xì)節(jié)，到底MegBrain怎么設(shè)計的、怎么優(yōu)化，你會學(xué)到這些東西，可以有一個很自由的空間來做這件事情。還有一個很大的因素，讓大家覺得創(chuàng)新是安全的，是他愿意冒風(fēng)險去做的。我大多數(shù)時候都不會說不要做這個、不要做那個，而是說你試試看，這樣讓大家有一個安全的、愿意探索的環(huán)境，提高命中率。”

　　在AI人才非常稀缺的今天，孫劍表示，在研究院，我們鼓勵出論文。這在國內(nèi)外的創(chuàng)業(yè)公司里面應(yīng)該是少數(shù)現(xiàn)象。“因為很多優(yōu)秀人才希望他們的工作一部分可以被看到。我們通過這樣的方式吸引人才”，他說。

　　但是，曠視對論文數(shù)量沒有要求。“我們對任何的事情都沒有數(shù)量要求，哪怕你只有一篇論文，但只要滿足創(chuàng)新的兩條原則，第一它是通用的，第二別人愿意用，只要有一篇這樣的論文就可以。我以前自己做研究，每次會議投稿時會花很長時間只做兩篇論文，我自己主做一篇，另一篇讓學(xué)生做，或者跟別人一起做一篇。我們不追求數(shù)量，只要有一篇了不起的論文就可以。”

　　以下是曠視科技Face++首席科學(xué)家孫劍博士在新智元AI World 2017世界人工智能大會上的演講：

　　孫劍AI WORLD 2017世界人工智能大會演講：

　　《視覺端計算：從ResNet到ShuffleNet 》

　　孫劍：各位好，非常高興新智元提供了這樣一個機(jī)會把我們做計算機(jī)視覺研究的人聚在一起，也非常高興見到以前的老朋友，比如騰訊的賈佳亞博士，我們之前曾經(jīng)一起做計算機(jī)圖形學(xué)和計算機(jī)攝影學(xué)。剛才賈佳亞展示了一張圖：那是2004年我們倆合作的第一篇siggraph論文。當(dāng)時非常難，不亞于今天去 COCO 或者 ImageNet拿一個冠軍。今天到場的嘉賓中，華先勝博士也是我在微軟的同事。計算機(jī)視覺在深度學(xué)習(xí)的推動下，發(fā)生了天翻地覆的變化，今天也在此分享一些我最近的工作。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信

1/6

尾頁