COCO 2017競賽,在曠視科技首席科學(xué)家、研究院院長孫劍博士的帶領(lǐng)下,曠視研究院一舉奪得三個冠軍:參與了COCO物體檢測、物體分割和人體關(guān)鍵點檢測三項任務(wù)的挑戰(zhàn),取得了兩項第一(物體檢測、人體關(guān)鍵點),一項第二(物體分割);還在Places語義分割環(huán)節(jié)戰(zhàn)勝谷歌奪得第一。孫劍博士也是深度殘差網(wǎng)絡(luò)ResNet作者之一,最近倍受關(guān)注的AlphaGo Zero的一個關(guān)鍵技術(shù)便是ResNet。
2017年11月8日,孫劍博士出席了由新智元舉辦的 AI World 2017世界人工智能大會上,并發(fā)表了《視覺端計算:從ResNet到ShuffleNet》的主題演講。
孫劍博士此前提到,曠視成功的秘訣是創(chuàng)新,不斷地創(chuàng)新,持續(xù)不斷地創(chuàng)新。在接受新智元專訪時,他分享了如何做到本質(zhì)創(chuàng)新的秘訣:本質(zhì)創(chuàng)新是希望能觸及問題的本質(zhì),但也分兩個層次。
“大層次來看,算法要解決問題,有兩種: 一種是定義問題、理解問題。今天,人工智能很多問題是不清楚的,因為人工智能屬于跨學(xué)科的研究,以機(jī)器學(xué)習(xí)為基礎(chǔ),有計算機(jī)視覺、語音處理等等問題牽扯在一起,其中很多問題沒有定義清楚。所以在講算法創(chuàng)新的時候,首先要看需要解決什么問題。我認(rèn)為最高層次的算法創(chuàng)新是對問題的理解以及新的看法。所以首先要理解清楚問題,才能夠有本質(zhì)創(chuàng)新。換句話說,只有方向正確了,才可能做出好的算法,這是比較高的層次。
另外,對問題的理解需要挺長時間。如果想真正深刻理解一個問題的話,非常聰明的人可能要花兩三年,不聰明的人可能需要五年,這樣才可能對問題有非常深刻的理解。理解以前都做了什么?你現(xiàn)在做的這個東西是不是有意義的?這是上一層的算法創(chuàng)新,深入理解和清楚定義問題本質(zhì)之后,算法才有意義。
下面一層的算法創(chuàng)新是說,今天在一定時期內(nèi)發(fā)現(xiàn)了一個新問題,然后去找一個算法把這個問題又快又好地解決。
這里遵守兩條準(zhǔn)則,第一條準(zhǔn)則是這個算法必須有一定的推廣性,不能太特殊。比如說做物體識別,舉個例子,原來我們曾經(jīng)做過貓頭檢測,利用貓的耳朵比較尖的特性做了算法,這個問題解決了,但沒有通用性,影響力就不大。
第二個原則就是別人會不會用、會不會重復(fù)使用你的算法。如果你是在學(xué)術(shù)界或者要公開算法的話,只有別人主動愿意用你的算法,才能形成網(wǎng)絡(luò)效應(yīng)。你自己很看好,但是別人不看好,或者說別人并不去主動用你這個東西,說明你的這個東西沒有觸到用戶的痛點。其實,你的同行也是你算法的用戶,如果他們不得不主動使用你的算法,這就說明真正觸及到了問題的本質(zhì),這條是非常重要的。我們以前在大公司做的一些算法,今天還有很多人用。我們今天在Face++做的算法(ShuffleNet),第二天就有公開的開源社區(qū),去實現(xiàn)這個算法,他們在不少大公司和創(chuàng)業(yè)公司都第一時間用了這個算法。這就說明你的算法特別好用,這樣的東西就是本質(zhì)性創(chuàng)新。”
曠視研究院院長的帶兵之道:讀《孫子兵法》,鼓勵出論文,不在乎數(shù)量
孫劍博士曾談到,在帶領(lǐng)團(tuán)隊拿到COCO競賽冠軍方面,做好了三件事:建團(tuán)隊、激勵團(tuán)隊、培養(yǎng)團(tuán)隊。在接受新智元專訪時,孫劍詳細(xì)分享了如何帶領(lǐng)好一個團(tuán)隊,吸引更多的人才。
他說:“帶團(tuán)隊這件事情其實是多層次的。我最近看《孫子兵法》上講的,為將者首先要智勇雙全,要仁、要嚴(yán)、要信,還要做到明,誰做得對、誰做得不對要非常明。大致就是建立一個很好的文化,建立一些大的框架,哪些是我們應(yīng)該做的,哪些是不應(yīng)該做的。要圍繞著我們公司的價值觀,我們公司價值觀叫“追求、極致、簡單、可靠”,這幾個字對一個團(tuán)隊非常重要。“追求、極致”有兩個含義,一個是說我們要做到最好,另一個是說做這件事情的時候要付出最大的努力,把所有的潛力都發(fā)揮出來。”
“從人才觀上的話,我們當(dāng)然是希望找最聰明的人,我們要求并不高,你只要數(shù)學(xué)還不錯就可以。你如果線性代數(shù)還可以,編程還可以的話就可以做這件事情。我們的環(huán)境非常扁平化,所有的數(shù)據(jù)代碼基本上都是共享的,所有的知識都是共通的,包括我們內(nèi)部的MegBrain。你如果想了解每個細(xì)節(jié),就可以找MegBrain的開發(fā)者,他會給你講細(xì)節(jié),到底MegBrain怎么設(shè)計的、怎么優(yōu)化,你會學(xué)到這些東西,可以有一個很自由的空間來做這件事情。還有一個很大的因素,讓大家覺得創(chuàng)新是安全的,是他愿意冒風(fēng)險去做的。我大多數(shù)時候都不會說不要做這個、不要做那個,而是說你試試看,這樣讓大家有一個安全的、愿意探索的環(huán)境,提高命中率。”
在AI人才非常稀缺的今天,孫劍表示,在研究院,我們鼓勵出論文。這在國內(nèi)外的創(chuàng)業(yè)公司里面應(yīng)該是少數(shù)現(xiàn)象。“因為很多優(yōu)秀人才希望他們的工作一部分可以被看到。我們通過這樣的方式吸引人才”,他說。
但是,曠視對論文數(shù)量沒有要求。“我們對任何的事情都沒有數(shù)量要求,哪怕你只有一篇論文,但只要滿足創(chuàng)新的兩條原則,第一它是通用的,第二別人愿意用,只要有一篇這樣的論文就可以。我以前自己做研究,每次會議投稿時會花很長時間只做兩篇論文,我自己主做一篇,另一篇讓學(xué)生做,或者跟別人一起做一篇。我們不追求數(shù)量,只要有一篇了不起的論文就可以。”
以下是曠視科技Face++首席科學(xué)家孫劍博士在新智元AI World 2017世界人工智能大會上的演講:
孫劍AI WORLD 2017世界人工智能大會演講:
《視覺端計算:從ResNet到ShuffleNet 》
孫劍:各位好,非常高興新智元提供了這樣一個機(jī)會把我們做計算機(jī)視覺研究的人聚在一起,也非常高興見到以前的老朋友,比如騰訊的賈佳亞博士,我們之前曾經(jīng)一起做計算機(jī)圖形學(xué)和計算機(jī)攝影學(xué)。剛才賈佳亞展示了一張圖:那是2004年我們倆合作的第一篇siggraph論文。當(dāng)時非常難,不亞于今天去 COCO 或者 ImageNet拿一個冠軍。今天到場的嘉賓中,華先勝博士也是我在微軟的同事。計算機(jī)視覺在深度學(xué)習(xí)的推動下,發(fā)生了天翻地覆的變化,今天也在此分享一些我最近的工作。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。