A系列最大電池!OPPO A5入網(wǎng):6330mAh超越A5 ProOPPO Find X8 Ultra渲染圖首曝:外觀與Pro版幾乎一致微軟重申Win10將結(jié)束支持!督促趕緊升級Win11:不升用不了Microsoft 365六年磨一劍!iPhone 17 Air真機(jī)泄露:橫向三攝設(shè)計大變革小米超級小愛升級計劃公布:小米13/K60等也能用上 1月27日前推送摩托羅拉新款折疊屏手機(jī)或提前發(fā)布 型號XT2551獲印度BIS認(rèn)證攬獲多項CES 2025科技大獎,蟬聯(lián)全球消費電子品牌TOP10國產(chǎn)動畫電影《哪吒之魔童鬧!沸既姹旧嫌常褐С諭MAX、CINITY等多制式擎朗智能攜手科大訊飛,共啟具身智能服務(wù)機(jī)器人新征程“借機(jī)玩!?多家互聯(lián)網(wǎng)公司在小紅書發(fā)英文貼攬客OPPO Find X8 Ultra渲染圖曝光:外觀設(shè)計基本保持不變1月16日發(fā)布!真我14 Pro系列官宣:全球首款溫感變色手機(jī)三星Galaxy S25 Slim細(xì)節(jié)曝光:厚度僅6.5mm 對標(biāo)iPhone 17 Air斥資134億!TCL買下LG顯示廣州廠訊飛星火X1成為全國產(chǎn)算力平臺上唯一的深度推理大模型董明珠稱格力自研芯片設(shè)計制造封裝全鏈條完成微軟再次強(qiáng)調(diào)Win10將于10月14日終止支持,敦促用戶免費升級至Win11Arm曾考慮將授權(quán)價格提高300% 并曾探討設(shè)計自有芯片OpenAI推出新功能“Tasks” ChatGPT可變身成AI私人助理三星Galaxy S25系列手機(jī)AI創(chuàng)作新境界:語音/文字加持“草圖轉(zhuǎn)圖像”
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 互聯(lián)網(wǎng)+

    曠視研究院院長孫劍講述:中國技術(shù)何以打敗Facebook、Google拿下世界第一

    2017年11月20日 10:59:22   來源:極客網(wǎng)

      COCO 2017競賽,在曠視科技首席科學(xué)家、研究院院長孫劍博士的帶領(lǐng)下,曠視研究院一舉奪得三個冠軍:參與了COCO物體檢測、物體分割和人體關(guān)鍵點檢測三項任務(wù)的挑戰(zhàn),取得了兩項第一(物體檢測、人體關(guān)鍵點),一項第二(物體分割);還在Places語義分割環(huán)節(jié)戰(zhàn)勝谷歌奪得第一。孫劍博士也是深度殘差網(wǎng)絡(luò)ResNet作者之一,最近倍受關(guān)注的AlphaGo Zero的一個關(guān)鍵技術(shù)便是ResNet。

      2017年11月8日,孫劍博士出席了由新智元舉辦的 AI World 2017世界人工智能大會上,并發(fā)表了《視覺端計算:從ResNet到ShuffleNet》的主題演講。

    image.png

      孫劍博士此前提到,曠視成功的秘訣是創(chuàng)新,不斷地創(chuàng)新,持續(xù)不斷地創(chuàng)新。在接受新智元專訪時,他分享了如何做到本質(zhì)創(chuàng)新的秘訣:本質(zhì)創(chuàng)新是希望能觸及問題的本質(zhì),但也分兩個層次。

      “大層次來看,算法要解決問題,有兩種: 一種是定義問題、理解問題。今天,人工智能很多問題是不清楚的,因為人工智能屬于跨學(xué)科的研究,以機(jī)器學(xué)習(xí)為基礎(chǔ),有計算機(jī)視覺、語音處理等等問題牽扯在一起,其中很多問題沒有定義清楚。所以在講算法創(chuàng)新的時候,首先要看需要解決什么問題。我認(rèn)為最高層次的算法創(chuàng)新是對問題的理解以及新的看法。所以首先要理解清楚問題,才能夠有本質(zhì)創(chuàng)新。換句話說,只有方向正確了,才可能做出好的算法,這是比較高的層次。

      另外,對問題的理解需要挺長時間。如果想真正深刻理解一個問題的話,非常聰明的人可能要花兩三年,不聰明的人可能需要五年,這樣才可能對問題有非常深刻的理解。理解以前都做了什么?你現(xiàn)在做的這個東西是不是有意義的?這是上一層的算法創(chuàng)新,深入理解和清楚定義問題本質(zhì)之后,算法才有意義。

      下面一層的算法創(chuàng)新是說,今天在一定時期內(nèi)發(fā)現(xiàn)了一個新問題,然后去找一個算法把這個問題又快又好地解決。

      這里遵守兩條準(zhǔn)則,第一條準(zhǔn)則是這個算法必須有一定的推廣性,不能太特殊。比如說做物體識別,舉個例子,原來我們曾經(jīng)做過貓頭檢測,利用貓的耳朵比較尖的特性做了算法,這個問題解決了,但沒有通用性,影響力就不大。

      第二個原則就是別人會不會用、會不會重復(fù)使用你的算法。如果你是在學(xué)術(shù)界或者要公開算法的話,只有別人主動愿意用你的算法,才能形成網(wǎng)絡(luò)效應(yīng)。你自己很看好,但是別人不看好,或者說別人并不去主動用你這個東西,說明你的這個東西沒有觸到用戶的痛點。其實,你的同行也是你算法的用戶,如果他們不得不主動使用你的算法,這就說明真正觸及到了問題的本質(zhì),這條是非常重要的。我們以前在大公司做的一些算法,今天還有很多人用。我們今天在Face++做的算法(ShuffleNet),第二天就有公開的開源社區(qū),去實現(xiàn)這個算法,他們在不少大公司和創(chuàng)業(yè)公司都第一時間用了這個算法。這就說明你的算法特別好用,這樣的東西就是本質(zhì)性創(chuàng)新。”

      曠視研究院院長的帶兵之道:讀《孫子兵法》,鼓勵出論文,不在乎數(shù)量

      孫劍博士曾談到,在帶領(lǐng)團(tuán)隊拿到COCO競賽冠軍方面,做好了三件事:建團(tuán)隊、激勵團(tuán)隊、培養(yǎng)團(tuán)隊。在接受新智元專訪時,孫劍詳細(xì)分享了如何帶領(lǐng)好一個團(tuán)隊,吸引更多的人才。

      他說:“帶團(tuán)隊這件事情其實是多層次的。我最近看《孫子兵法》上講的,為將者首先要智勇雙全,要仁、要嚴(yán)、要信,還要做到明,誰做得對、誰做得不對要非常明。大致就是建立一個很好的文化,建立一些大的框架,哪些是我們應(yīng)該做的,哪些是不應(yīng)該做的。要圍繞著我們公司的價值觀,我們公司價值觀叫“追求、極致、簡單、可靠”,這幾個字對一個團(tuán)隊非常重要。“追求、極致”有兩個含義,一個是說我們要做到最好,另一個是說做這件事情的時候要付出最大的努力,把所有的潛力都發(fā)揮出來。”

      “從人才觀上的話,我們當(dāng)然是希望找最聰明的人,我們要求并不高,你只要數(shù)學(xué)還不錯就可以。你如果線性代數(shù)還可以,編程還可以的話就可以做這件事情。我們的環(huán)境非常扁平化,所有的數(shù)據(jù)代碼基本上都是共享的,所有的知識都是共通的,包括我們內(nèi)部的MegBrain。你如果想了解每個細(xì)節(jié),就可以找MegBrain的開發(fā)者,他會給你講細(xì)節(jié),到底MegBrain怎么設(shè)計的、怎么優(yōu)化,你會學(xué)到這些東西,可以有一個很自由的空間來做這件事情。還有一個很大的因素,讓大家覺得創(chuàng)新是安全的,是他愿意冒風(fēng)險去做的。我大多數(shù)時候都不會說不要做這個、不要做那個,而是說你試試看,這樣讓大家有一個安全的、愿意探索的環(huán)境,提高命中率。”

      在AI人才非常稀缺的今天,孫劍表示,在研究院,我們鼓勵出論文。這在國內(nèi)外的創(chuàng)業(yè)公司里面應(yīng)該是少數(shù)現(xiàn)象。“因為很多優(yōu)秀人才希望他們的工作一部分可以被看到。我們通過這樣的方式吸引人才”,他說。

      但是,曠視對論文數(shù)量沒有要求。“我們對任何的事情都沒有數(shù)量要求,哪怕你只有一篇論文,但只要滿足創(chuàng)新的兩條原則,第一它是通用的,第二別人愿意用,只要有一篇這樣的論文就可以。我以前自己做研究,每次會議投稿時會花很長時間只做兩篇論文,我自己主做一篇,另一篇讓學(xué)生做,或者跟別人一起做一篇。我們不追求數(shù)量,只要有一篇了不起的論文就可以。”

      以下是曠視科技Face++首席科學(xué)家孫劍博士在新智元AI World 2017世界人工智能大會上的演講:

      孫劍AI WORLD 2017世界人工智能大會演講:

      《視覺端計算:從ResNet到ShuffleNet 》

      孫劍:各位好,非常高興新智元提供了這樣一個機(jī)會把我們做計算機(jī)視覺研究的人聚在一起,也非常高興見到以前的老朋友,比如騰訊的賈佳亞博士,我們之前曾經(jīng)一起做計算機(jī)圖形學(xué)和計算機(jī)攝影學(xué)。剛才賈佳亞展示了一張圖:那是2004年我們倆合作的第一篇siggraph論文。當(dāng)時非常難,不亞于今天去 COCO 或者 ImageNet拿一個冠軍。今天到場的嘉賓中,華先勝博士也是我在微軟的同事。計算機(jī)視覺在深度學(xué)習(xí)的推動下,發(fā)生了天翻地覆的變化,今天也在此分享一些我最近的工作。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。