• 首頁 > 云計算頻道 > 大模型

    殘差神經(jīng)網(wǎng)絡作者張祥雨,投身AI大模型

    2024年08月05日 16:18:12   來源:微信公眾號:量子位

      大模型的人才黑洞效應,還在持續(xù)。最新出現(xiàn)在大模型大牛轉(zhuǎn)會名單上的重磅大牛,是 90 后 AI 大牛張祥雨,ResNet (殘差神經(jīng)網(wǎng)絡)四位作者之一,孫劍首位深度學習博士生,未來科學大獎得主,F(xiàn)在,他出現(xiàn)在了國產(chǎn)大模型獨角獸階躍星辰的引援傳聞中。

      而且六小強之一的階躍星辰,據(jù)說最近還不止這一位 AI 大牛。不過截至發(fā)稿,階躍星辰暫未作出明確回應。

      張祥雨,ResNet 四位作者之一

      2008 年,張祥雨考入西安交通大學;一年后申請轉(zhuǎn)專業(yè)進入軟件工程專業(yè)學習。

      2011 年,張祥雨獲美國大學生數(shù)學建模競賽(MCM)特等獎提名獎(Finalist),創(chuàng)下當時西安交通大學參加該競賽以來歷史最好成績。

      2012 年,張祥雨獲西安交通大學軟件學院軟件工程專業(yè)學士學位。

      之后張祥雨又入選了西安交通大學與微軟亞洲研究院博士生聯(lián)合培養(yǎng)項目,師從孫劍和何愷明。2017 年,獲得博士學位。

      正是在微軟亞洲研究院期間,何愷明、孫劍、任少卿和張祥雨四人共同完成了著名的 ResNet,張祥雨負責底層框架和編碼。

      ResNet 即殘差學習,本身雖為計算機視覺領域研究,但其核心思想殘差連接已經(jīng)跨界成為現(xiàn)代深度學習模型的基本組件。

      開啟上一次 AI 熱潮的 AlphaGo Zero 就是結合了 ResNet + 強化學習 + 蒙特卡洛搜索共同完成。

      而開啟最新 AI 熱潮的 ChatGPT,其中的“T”也就是 Transformer 網(wǎng)絡中同樣使用了殘差連接。

      ResNet 原始論文在 2016 就獲得了 CVPR 最佳論文獎。

      去年,何愷明、孫劍、任少卿和張祥雨四人又憑借這項研究獲得了 2023 未來科學大獎“數(shù)學與計算機科學獎”,由此可見其深遠影響。

      目前這篇論文 Google Scholar 的被引用次數(shù)已超 23 萬,是本世紀最火的深度學習論文之一:

      2016 年 7 月,孫劍加入曠視,任首席科學家和曠視研究院負責人。張祥雨在博士畢業(yè)后也緊隨導師進入了曠視。

      張祥雨研究方向包括高性能卷積網(wǎng)絡設計、AutoML 與自動化神經(jīng)網(wǎng)絡架構搜索、深度模型的裁剪與加速。

      2017、18 年,張祥雨完成了另一代表作 —— 移動端高效卷積神經(jīng)網(wǎng)絡 ShuffleNet 兩部曲。

      現(xiàn)月之暗面聯(lián)合創(chuàng)始人、算法團隊負責人周昕宇,也是共同一作。

      ShuffleNet 后來影響了包括蘋果 3D 人臉解鎖在內(nèi)的各種手機毫秒級人臉解鎖技術。

      2020 年,張祥雨入選“AI 2000 計算機視覺全球最具影響力學者”榜單第 4 位。

      除此之外,張祥雨還有諸多研究,Google Scholar 數(shù)據(jù)顯示,目前其論文引用量達到 320510 次,h-index 為 59。

      還有 2 位萬引大牛加盟

      2024 年,AI 牛人的流動沒有減少,但他們的選擇不全是下場創(chuàng)業(yè)。

      行業(yè)中人往往對 AI 技術有很強烈的親身感受。他們中還有許多像張祥雨這樣,選擇前往既有公司,到新潮流一線激情沖浪的人。

      而階躍星辰,就在悄然之間招攬了不少這種選擇的牛人。

      量子位獲悉,除了張祥雨,騰訊俞剛和 MSRA 段楠,也已經(jīng)加入階躍星辰的隊伍。

      俞剛,現(xiàn)任階躍星辰首席科學家。

      在此之前,他在騰訊擔任研究總監(jiān);再之前,他是曠視 Detection 組長。

      俞剛 2007 年本科畢業(yè)于山東大學,2010 年在上海交通大學獲得計算機碩士學位。

      之后前往南洋理工大學攻讀博士學位,師從袁浚菘;期間曾在微軟研究院實習,2014 年畢業(yè)后加入曠視工作。

      主要負責檢測、分割、跟蹤、骨架、動作行為等方面的研究以及算法落地工作。

      2017 年,俞剛帶隊參加 2017 COCO+Places 挑戰(zhàn)賽,獲得檢測第一名,人體姿態(tài)估計第一名;2018 年再次帶隊參加 COCO+Mapillary 挑戰(zhàn)賽,獲四項第一。

      曠視五年期間,俞剛和曠視首席科學家、曠視研究院院長孫劍合著過十篇 paper。

      2019 年年底,俞剛在知乎確認離職消息,宣布加入騰訊 PCG 光影研究室,繼續(xù)從事 CV 相關算法及技術研究。

      今年,俞剛有 2 篇論文被 ECCV2024 接收、2 篇論文被 CVPR 接收;同時,他也擔任了 CVPR 的區(qū)域主席。

      目前,俞剛的谷歌學術被引量為 1.9 萬。

      再來說 MSRA 段楠 —— 其實今年 5 月,量子位就跟大家分享過他加入階躍星辰的訊息。

      離職前,段楠是 MSRA 資深首席研究員,自然語言計算團隊研究經(jīng)理。

      主要從事自然語言處理、多模態(tài)智能、代碼智能、機器推理等研究,多次擔任 NLP / AI 學術會議程序主席和領域主席。

      同時是中國科學技術大學、西安交通大學兼職博導,天津大學兼職教授。

      段楠從天津大學博士畢業(yè)后就加入 MSRA,當今 NLP 領域成就最高的華人之一、MSRA 前副院長周明是他的導師。

      他在 MSRA 工作了 17 年零 9 個月。

      工作期間,段楠的多項研究成果成功應用到微軟 AI 產(chǎn)品中,包括必應搜索、必應廣告、微軟新聞、Cortana 語音助手和微軟小冰等。

      他的研究工作還有微軟 NüWA(女媧),由 MSRA 和北大聯(lián)合打造的多模態(tài)預訓練模型,面世則直取 8 項 SOTA。

      據(jù)了解,段楠擔責的職務是 NüWA 系列模型家族項目擔任研究組長和導師。

      目前,段楠的 Google Scholar 被引量,也逼近 1.9 萬。

      另有統(tǒng)計結果顯示,段楠與微軟前全球副總裁、階躍星辰創(chuàng)始人 CEO 姜大昕,合著過 44 篇論文。

      大模型創(chuàng)業(yè),AI 人才新黑洞

      幾個月時間,把張祥雨、俞剛、段楠收入囊中,還有更多的 AI 人才加入消息秘而不宣。

      階躍星辰必然是有兩把刷子在身上的。

      究其原因,首先是其頗受認可的江湖地位。

      階躍星辰已經(jīng)是公認的國產(chǎn)大模型創(chuàng)企“六小強”之一:

      和月之暗面、Minimax、智譜華章、零一萬物、百川智能一起,深耕基礎模型領域,并因人才、技術、產(chǎn)品、市場認可度綜合評價,估值快速躍遷至 10 億美金以上。

      6 月時,階躍星辰在投融資市場中的身價,曝已是 20 億美元。

      再就是出場就很吸引人的人才堡壘。

      創(chuàng)始人兼 CEO 姜大昕,微軟前全球副總裁。

      不談其他,單純看他在微軟的最后 title,就很能理解為什么許多與 MSRA 有千絲萬縷聯(lián)系的 AI 牛人門,前赴后繼奔向階躍星辰懷抱中(一個狗頭)。

      2011 年,姜大昕開始在微軟亞洲互聯(lián)網(wǎng)工程院(STCA)工作,去年 3 月升任為微軟副總裁,同時兼任亞洲軟件技術中心 WebXT S+D(網(wǎng)絡體驗、搜索和分銷)集團總經(jīng)理。

      然后在事業(yè)新高峰時依然下場創(chuàng)業(yè),有了今日的階躍星辰。

      階躍星辰的數(shù)據(jù)負責人焦斌星,就是和姜大昕一起打包自己,從微軟投身 AI 新浪潮創(chuàng)業(yè)的一份子。

      這家公司的系統(tǒng)負責人朱亦博,也曾有過 MSRA 的工作經(jīng)歷。

      更重要的是,他是國內(nèi)屈指可數(shù)的、擁有多次單集群萬卡以上的系統(tǒng)建設與管理實踐經(jīng)驗的從業(yè)者。

      以及離不開的壘雪球神器 —— 階躍自研模型和產(chǎn)品。

      其模型側(cè)的 Step 系列通用大模型,以及躍問 & 冒泡鴨兩款 toC 產(chǎn)品,陸陸續(xù)續(xù)投入市場,進行檢驗,正在獲得更大的認可。

      以上或許能解釋,為什么階躍星辰成為了我們看到的“AI 人才黑洞”。

      而階躍星辰對人才的吸引力,正是大模型六小強瘋狂“斂(人)才”的原因的縮影。

      人才的流動,還會繼續(xù)。

      本文來自微信公眾號:量子位(ID:QbitAI),作者:衡宇西風

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。