OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲外觀設(shè)計:看過實車的人都喜歡這個設(shè)計林杰:未來 A 級、A0 級、A00 級車型都將是領(lǐng)克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領(lǐng)觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o3 - 通往AGI的路上,已經(jīng)沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術(shù)報告出爐2024年結(jié)束,哪里是原創(chuàng)動畫的應(yīng)許之地?深扒一個正被游戲行業(yè)「搶占」的流量帝國
  • 首頁 > 云計算頻道 > 大模型

    殘差神經(jīng)網(wǎng)絡(luò)作者張祥雨,投身AI大模型

    2024年08月05日 16:18:12   來源:微信公眾號:量子位

      大模型的人才黑洞效應(yīng),還在持續(xù)。最新出現(xiàn)在大模型大牛轉(zhuǎn)會名單上的重磅大牛,是 90 后 AI 大牛張祥雨,ResNet (殘差神經(jīng)網(wǎng)絡(luò))四位作者之一,孫劍首位深度學(xué)習博士生,未來科學(xué)大獎得主,F(xiàn)在,他出現(xiàn)在了國產(chǎn)大模型獨角獸階躍星辰的引援傳聞中。

      而且六小強之一的階躍星辰,據(jù)說最近還不止這一位 AI 大牛。不過截至發(fā)稿,階躍星辰暫未作出明確回應(yīng)。

      張祥雨,ResNet 四位作者之一

      2008 年,張祥雨考入西安交通大學(xué);一年后申請轉(zhuǎn)專業(yè)進入軟件工程專業(yè)學(xué)習。

      2011 年,張祥雨獲美國大學(xué)生數(shù)學(xué)建模競賽(MCM)特等獎提名獎(Finalist),創(chuàng)下當時西安交通大學(xué)參加該競賽以來歷史最好成績。

      2012 年,張祥雨獲西安交通大學(xué)軟件學(xué)院軟件工程專業(yè)學(xué)士學(xué)位。

      之后張祥雨又入選了西安交通大學(xué)與微軟亞洲研究院博士生聯(lián)合培養(yǎng)項目,師從孫劍和何愷明。2017 年,獲得博士學(xué)位。

      正是在微軟亞洲研究院期間,何愷明、孫劍、任少卿和張祥雨四人共同完成了著名的 ResNet,張祥雨負責底層框架和編碼。

      ResNet 即殘差學(xué)習,本身雖為計算機視覺領(lǐng)域研究,但其核心思想殘差連接已經(jīng)跨界成為現(xiàn)代深度學(xué)習模型的基本組件。

      開啟上一次 AI 熱潮的 AlphaGo Zero 就是結(jié)合了 ResNet + 強化學(xué)習 + 蒙特卡洛搜索共同完成。

      而開啟最新 AI 熱潮的 ChatGPT,其中的“T”也就是 Transformer 網(wǎng)絡(luò)中同樣使用了殘差連接。

      ResNet 原始論文在 2016 就獲得了 CVPR 最佳論文獎。

      去年,何愷明、孫劍、任少卿和張祥雨四人又憑借這項研究獲得了 2023 未來科學(xué)大獎“數(shù)學(xué)與計算機科學(xué)獎”,由此可見其深遠影響。

      目前這篇論文 Google Scholar 的被引用次數(shù)已超 23 萬,是本世紀最火的深度學(xué)習論文之一:

      2016 年 7 月,孫劍加入曠視,任首席科學(xué)家和曠視研究院負責人。張祥雨在博士畢業(yè)后也緊隨導(dǎo)師進入了曠視。

      張祥雨研究方向包括高性能卷積網(wǎng)絡(luò)設(shè)計、AutoML 與自動化神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索、深度模型的裁剪與加速。

      2017、18 年,張祥雨完成了另一代表作 —— 移動端高效卷積神經(jīng)網(wǎng)絡(luò) ShuffleNet 兩部曲。

      現(xiàn)月之暗面聯(lián)合創(chuàng)始人、算法團隊負責人周昕宇,也是共同一作。

      ShuffleNet 后來影響了包括蘋果 3D 人臉解鎖在內(nèi)的各種手機毫秒級人臉解鎖技術(shù)。

      2020 年,張祥雨入選“AI 2000 計算機視覺全球最具影響力學(xué)者”榜單第 4 位。

      除此之外,張祥雨還有諸多研究,Google Scholar 數(shù)據(jù)顯示,目前其論文引用量達到 320510 次,h-index 為 59。

      還有 2 位萬引大牛加盟

      2024 年,AI 牛人的流動沒有減少,但他們的選擇不全是下場創(chuàng)業(yè)。

      行業(yè)中人往往對 AI 技術(shù)有很強烈的親身感受。他們中還有許多像張祥雨這樣,選擇前往既有公司,到新潮流一線激情沖浪的人。

      而階躍星辰,就在悄然之間招攬了不少這種選擇的牛人。

      量子位獲悉,除了張祥雨,騰訊俞剛和 MSRA 段楠,也已經(jīng)加入階躍星辰的隊伍。

      俞剛,現(xiàn)任階躍星辰首席科學(xué)家。

      在此之前,他在騰訊擔任研究總監(jiān);再之前,他是曠視 Detection 組長。

      俞剛 2007 年本科畢業(yè)于山東大學(xué),2010 年在上海交通大學(xué)獲得計算機碩士學(xué)位。

      之后前往南洋理工大學(xué)攻讀博士學(xué)位,師從袁浚菘;期間曾在微軟研究院實習,2014 年畢業(yè)后加入曠視工作。

      主要負責檢測、分割、跟蹤、骨架、動作行為等方面的研究以及算法落地工作。

      2017 年,俞剛帶隊參加 2017 COCO+Places 挑戰(zhàn)賽,獲得檢測第一名,人體姿態(tài)估計第一名;2018 年再次帶隊參加 COCO+Mapillary 挑戰(zhàn)賽,獲四項第一。

      曠視五年期間,俞剛和曠視首席科學(xué)家、曠視研究院院長孫劍合著過十篇 paper。

      2019 年年底,俞剛在知乎確認離職消息,宣布加入騰訊 PCG 光影研究室,繼續(xù)從事 CV 相關(guān)算法及技術(shù)研究。

      今年,俞剛有 2 篇論文被 ECCV2024 接收、2 篇論文被 CVPR 接收;同時,他也擔任了 CVPR 的區(qū)域主席。

      目前,俞剛的谷歌學(xué)術(shù)被引量為 1.9 萬。

      再來說 MSRA 段楠 —— 其實今年 5 月,量子位就跟大家分享過他加入階躍星辰的訊息。

      離職前,段楠是 MSRA 資深首席研究員,自然語言計算團隊研究經(jīng)理。

      主要從事自然語言處理、多模態(tài)智能、代碼智能、機器推理等研究,多次擔任 NLP / AI 學(xué)術(shù)會議程序主席和領(lǐng)域主席。

      同時是中國科學(xué)技術(shù)大學(xué)、西安交通大學(xué)兼職博導(dǎo),天津大學(xué)兼職教授。

      段楠從天津大學(xué)博士畢業(yè)后就加入 MSRA,當今 NLP 領(lǐng)域成就最高的華人之一、MSRA 前副院長周明是他的導(dǎo)師。

      他在 MSRA 工作了 17 年零 9 個月。

      工作期間,段楠的多項研究成果成功應(yīng)用到微軟 AI 產(chǎn)品中,包括必應(yīng)搜索、必應(yīng)廣告、微軟新聞、Cortana 語音助手和微軟小冰等。

      他的研究工作還有微軟 NüWA(女媧),由 MSRA 和北大聯(lián)合打造的多模態(tài)預(yù)訓(xùn)練模型,面世則直取 8 項 SOTA。

      據(jù)了解,段楠擔責的職務(wù)是 NüWA 系列模型家族項目擔任研究組長和導(dǎo)師。

      目前,段楠的 Google Scholar 被引量,也逼近 1.9 萬。

      另有統(tǒng)計結(jié)果顯示,段楠與微軟前全球副總裁、階躍星辰創(chuàng)始人 CEO 姜大昕,合著過 44 篇論文。

      大模型創(chuàng)業(yè),AI 人才新黑洞

      幾個月時間,把張祥雨、俞剛、段楠收入囊中,還有更多的 AI 人才加入消息秘而不宣。

      階躍星辰必然是有兩把刷子在身上的。

      究其原因,首先是其頗受認可的江湖地位。

      階躍星辰已經(jīng)是公認的國產(chǎn)大模型創(chuàng)企“六小強”之一:

      和月之暗面、Minimax、智譜華章、零一萬物、百川智能一起,深耕基礎(chǔ)模型領(lǐng)域,并因人才、技術(shù)、產(chǎn)品、市場認可度綜合評價,估值快速躍遷至 10 億美金以上。

      6 月時,階躍星辰在投融資市場中的身價,曝已是 20 億美元。

      再就是出場就很吸引人的人才堡壘。

      創(chuàng)始人兼 CEO 姜大昕,微軟前全球副總裁。

      不談其他,單純看他在微軟的最后 title,就很能理解為什么許多與 MSRA 有千絲萬縷聯(lián)系的 AI 牛人門,前赴后繼奔向階躍星辰懷抱中(一個狗頭)。

      2011 年,姜大昕開始在微軟亞洲互聯(lián)網(wǎng)工程院(STCA)工作,去年 3 月升任為微軟副總裁,同時兼任亞洲軟件技術(shù)中心 WebXT S+D(網(wǎng)絡(luò)體驗、搜索和分銷)集團總經(jīng)理。

      然后在事業(yè)新高峰時依然下場創(chuàng)業(yè),有了今日的階躍星辰。

      階躍星辰的數(shù)據(jù)負責人焦斌星,就是和姜大昕一起打包自己,從微軟投身 AI 新浪潮創(chuàng)業(yè)的一份子。

      這家公司的系統(tǒng)負責人朱亦博,也曾有過 MSRA 的工作經(jīng)歷。

      更重要的是,他是國內(nèi)屈指可數(shù)的、擁有多次單集群萬卡以上的系統(tǒng)建設(shè)與管理實踐經(jīng)驗的從業(yè)者。

      以及離不開的壘雪球神器 —— 階躍自研模型和產(chǎn)品。

      其模型側(cè)的 Step 系列通用大模型,以及躍問 & 冒泡鴨兩款 toC 產(chǎn)品,陸陸續(xù)續(xù)投入市場,進行檢驗,正在獲得更大的認可。

      以上或許能解釋,為什么階躍星辰成為了我們看到的“AI 人才黑洞”。

      而階躍星辰對人才的吸引力,正是大模型六小強瘋狂“斂(人)才”的原因的縮影。

      人才的流動,還會繼續(xù)。

      本文來自微信公眾號:量子位(ID:QbitAI),作者:衡宇西風

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。