中國品牌,讓東南亞感受“消費升級”小紅書本地“坐抖望團”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    OpenAI 和谷歌最怕的,是一張「開源笑臉」

    2023年05月16日 16:45:01   來源:微信公眾號:極客公園

      「我們沒有護城河,OpenAI 也沒有!

      在最近泄露的一份文件中,一位谷歌內(nèi)部的研究人員表達了這樣的觀點。這位研究人員認為,在這場激烈的 AI 競賽中,雖然谷歌與 OpenAI 在你追我趕,但真正的贏家未必會在這兩家中產(chǎn)生,因為有股第三方力量正在崛起。

      這個力量就是「開源社區(qū)」,它才是谷歌和 OpenAI *的敵人。

      而開源社區(qū)的頂流,當屬 Hugging Face 了。作為一個 AI 領(lǐng)域的 Github,它提供了大量高質(zhì)量的開源模型與工具,將研發(fā)成果*程度地惠及社區(qū),極大地降低了 AI 的技術(shù)門檻,推進了 AI 的「民主化」進程。

      它的創(chuàng)始人之一,Clément 還曾公開表示:「在 NLP 或者機器學習領(lǐng)域,最壞的情況,就是要與整個科學界和開源界競爭。因此,我們不再試圖競爭,轉(zhuǎn)而選擇為開源界和科學界賦能!

      Hugging Face 創(chuàng)立于 2016 年,幾年間連獲 5 輪融資,目前估值已經(jīng)飆到 20 億美元,Github 上的星標數(shù)量已經(jīng)超過了 9.8w,穩(wěn)居熱門資源庫之列。

      那么這家公司是做什么的?是如何逆襲成為開源界的「頂流」的? 它的發(fā)展模式又是怎樣的呢?

      1、NLP 開啟逆襲之路

      Hugging Face 是一家以自然語言處理 (NLP) 技術(shù)為核心的 AI 初創(chuàng)公司。

      它是由法國連續(xù)創(chuàng)業(yè)者 Clément Delangue(曾創(chuàng)辦筆記平臺 VideoNot.es,媒體監(jiān)測平臺 mention 以及被 Google 收購的移動開發(fā)平臺 Moodstocks 等項目)和 Thomas Wolf、Julien Chaumond 一起創(chuàng)辦的,于 2016 年成立,總部設(shè)在美國紐約。

      其中的兩位創(chuàng)始人 Clément Delangue 和 Thomas Wolf 都是自然語言處理領(lǐng)域的專家。在不斷推進 Hugging Face 的發(fā)展的過程中,他們被視為當代 NLP 領(lǐng)域的先鋒。

      他們創(chuàng)辦 Hugging Face 的初衷,是為年輕人帶來一個「娛樂型」的「開放領(lǐng)域聊天機器人」,就像科幻電影《Her》里面的 AI 那樣,可以跟人聊天氣、朋友、愛情和體育比賽等各種話題。大家可以在無聊的時候跟它聊八卦、問它問題、讓它生成一些有趣的圖片之類的事情。

      也正因如此,Hugging Face 的名字來源于一個張開雙手的可愛笑臉 emoji。

      2017 年 3 月 9 號,Hugging Face App 在 iOS App Store 正式推出,就得到了不少關(guān)注,還拿到了包括 SV Angel、NBA 球星杜蘭特等投資人在內(nèi)的 120 萬美元的天使投資。

      為了訓練這個聊天機器人的自然語言處理(NLP)能力,Hugging Face 構(gòu)建了一個資源庫來容納各種機器學習模型和各種類型的數(shù)據(jù)庫,包括幫助訓練聊天機器人檢測文本消息情緒、生成連貫的響應(yīng)、理解不同對話主題等。

      同時,Hugging Face 團隊在 GitHub 上將此庫的免費部分開源,目的是從用戶共創(chuàng)中獲得開發(fā)靈感。

      到了 2018 年,Hugging Face 仍然不溫不火,便開始免費在線分享應(yīng)用程序的底層代碼。這一舉動立即收到了谷歌、微軟等業(yè)內(nèi)知名科技公司的研究人員的積極響應(yīng),他們開始將這些代碼用于 AI 應(yīng)用程序,這個笑臉 emoji 也開始被廣大 AI 開發(fā)者們所熟知。

      恰巧同年,谷歌推出基于雙向 Transformer 的大規(guī)模預訓練語言模型 BERT,開啟了 AI 模型的「內(nèi)卷時代」。

      在這樣的大環(huán)境下,Hugging Face 做起了提供 AI 模型的服務(wù),隨之迎來了自己的「黃金時代」。

      它先是開源了 PyTorch-BERT;隨即,又整合了它先前貢獻的 NLP 領(lǐng)域的預訓練模型,發(fā)布了 Transformers 庫。

      Transformers 庫提供了數(shù)以千計的預訓練模型,支持 100 多種語言的文本分類、信息抽取、問答、摘要、翻譯、文本生成。借助 Transformers 庫,開發(fā)者可以便捷地使用 BERT、GPT、XLNet、T5 、DistilBERT 等 NLP 大模型,來完成文本分類、文本總結(jié)、文本生成、信息抽取、自動 QA 等 AI 任務(wù),節(jié)省大量的時間和計算資源。

      簡而言之,Transformers 庫提供直接可用的模型,無需企業(yè)再度開發(fā);因此,眾多企業(yè)開始借助 Transformers 庫,將模型應(yīng)用到產(chǎn)品開發(fā)和工作流程中。

      Transformers 庫也因此迅速地流行起來,成為了 GitHub 史上增長最快的 AI 項目。

      圖片來自于 Lux Capital

      Hugging Face 的創(chuàng)始人之一 Clément Delangue 也不禁感慨,「我們發(fā)布東西時沒有考慮太多,而社區(qū)的爆炸式增長甚至讓我們感到驚訝!

      面對如此多的開發(fā)者,Hugging Face 順理成章地建立了自己的社區(qū),Hugging Face Hub;同時,調(diào)整產(chǎn)品戰(zhàn)略,不再局限于自然語言處理,而是將機器學習的不同領(lǐng)域進行融合,探索創(chuàng)建新的用例,著手構(gòu)建一套完整的開源產(chǎn)品矩陣。

      截至 2023 年 4 月,Hugging Face 共享了 16,6894 個訓練模型,2,6900 個數(shù)據(jù)集,涵蓋 NLP、語音、生物學、時間序列、計算機視覺、強化學習等領(lǐng)域,搭建了完整的 AI 開發(fā)生態(tài)。

      這大大降低了相關(guān)研究與應(yīng)用的門檻,讓 Hugging Face 成為 AI 社區(qū)*影響力的技術(shù)供應(yīng)商。

      目前,這些模型已經(jīng)服務(wù)了數(shù)萬家企業(yè)進行資源開發(fā),幫助科研人員和相關(guān)從業(yè)人員更好地構(gòu)建模型、更好地參與到產(chǎn)品和工作流程中,其中不乏 Meta、亞馬遜、微軟、谷歌等知名 AI 團隊。

      在資本市場,Hugging Face 也同樣備受青睞。

      在 2022 年 5 月,團隊完成了由 Lux Capital 領(lǐng)投、紅杉資本參投的 1 億美元 C 輪融資,估值狂飆到 20 億美元。

      面對資本的追捧,Hugging Face 的創(chuàng)始人表現(xiàn)的極其冷靜,表示拒絕了多個「有意義的收購邀約」,并且不會像 GitHub 那樣出售自己的業(yè)務(wù)。關(guān)于 Hugging Face 的未來,它的創(chuàng)始人還有一些有趣的想法:「我們希望成為*家以表情符號上市的公司,而不是三個字母的股票代碼。

      2、AI 大模型的 Github

      憑借開源獲得了萬眾矚目的 Hugging Face,也格外注重社區(qū)的建設(shè),而剛剛誕生不久的 Hugging Face Hub,現(xiàn)在儼然已經(jīng)成為 AI 開發(fā)者的大本營。

      Hugging Face Hub 是一個探索、實驗、合作,并建立機器學習技術(shù)的中心場所。在這里任何人都可以分享和探索模型、數(shù)據(jù)集等,大家輕松合作,共同構(gòu)建機器學習模型,Hugging Face Hub 也因此被稱做「機器學習之家」。

      它是 Hugging Face 堅持「開源」的產(chǎn)物,也是它的核心。正如官網(wǎng)的宣傳語所述:AI 社區(qū),建設(shè)未來。

      Hugging Face 的創(chuàng)始人曾公開表示「Hugging Face 的目標是通過工具和開發(fā)者社區(qū),讓更多的人使用自然語言處理工具,達成他們的創(chuàng)新目標,讓自然語言處理技術(shù)更容易使用和訪問!

      他還補充說,「沒有任何一家公司,包括科技巨頭,能夠獨自『解決 AI 問題』,而我們實現(xiàn)這一目標的*途徑,是通過以社區(qū)為中心的方式,分享知識和資源!

      因此,公司致力于在 Hugging Face Hub 上建立*的模型、數(shù)據(jù)集、演示和指標的開源集合,以使每個人都能利用機器學習進行探索、實驗、合作和構(gòu)建技術(shù),從而實現(xiàn) AI「民主化」的目標。

      目前,Hugging Face Hub 提供超過 12 萬個模型(Models)、2 萬個數(shù)據(jù)集(Datasets) 和 5 萬個演示應(yīng)用程序(Spaces),而且所有這些都是開源、公開、免費的。

      Hugging Face Hub 對所有機器學習模型開放,并得到 Transformers 、 Flair、Asteroid、ESPnet、Pyannote 等自然語言處理庫的支持,其中,最核心的自然語言處理庫是 Transformers 庫。

      Transformers 庫支持 PyTorch、TensorFlow 和 JAX 之間的框架互操作性,這確保了在模型生命周期的每個階段使用不同框架的靈活性。而且,通過 Inference API(推理 API),用戶可以直接使用 Hugging Face 開發(fā)的模型與數(shù)據(jù)集,進行推理、遷移學習,這讓Transformers 框架在性能與易用性上達到業(yè)界*水平,徹底改變了深度學習在 NLP 領(lǐng)域的發(fā)展模式。

      此外,該平臺還提供了一些實用工具,如模型版本控制、測試集成、共享和協(xié)作等,可以幫助開發(fā)人員更好地管理和共享模型和數(shù)據(jù)集。

      因此,在 Hugging Face Hub,任何開發(fā)者或者工程團隊都可以通過接口,使用數(shù)千個模型的推理 API,輕松下載和訓練*進的預訓練模型,完成不同模式的常見任務(wù),例如自然語言處理、計算機視覺、音頻、多模態(tài)等,在幾分鐘內(nèi)構(gòu)建自己的機器學習驅(qū)動的應(yīng)用程序,省去了從頭開始訓練模型,所需的大量時間和資源。

      在此基礎(chǔ)上,他們還可以在自己的賬號下創(chuàng)建自己的倉庫,用于存儲和分享已經(jīng)訓練好的模型、數(shù)據(jù)集和腳本,同時與強大的社區(qū)分享交流,輕松協(xié)作完成 ML 工作流程。

      簡而言之,Hugging Face Hub 為研究者提供了一個平臺,去展示那些他們想要分享的模型,測試他人的模型,以此來深入研究這些模型的內(nèi)部架構(gòu),共同促進 ML 的發(fā)展。而此前,AI 對前端開發(fā)者來說似乎遙不可及,畢竟到目前為止,只有少數(shù)代碼生成的 AI 系統(tǒng)向公眾免費開放。

      也正因如此,Hugging Face 決定在社區(qū)提供開源模型和 API 來改變這種狀況,主動承擔起 AI 科研走向應(yīng)用的這個過程中復雜、細碎的工作,使得任何 AI 從業(yè)者都可以便捷地使用這些研究模型和資源。用 Hugging Face 自己的話來講,他們所做的事情,就是要架起 AI 科研和應(yīng)用之間的橋梁。

      除了提供便利,Hugging Face 還積極采取措施強化 Hub 的安全性,確保用戶的代碼、模型和數(shù)據(jù)是安全的,讓用戶放心使用。

      例如,在模型庫配備模型卡,以告知用戶每個模型的限制和偏見,從而促進這些模型被負責任地使用和開發(fā);在數(shù)據(jù)集設(shè)置訪問控制功能,允許組織和個人可以出于許可和隱私考慮,創(chuàng)建私人數(shù)據(jù)集,并且可以自行處理其他用戶的訪問請求。

      還值得一提的是,為了進一步使自然語言處理技術(shù)「民主化」,Hugging face Hub 上還開設(shè)了 NLP 課程——Hugging Face course。

      該課程將使用 Hugging Face 生態(tài)系統(tǒng)中的數(shù)據(jù)庫(Hugging Face Transformers、Hugging Face Datasets、Hugging Face Tokenizers 和 Hugging Face Accelerate),講解自然語言處理 (NLP) 的有關(guān)知識。它是完全免費的,甚至沒有廣告。

      簡而言之,Hugging Face Hub 就像是機器學習領(lǐng)域的 GitHub。一個由社區(qū)開發(fā)者驅(qū)動的平臺,提供大量資源,讓開發(fā)人員可以在機器學習(ML)模型、數(shù)據(jù)集和 ML 應(yīng)用程序上,不斷探索、創(chuàng)新和互相協(xié)作,通過分享知識和資源以加速和推進 AI 發(fā)展。

      3、「開源」帶動「商業(yè)」

      那么問題來了,一家提供「平臺社區(qū)」的「開源」公司,又是如何盈利的呢?

      首先,「開源」就是一個正確的決定。

      Hugging Face 憑借開源項目 Transformers,積累了巨大的影響力,聚集了廣大開發(fā)者構(gòu)建了龐大的社區(qū) Hugging Face Hub,也贏得了客戶與投資者的信任,這使得它的商業(yè)化轉(zhuǎn)型水到渠成。

      對此,紅杉資本合伙人 Pat Grady 也表示,「他們優(yōu)先考慮的是應(yīng)用,而不是變現(xiàn),我認為這是正確的做法。他們看到了 Transformer 模型在 NLP 之外的應(yīng)用方式,看到了成為 GitHub 的機會,這不僅是面向 NLP,而且會延伸到機器學習的每個領(lǐng)域。」

      而且,縱觀過去十年,市場上初創(chuàng)公司的創(chuàng)業(yè)歷程,會發(fā)現(xiàn)開源模式的商業(yè)可行性得到過有力的印證。像 MongoDB、Elastic、Confluent 等,都是收入增長最快的開源公司,它們都實現(xiàn)了盈收,并且還在市場中存活了下來。

      Hugging Face 的創(chuàng)始人之一,Clément 也因此堅信,「初創(chuàng)公司可以通過某種方式為開放的社區(qū)賦能,此種方法產(chǎn)生的價值,比通過搭建一個專有工具,產(chǎn)生的價值高出上千倍!

      甚至公開表示,「考慮到開源機器學習的價值和它的主流地位,其使用量就是遞延收入。機器學習會成為技術(shù)開發(fā)的默認方式,而且 Hugging Face 會成為這方面的頭號平臺,并創(chuàng)造出數(shù)十億美元的收入。

      因此,Hugging Face 選擇了「開源帶動商業(yè)」,這一商業(yè)化發(fā)展路徑,并在 2021 年開始提供付費功能。

      目前,Hugging Face 的盈利業(yè)務(wù)主要有三類:

      付費制會員:提供更加優(yōu)質(zhì)的服務(wù)和社區(qū)體驗,來獲得收益;

      數(shù)據(jù)托管:根據(jù)不同參數(shù)需求,提供不同的按小時收費托管服務(wù);

      AI 解決方案服務(wù):目前的主打產(chǎn)品,圍繞 NLP、Vision 等方向為客戶提供定制化解決方案,以獲得技術(shù)服務(wù)費用。

      值得一提的是,從 2020 年開始,Hugging Face 就開始做面向企業(yè)的定制自然語言模型,并推出了包括 AutoTrain、Inference API & Infinity、Private Hub、Expert Support 等,針對不同開發(fā)者類型的個性化產(chǎn)品。

      目前,1000 多家公司已經(jīng)成為了 Hugging Face 的付費客戶,主要是大型企業(yè),包括英特爾、高通、輝瑞、彭博社和 eBay。

      2021 年,Hugging Face 已經(jīng)實現(xiàn)收入 1 千萬美元,從數(shù)據(jù)上來看,Hugging Face 這套的「開源帶動商業(yè)」的策略是成功的。

      這也印證了 Hugging Face 的 CEO,Clément 所說的,「公司不需要從創(chuàng)造的價值中獲取 100% 的紅利,只需將其中 1% 的價值變現(xiàn),但即便只是 1%,也足夠讓你成為一家高市值的公司。

      簡而言之,Hugging Face 憑借開源社區(qū)積累影響力,而后逐步向 SaaS 產(chǎn)品和企業(yè)服務(wù)拓展。這種漸進式的轉(zhuǎn)型,讓 Hugging Face 在開源和商業(yè)化之間,取得了良好的平衡,也是其能取得成功的重要原因。這種發(fā)展策略也讓 Hugging Face 成為了 AI 界獨樹一幟的存在,并為其他 AI 初創(chuàng)公司樹立榜樣。

      但是,開源生態(tài)也有它自己的軟肋,因為商業(yè)化的發(fā)展很可能會傷害到自然生長的社區(qū)環(huán)境。對此,Hugging Face 的做法是加強對技術(shù)的管控,維護自己的開源生態(tài);同時,向科研領(lǐng)域深挖。

      「機器學習技術(shù)仍然還處于早期發(fā)展階段,開源社區(qū)的潛力是巨大的。在未來 5 到 10 年,我們一定還會看到更多開源機器學習公司的崛起。」

      Hugging Face 的 CEO Clément 說道。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。