正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開店”類目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報(bào)到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級(jí),核心場景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)App兼容測試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個(gè)月內(nèi)開放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實(shí)現(xiàn)營收5970億元,同比增長13.53%傳三星計(jì)劃2025年推出卷軸屏手機(jī)蘋果新專利探索折疊iPhone未來,任意表面實(shí)現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機(jī)今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實(shí)力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 全球3.5億下載量破紀(jì)錄! Llama家族暴漲10倍,開源帝國掀AI革命

    2024年08月30日 15:50:03   來源:新智元公眾號(hào)

      誕生一年半,Llama家族早已穩(wěn)坐開源界頭把交椅。最新報(bào)告稱,Llama全球下載量近3.5億,是去年同期的10倍。而模型開源讓每個(gè)人最深體會(huì)是,token價(jià)格一降再降。

      Llama一舉成為世界開源的領(lǐng)頭羊。

      截至目前,Llama模型在開源平臺(tái)HuggingFace下載量近3.5億。

      Groq的創(chuàng)始人表示,這也太瘋狂了,想想Linux花了多長時(shí)間才達(dá)到這個(gè)數(shù)字?

      官博介紹,這一數(shù)字,是去年同期的10倍。而且,僅在上個(gè)月,模型的下載量超2000萬次。

      2023年2月,Llama1首次亮相,經(jīng)過多次迭代,到現(xiàn)在已經(jīng)過去了整整18個(gè)月。

      而在這僅有的一年半里,Llama已經(jīng)從一個(gè)最先進(jìn)的單體基礎(chǔ)模型,發(fā)展成為,一個(gè)面向開發(fā)者的強(qiáng)大生態(tài)系統(tǒng)。

      LeCun還不忘給自家模型宣傳一波,越來越多的大公司、小公司、初創(chuàng)公司、政府和非營利組織,正基于此開發(fā)新的產(chǎn)品和服務(wù)。

      還有高校機(jī)構(gòu)、研究人員和工程師每天都在改進(jìn)Llama,并提出新的用例。

      另外,值得關(guān)注的一點(diǎn)是,自今年5月Llama3.1發(fā)布之后,云服務(wù)商對模型API token調(diào)用需求,翻了一番還要多。

      一些Meta最大的云服務(wù)提供商,從2024年1月到7月,Llama的每月token量增長了10倍。

      從微軟云、英偉達(dá)、谷歌云等科技巨頭,到Groq、Databricks等初創(chuàng)公司,全都支持Llama模型的使用。

      老黃稱,「Llama深深地影響著最先進(jìn)AI的進(jìn)步」。

      可見,Llama正引領(lǐng)著開源之光。

      Llama開源,拉低token價(jià)格戰(zhàn)

      GPT-4級(jí)別模型開源,最先帶來的好處是,token的價(jià)格不斷下降。

      AI大牛吳恩達(dá)在DeepLearning的博客中,算了一筆賬:

      近期,OpenAI官宣降價(jià)后,GPT-4o的token成本,現(xiàn)在是每百萬token4美元。(假設(shè)是80%輸入和20%輸入token混合率)

      還記得,2023年3月首發(fā)GPT-4時(shí),每百萬token的成本是36美元。

      博客地址:https://www.deeplearning.ai/the-batch/issue-264/

      17個(gè)月的時(shí)間,價(jià)格相當(dāng)于每年下降了79%(4/36= (1- p)^{17/12})。

      如你所見,token價(jià)格正迅速下降!

      而推動(dòng)token價(jià)格不斷下降的一個(gè)因素,便是開源模型(如Llama3.1)的發(fā)布。

      這是因?yàn),API提供商(如Anyscale、Fireworks、Together AI初創(chuàng)公司,以及一些大型云服務(wù)商)并不需要擔(dān)心賺回開發(fā)模型所需的成本,因此他們可以直接在價(jià)格、速度等其他因素上,開啟競爭。

      此外,一些芯片公司Groq(快速生成token領(lǐng)先者)、Samba Nova(能以114token/s速度運(yùn)行Llama3.1405B)、Cerebras(以1800token/s速率運(yùn)行Llama3.18B),以及英偉達(dá)、AMD、英特爾、高通等半導(dǎo)體巨頭,在硬件上的創(chuàng)新,近一步拉低了模型價(jià)格。

      Groq發(fā)文介紹了,如今支持Llama模型的生態(tài)。

      「到目前為止,Groq已經(jīng)使用Llama模型套件和自家LPU Inference,每天向40多萬開發(fā)人員提供50億個(gè)免費(fèi)token」。

      在構(gòu)建用程序時(shí),吳恩達(dá)發(fā)現(xiàn),根據(jù)未來技術(shù)發(fā)展方向,進(jìn)行設(shè)計(jì)是非常有用的,而非局限于當(dāng)前水平。

      基于多家軟硬件公司的技術(shù)路線(改進(jìn)半導(dǎo)體、更小的模型、推理架構(gòu)中的算法創(chuàng)新),可以預(yù)見的是,token價(jià)格還將持續(xù)下降。

      這意味著,即便你構(gòu)建的智能體工作流看起來成本太高,而隨著token價(jià)格不斷下降,或許在某個(gè)時(shí)間,這套方案在未來也變得經(jīng)濟(jì)可行。

      假設(shè)你創(chuàng)建了一個(gè)APP幫助人類,可每秒連續(xù)輸出100個(gè)token。那如果百萬token4美元,每小時(shí)只花費(fèi)1.44美元。

      這遠(yuǎn)遠(yuǎn)低于美國,以及許多其他國家最低工資標(biāo)準(zhǔn)。

      Meta挑戰(zhàn)ChatGPT贏得數(shù)百萬用戶

      小扎希望,到今年年底,讓Meta AI成為全球使用量最多的AI助手,超越OpenAI的ChatGPT。

      目前,這一切正朝著他的目標(biāo),取得了進(jìn)展。

      據(jù)內(nèi)部2位員工透露,8月初,Meta AI(2023年9月發(fā)布)在發(fā)布不到一年時(shí)間里,收攬了至少4億月活躍用戶和4000萬日活躍用戶。

      這些數(shù)字從側(cè)面反映了,超30億用戶的Meta,每天至少使用Meta旗下的一款應(yīng)用中的AI助手。

      此外還包括,通過Meta AI專屬網(wǎng)站,以及Ray-Ban智能眼鏡,也收獲了不少用戶。

      龐大的用戶群,成為大型科技公司優(yōu)勢,希望從ChatGPT中奪取一部分市場份額和關(guān)注度。

      其實(shí),谷歌也向數(shù)十億用戶推廣了對話式AI——Gemini,但力度卻不如Meta。

      但一些使用Meta應(yīng)用程序的人,在Facebook、Reddit、X上,抱怨Meta過于激進(jìn)地推廣AI助手,比如在其APP的鍵盤上添加搜索按鈕。

      有的人還出了一個(gè)關(guān)閉Meta AI對話的教程。

      出于對用戶參與度的擔(dān)憂,Meta員工可能會(huì)不定期討論的一個(gè)問題是,是否有些用戶無意間使用了Meta AI。

      8月初使用數(shù)據(jù)顯示,大約10%的月活躍用戶,每天使用助手來回答問題、生成圖像和執(zhí)行其他任務(wù)。

      而這一比例遠(yuǎn)低于Meta的其他應(yīng)用程序。

      Meta此前2月報(bào)告稱,80%的月活躍用戶每天至少使用一款自家的應(yīng)用。

      這些數(shù)字表明,Meta AI已經(jīng)是ChatGPT強(qiáng)有力的競爭者之一。

      2022年11月,ChatGPT首次推出。截至目前,每周有超2億人使用。鑒于最近的使用數(shù)據(jù),Meta AI可能相距不遠(yuǎn)。

      與Meta AI不同,ChatGPT也是一項(xiàng)盈利的業(yè)務(wù)模型。

      數(shù)百萬用戶每月需要支付20美元,成為ChatGPT Plus用戶,才能用上最先進(jìn)模型撰寫、編程、答問的能力。

      數(shù)據(jù)顯示,ChatGPT訂閱收入,每年大約高達(dá)20億美元。

      Meta已在今年投入高達(dá)400億美金數(shù)據(jù)中心和其他基礎(chǔ)設(shè)施。

      而Meta AI被視為,未來公司獲得這些巨額投資回報(bào)的關(guān)鍵部分,主要用于開發(fā)這一產(chǎn)品的背后大模型Llama。

      雖有報(bào)道曝出,Meta正推出一個(gè)付費(fèi)版的高級(jí)人工智能助手。

      去年9月,Meta剛剛推出AI助手時(shí),人們最初只能通過Instagram、WhatsApp或Messenger上的直接消息與Meta AI聊天。

      今年,Meta開始在各種應(yīng)用中, 讓其變得更加顯眼、容易訪問。

      4月,他們將Meta AI添加到其應(yīng)用程序的搜索欄和信息流中,并為其推出了獨(dú)立網(wǎng)站meta.ai。

      同月,Meta還推出了一個(gè)新版本的AI助手,該版本能夠識(shí)別和解析圖像,并在其Ray-Ban智能眼鏡中廣泛應(yīng)用。

      目前,該助手在Meta的應(yīng)用程序中可用的語言有8種,并在22個(gè)國家提供,同時(shí)在美國和加拿大的智能眼鏡中提供英語版本。

      開源AI如火如荼

      開源AI技術(shù)正在迅速發(fā)展,推動(dòng)著生成式AI的重大創(chuàng)新。通過GitHub和Hugging Face等可訪問的研究和平臺(tái),社區(qū)已經(jīng)啟動(dòng)了取得突破性成果的項(xiàng)目。

      生態(tài)系統(tǒng):穩(wěn)步增長,走出泡沫化的底谷期(Trough of Disillusionment)

      自2023年第一季度的溫和增長以來,開發(fā)者的興趣已經(jīng)增長并穩(wěn)定下來,進(jìn)入了「穩(wěn)步爬升的光明期」(Slope of Enlightenment)——價(jià)值驅(qū)動(dòng)的創(chuàng)新在此增長。

      2024年,開源AI中嚴(yán)肅的開發(fā)者參與(即GitHub貢獻(xiàn)者)仍在繼續(xù)增加。

      市場分析:開發(fā)工具仍是熱門,訓(xùn)練和監(jiān)督勢頭正旺

      - 開源AI產(chǎn)品初創(chuàng)企業(yè)數(shù)量顯著增加

      2024年,參與開源AI的參與者數(shù)量激增,新的參與者如Neum AI和Patronus AI進(jìn)入了這一領(lǐng)域,而像Vian AI這樣的老牌參與者也為其用戶提供了開源工具包。

      - 開發(fā)工具仍然熱門;培訓(xùn)和監(jiān)控工具競爭加劇

      大多數(shù)初創(chuàng)企業(yè)仍專注于生成式AI的開發(fā)工具,這對于構(gòu)建、部署和管理應(yīng)用程序至關(guān)重要。

      然而,圍繞模型訓(xùn)練和監(jiān)督用例的初創(chuàng)企業(yè)活動(dòng)有所增加,這表明可能會(huì)向在小眾數(shù)據(jù)上微調(diào)模型和增強(qiáng)AI治理的方向轉(zhuǎn)變。

      在開源模型領(lǐng)域,領(lǐng)先者開始顯現(xiàn),開發(fā)的新模型較少,更多的重點(diǎn)放在來自Mistral和Meta等公司的改進(jìn)和更高效的版本上。

      - 開源開發(fā)正在縮小與閉源解決方案的差距

      開源使得研究更具成本效益和可訪問性,促進(jìn)了來自多元?jiǎng)?chuàng)作者的創(chuàng)新,并且法律限制較少。據(jù)統(tǒng)計(jì),有41%的企業(yè)用戶傾向于選擇開源來滿足生成式AI的需求。

      融資環(huán)境:融資步伐加快,規(guī)模更大、后期交易增

      過去兩年,開源AI領(lǐng)域已完成60多筆交易,總?cè)谫Y額超過130億美元。這些交易中有超過45%屬于A輪及以上的融資,表明對增長階段投資的強(qiáng)烈關(guān)注。

      - Deci AI被英偉達(dá)以3億美元收購

      - Scale AI完成了10億美元的F輪融資

      - Mistral AI完成了6.4億美元的B輪融資

      - Together AI完成了1.06億美元的A輪融資

      在開源AI領(lǐng)域中,模型訓(xùn)練和開發(fā)工具是獲得資金最多的細(xì)分領(lǐng)域(不包括Mistral和Databricks),占總?cè)谫Y的60%。

      其中,英偉達(dá)參與了8筆交易(包括Scale AI、Mistral AI、Together AI)。

      基礎(chǔ)模型:性能差距已縮小

      如今,開源和閉源模型之間的基準(zhǔn)差距現(xiàn)在比以往任何時(shí)候都要小——Meta Llama和Mistral在MMLU上的表現(xiàn)幾乎與GPT-4o相同。

      其他開源模型,如Qwen和Yi,也在性能上快速趕上。

      為了解決現(xiàn)有評估(如Elo和MMLU)的局限性,Hugging Face于2024年6月正式推出了專注于復(fù)雜任務(wù)的開源LLM排行榜——Open-LLM-Leaderboard。

      在過去的6個(gè)月中,隨著新競爭者的出現(xiàn),開源AI的格局發(fā)生了顯著變化。

      經(jīng)過大量數(shù)據(jù)預(yù)訓(xùn)練的Qwen,于2024年6月在Huggingface Traction上獲得了最高的下載量。

      Github:Huggingface、MindsDB和Roboflow非常火爆

      GitHub的stars是項(xiàng)目在GitHub上受歡迎程度的直接指標(biāo)。

      AutoGPT和ModularML的Mojo在2023年引領(lǐng)了GitHub熱度——自那時(shí)以來,多個(gè)倉庫已經(jīng)獲得了顯著的進(jìn)展。

      LeRobot提供基于PyTorch的真實(shí)世界機(jī)器人模型、數(shù)據(jù)集和工具,旨在使機(jī)器人技術(shù)更易于訪問。它具有最先進(jìn)的模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法,提供預(yù)訓(xùn)練模型、人類收集的數(shù)據(jù)集和模擬環(huán)境。

      由英偉達(dá)支持的MindsDB是一個(gè)使用企業(yè)數(shù)據(jù)構(gòu)建AI模型的平臺(tái)。MindsDB簡化了數(shù)據(jù)源和AI/ML工具之間的連接,自動(dòng)化工作流程以創(chuàng)建定制的AI系統(tǒng)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。