OPPO A5 Pro首創(chuàng)獵手天線架構:信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網王」般的網絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元曝蘋果研發(fā)帶Face ID的智能家居門鈴:內置自研W-Fi芯片李斌回應螢火蟲外觀設計:看過實車的人都喜歡這個設計林杰:未來 A 級、A0 級、A00 級車型都將是領克純電的“主場”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設與智慧出行萬象分區(qū)、絢彩XDR、量子點Pro 2025齊出手,TCL引領觀影體驗新變革!QQ音樂年度聽歌報告發(fā)布:誰是你最喜歡的歌手?OpenAI正式發(fā)布o3 - 通往AGI的路上,已經沒有了任何阻礙「送禮物」難撬動社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁技術報告出爐2024年結束,哪里是原創(chuàng)動畫的應許之地?深扒一個正被游戲行業(yè)「搶占」的流量帝國
  • 首頁 > 云計算頻道 > 云計算

    科技云報道:開源才是大模型的未來?

    2023年12月25日 14:25:44   來源:科技云報道

      一年前,ChatGPT橫空出世;7個多月后,Meta宣布開源LLaMA 2,并且可免費商用。

      這一天,也成為大模型發(fā)展的分水嶺。短時間內,LLaMA 2對一些閉源的大模型廠商造成了致命性的打擊。

      隨后,全球頭部廠商和創(chuàng)業(yè)公司紛紛加入開源浪潮中。目前,國內也有近一半的大模型選擇了開源的方式:

      今年7月,智譜AI宣布開源大模型ChatGLM-6B和ChatGLM2-6B,這兩個模型的下載量已經先后超過300萬和120萬。

      8月,阿里宣布開源通義千問70億參數(shù)模型Qwen-7B,一個多月下載量破100萬;12月,阿里持續(xù)開源通義千問720億參數(shù)模型Qwen-72B、18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。

      9月,百川智能宣布開源Baichuan-7B、13B兩款大模型,其下載量目前已經突破500萬,200多家企業(yè)申請部署開源大模型。

      11月,元象XVERSE宣布開源650億參數(shù)高性能通用大模型XVERSE-65B;

      11月底,浪潮信息發(fā)布完全開源且可免費商用的源2.0基礎大模型,包含1026億、518億、21億不同參數(shù)規(guī)模......

      僅僅在過去的一個月內,國內最大開源模型的參數(shù)紀錄就已經被刷新了N次。性能參數(shù)、性價比、可靠性,正成為搶占先機的關鍵詞,而開源似乎也成為大模型發(fā)展的主流趨勢。

      有業(yè)內人士認為,未來90%的企業(yè)會傾向基于開源大模型發(fā)展。那么,開源是否真的是大模型的未來?

      開源大模型快速趕超

      開源大模型的核心理念是開放源代碼,允許公眾訪問、使用、修改和分發(fā)模型的源代碼。

      面對市場競爭,開源大模型的免費使用是非常有吸引力的獲客手段;同時,低成本的試錯也有助于開源大模型更快觸達潛在用戶群體,降低企業(yè)認知和決策難度,加速創(chuàng)新。

      從技術角度看,大模型涉及許多技術問題,單靠一家企業(yè)很難解決。開源大模型鼓勵全球開發(fā)者社區(qū)的參與和貢獻,這種集體智慧能夠加速技術的迭代和創(chuàng)新,如GitHub上的眾多AI項目就證明了這一點。

      不僅如此,開源代碼使得研究人員和用戶能夠審查模型的工作原理和決策過程,從而提高大模型的透明度和可信賴性。這對于解決AI的公平性、偏見和倫理問題至關重要。

      事實上,自從LLaMA 2開源后,業(yè)界開始意識到大模型技術沒有任何護欄。

      基于成本的考慮,許多企業(yè)選擇放棄支付上千萬元的調用閉源大模型API的費用,轉而部署和微調LLaMA 2。

      創(chuàng)業(yè)者們的目光從解構、增強LLaMA 2轉向了構建行業(yè)專有大模型,又掀起了一波LLaMA 2+司法、LLaMA 2+醫(yī)療等一系列的行業(yè)開源大模型。據(jù)不完全統(tǒng)計,LLaMA 2開源后,國內就涌現(xiàn)出了十幾個開源行業(yè)大模型。

      一份從谷歌內部泄露出來的備忘錄(標題是《我們沒有護城河》)證實了這種觀點:

      “我們無法贏得這場軍備競賽,OpenAI 也一樣。當我們爭吵不休的時候,第三個派系(開源)卻在悄悄地吃掉我們的午餐”。

      谷歌備忘錄作者發(fā)現(xiàn),自從LLaMA開源后,立刻出現(xiàn)了大量的創(chuàng)新,重大開發(fā)成果之間的間隔也在縮短。

      Meta是一個明顯的贏家,他們有效地獲得了整個星球的免費勞動力,大多數(shù)開源創(chuàng)新都發(fā)生在他們的架構之上,沒有什么能阻止他們將其直接整合到他們的產品中。

      “當免費、不受限制的替代品在質量上具有可比性時,人們就不會為受限制的模型付費”,備忘錄里寫道。

      最近,Meta首席AI科學家Yann LeCun轉發(fā)了方舟投資(ARK Invest)制作的一張趨勢圖,描繪了開源社區(qū)與閉源模型在生成式AI上的發(fā)展。

      “開源人工智能模型正走在超越專有模型的路上”,他感概道。

      有網友甚至表示,我們正在接近一個臨界點。以目前開源社區(qū)項目的發(fā)展速度,開源大模型將在未來12個月內達到GPT-4的水平。

      未來1-2年,開源力量可能在與閉源大模型分庭抗禮。

      開源大模型的商業(yè)化挑戰(zhàn)

      盡管開源已成為現(xiàn)階段大模型發(fā)展的一種主流趨勢,開源大模型的發(fā)展速度也遠快于封閉生態(tài)系統(tǒng),但并非所有的廠商都選擇開源路線,也并不代表廠商會一直開源所有的大模型。

      比如,以開源切入大模型賽道的百川智能,在發(fā)布完Baichuan-7B、Baichuan-13B開源大模型后,參數(shù)更大的Baichuan-53B大模型則選擇了閉源。

      由此可見,開源或閉源并非大模型的唯一發(fā)展路徑。在當下,能夠閉源的大模型一定是可以提供足夠高的價值,幫用戶更好地完成高性能的大模型訓練、推理和部署,通過調用API的方式來幫助用戶降低門檻。

      這也是OpenAI等AI巨頭閉源的思路,因其自身技術的絕對領先優(yōu)勢,使得其價值也非常的大。

      相比之下,開源大模型除了快速迭代、證明自己的價值,還面臨著更多的挑戰(zhàn),比如:

      由于源代碼的公開性,開源大模型可能更容易受到惡意攻擊或濫用,確保數(shù)據(jù)安全和用戶隱私需要額外的努力和監(jiān)管。

      同時,來自商業(yè)模式的不確定性,如何在保持開放的同時實現(xiàn)可持續(xù)的商業(yè)發(fā)展,始終是開源需要解決的重要問題。

      回顧歷史,紅帽在開源商業(yè)化成功的道路上已做出了示范。作為最早通過提供企業(yè)級 Linux 發(fā)行版和相關服務的公司,紅帽通過訂閱模式為客戶提供技術支持、更新和定制化服務。

      紅帽的商業(yè)化路徑具體而言:在最上游的開源社區(qū),參與開源技術貢獻,做大做強生態(tài);提取開源社區(qū)中的上游技術產品,沉淀到自己小開源社區(qū);再將其認為最有價值的技術檢驗、測試、打包,形成新的產品組合,完成閉源出售給客戶。

      同樣將開源成功商業(yè)化的公司還有MongoDB, Databricks, Cloudera, GitLab, Docker, MySQL AB......這些案例都表明,開源軟件可以通過提供增值服務、技術支持、企業(yè)級特性、云服務等方式實現(xiàn)商業(yè)化,同時保持與開源社區(qū)的互動和合作。

      盡管珠玉在前,但并不代表開源大模型商業(yè)化是一件容易的事。

      在如此多的開源大模型競爭壓力下,如何提高自身大模型在用戶中的知名度和接受度,讓用戶從免費使用轉向付費服務,同時還要防止競爭對手可能基于相同的代碼庫創(chuàng)建自己的產品或服務,都考驗著開源大模型廠商的能力和速度。

      開源與閉源大模型的協(xié)同演化

      實際上,開源大模型和閉源大模型各有優(yōu)劣,且在不同的應用場景和需求下各有其適用性,兩者并非絕對的對立面,而是可以在某些方面相互借鑒和融合。

      開源是為了保持社區(qū)的繁榮和多樣性,能夠保證技術、產品能夠源源不斷補充新鮮的血液和產生新的變化。

      閉源的商業(yè)化版本是用來滿足商業(yè)化的需求,即安全、低成本、高效、持續(xù)有價值的服務。對比商業(yè)版本,開源版本一定是滯后的,包括技術的迭代、維護等等。

      因此,兩者的優(yōu)勢并不在同一個位置,也很難斷言哪一個模式將完全主導大模型的未來。相反,可以預見的是,開源和閉源大模型將在以下幾個方面實現(xiàn)協(xié)同演化:

      一是,共享與競爭并存。

      開源大模型和閉源大模型將在某些領域展開激烈的競爭,如自然語言處理、計算機視覺等。同時,它們也可能在其他領域共享成果和技術,推動整個AI行業(yè)的進步。

      二是,混合模式的出現(xiàn)。

      為了兼顧創(chuàng)新速度、透明度、安全性和商業(yè)利益,一些公司可能會選擇采用混合模式,即開放基礎模型的源代碼,但保留高級功能或特定應用的閉源。

      這種模式既可以吸引開發(fā)者和用戶的參與,又可以保護公司的核心競爭力。

      三是,標準化與監(jiān)管的加強。

      隨著AI技術的發(fā)展和應用的普及,政府和行業(yè)組織可能會加強對開源和閉源大模型的標準化和監(jiān)管工作,以確保模型的安全、公平和透明。

      這將進一步規(guī)范市場行為,促進開源和閉源大模型的健康發(fā)展。

      結語

      當然,無論是開源還是閉源,重要的是持續(xù)創(chuàng)新、提升透明度和安全性,以及實現(xiàn)AI技術的社會價值和經濟價值的最大化。比起斷定誰會是大模型的未來,不如去關注如何合理利用這兩種模式,去塑造一個更加智能、開放、安全和可持續(xù)的AI未來。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網大會——工業(yè)互聯(lián)網標識解析專題論壇在沈陽成功舉辦。