OpenAI正變得越來(lái)越封閉,但它的對(duì)手Meta(前Facebook),卻通過(guò)開(kāi)源贏得不少贊譽(yù)。
1月18日,馬克·扎克伯格宣布,Meta正在計(jì)劃構(gòu)建自己的AGI(通用人工智能),將在絕大多數(shù)領(lǐng)域中都達(dá)到或超越人類(lèi)智能水平。同時(shí)他強(qiáng)調(diào),保證會(huì)向大眾開(kāi)放這一技術(shù),以便人人都能從中獲益。
與OpenAI拒絕Open他們的算法、路線、論文相反,Meta選擇Open到底。此前震驚業(yè)內(nèi)的大模型LLaMA,大獲好評(píng)的LLaMA2,以及正在研發(fā)的LLaMA3,都是開(kāi)源的。它們成為很多AI公司研究、學(xué)習(xí)甚至抄襲的對(duì)象。
通過(guò)開(kāi)源這一手段,Meta在某種程度上打破了大模型的壟斷,成為OpenAI和谷歌雙雄相爭(zhēng)之外的第三股力量。一些人將扎克伯格視為大模型時(shí)代的英雄,有人在扎克伯格的帖子下留言,建議Meta更名為OpenAI,OpenAI更名為CloseAI。
事實(shí)上,Meta過(guò)去開(kāi)源了它研發(fā)的幾乎所有基礎(chǔ)設(shè)施,比如用于Web和APP開(kāi)發(fā)框架的React,以及機(jī)器學(xué)習(xí)框架PyTorch,而ChatGPT就是基于PyTorch開(kāi)發(fā)的,OpenAI也運(yùn)行在PyTorch上。按照Meta首席科學(xué)家楊立昆的話說(shuō),除谷歌外,全世界都運(yùn)行在PyTorch上,因?yàn)楣雀栌凶约旱南到y(tǒng)。
只是,這些東西在過(guò)去都被Meta的負(fù)面新聞掩蓋了——干預(yù)選舉進(jìn)程、提供虛假信息、危害青少年健康,在硅谷,罵Facebook曾是一種“政治正確”, 人們認(rèn)為這是一家價(jià)值觀敗壞的公司。
如今風(fēng)評(píng)大變,Meta一時(shí)仿佛成了整個(gè)AI圈的希望,它的股價(jià)在2023年上漲了160%,在美國(guó)前五大科技巨頭中漲幅僅次于英偉達(dá),最近重返萬(wàn)億美元市值,股價(jià)創(chuàng)新高。而曾以挑戰(zhàn)者姿態(tài)崛起的OpenAI,前不久剛經(jīng)歷了一場(chǎng)宮斗,散發(fā)出越來(lái)越濃的銅臭味。
OpenAI向左,Meta往右,兩家原本沒(méi)有太多交集的公司,正走出截然不同的路。
OpenAI,走向封閉
在討論這兩家公司的境況之前,我們先把時(shí)間拉回到十年前。
2013年,有一家叫DeepMind的AI公司,同時(shí)引起了谷歌和Facebook(當(dāng)時(shí)還沒(méi)更名為Meta)的注意。
當(dāng)時(shí)這家公司剛嶄露頭角,嗅覺(jué)敏銳的谷歌和Facebook都想收購(gòu)它。最終,谷歌在競(jìng)購(gòu)中勝出,2014年1月將DeepMind收入囊中。三年后,DeepMind開(kāi)發(fā)的AI機(jī)器人AlphaGo,以4:1擊敗了韓國(guó)圍棋冠軍李世石,一舉成名。
谷歌收購(gòu)DeepMind時(shí),有兩個(gè)人心里很不是滋味。一個(gè)是扎克伯格,他當(dāng)時(shí)已經(jīng)意識(shí)到AI的巨大前景;另一個(gè)是馬斯克,他不想AI被谷歌這樣的大公司控制。
于是,扎克伯格決定自己做,他花重金從紐約大學(xué)請(qǐng)來(lái)了計(jì)算機(jī)科學(xué)領(lǐng)域的權(quán)威人物楊立昆,啟動(dòng)FAIR項(xiàng)目,在Facebook成立了AI實(shí)驗(yàn)室。馬斯克則和奧爾特曼成立了OpenAI,用來(lái)對(duì)抗谷歌。
從當(dāng)時(shí)的情形來(lái)看,扎克伯格是為了自己的公司,馬斯克是為了全人類(lèi)。馬斯克認(rèn)為,由大公司控制的少量AI系統(tǒng)很不安全,唯一的辦法是讓盡可能多的人都擁有AI。所以O(shè)penAI一開(kāi)始就定位開(kāi)源,是一個(gè)非營(yíng)利性的機(jī)構(gòu)。
馬斯克當(dāng)時(shí)說(shuō):“我們希望有一種類(lèi)似于Linux版本的AI,不受任何個(gè)人或公司的控制。”
一個(gè)為私,一個(gè)為公,兩家公司一開(kāi)始就選了不同的路。
馬斯克提到的Linux,是一款免費(fèi)開(kāi)源的操作系統(tǒng)。在互聯(lián)網(wǎng)早期,計(jì)算機(jī)剛開(kāi)始普及時(shí),可用的操作系統(tǒng)不多,要么源代碼被軟件廠商嚴(yán)格保密,要么收取很高昂的費(fèi)用。一個(gè)歐洲大學(xué)生開(kāi)發(fā)出Linux操作系統(tǒng)的雛形,然后免費(fèi)對(duì)外公開(kāi)了自己的代碼。
由于開(kāi)源,全球程序員都加入進(jìn)來(lái)改進(jìn)代碼,最終創(chuàng)造了Linux操作系統(tǒng),且使用完全免費(fèi)。這大大加速了計(jì)算機(jī)的普及。我們今天熟知的安卓系統(tǒng),就是基于Linux內(nèi)核,全球大部分手機(jī)都跑在這個(gè)系統(tǒng)上。
馬斯克的想法很簡(jiǎn)單,AI時(shí)代也需要有這樣一個(gè)開(kāi)源開(kāi)放的操作系統(tǒng),市場(chǎng)不能讓巨頭獨(dú)占。
OpenAI的啟動(dòng)資金來(lái)源于一批科技大佬捐贈(zèng),它一開(kāi)始的確是按開(kāi)源的路徑走的,2019年發(fā)布的GPT-2,就是一個(gè)開(kāi)源大模型,當(dāng)年還有人用GPT-2為《權(quán)利的游戲》改寫(xiě)劇本結(jié)尾。
但也是在GPT-2發(fā)布之后,OpenAI逐漸走向封閉。它隨后成立營(yíng)利性子公司,接受了微軟的數(shù)十億美元投資。
在那之后,2020年發(fā)布的GPT-3,2022年升級(jí)的GPT-3.5,以及2023年3月發(fā)布的GPT-4,都是閉源模型,一開(kāi)始OpenAI還公布論文,到后來(lái)連模型具體參數(shù)都不再公布。
而從整個(gè)大模型行業(yè)的競(jìng)爭(zhēng)格局來(lái)看,“OpenAI-微軟”“DeepMind-谷歌”的雙巨頭組合格局正式形成。
馬斯克對(duì)此非常不滿。他說(shuō),OpenAI設(shè)立時(shí)是一家開(kāi)源公司,現(xiàn)在變成了一個(gè)閉源、受微軟控制的逐利公司。這根本不是他想要的。
這期間Meta沒(méi)閑著。除了折騰元宇宙,Meta的AI團(tuán)隊(duì)一直在研究大語(yǔ)言模型,并發(fā)布了一些開(kāi)源項(xiàng)目。大家各做各的,互不干涉。
在OpenAI發(fā)布ChatGPT的幾周前,Meta發(fā)布了一個(gè)類(lèi)似的聊天機(jī)器人Galactica,專(zhuān)門(mén)用于撰寫(xiě)科學(xué)論文。誰(shuí)知道這個(gè)產(chǎn)品不僅沒(méi)引起轟動(dòng),還招來(lái)一片罵聲,網(wǎng)友痛斥它會(huì)破壞科學(xué)出版。以至于Meta的人取消了演示,覺(jué)都睡不著。
當(dāng)時(shí)人們關(guān)心的是Meta的元宇宙項(xiàng)目是不是快涼了,裁員裁到哪了,沒(méi)人關(guān)心它的AI做得咋樣。至于OpenAI,大家覺(jué)得它代表新勢(shì)力,對(duì)它更加包容。
按照楊立昆的說(shuō)法,兩周后ChatGPT問(wèn)世,被視為救世主降臨。隨后的很長(zhǎng)時(shí)間里,OpenAI都是全球科技界的當(dāng)紅炸子雞,登上神壇奪走了所有目光。人們津津樂(lè)道于,OpenAI是如何沖破谷歌的封鎖,對(duì)巨頭形成壓制。
在崇尚個(gè)人英雄主義的美國(guó),創(chuàng)業(yè)新秀挑戰(zhàn)舊勢(shì)力的劇本,向來(lái)充滿話題性。于是大模型頭部選手的競(jìng)爭(zhēng),變成了OpenAI和谷歌的雙雄爭(zhēng)霸。
但一向好強(qiáng)的扎克伯格不會(huì)袖手旁觀。Meta秘密研發(fā)的LLaMA大模型,已經(jīng)箭在弦上。
Meta才是全村的希望?
2023年2月,ChatGPT發(fā)布之后3個(gè)月,LLaMA的第一個(gè)版本開(kāi)源,一開(kāi)始這個(gè)模型只能用作研究。7月,升級(jí)之后的LLaMA2支持免費(fèi)商用。Meta把模型訓(xùn)練數(shù)據(jù)、訓(xùn)練方法、數(shù)據(jù)標(biāo)注等大量細(xì)節(jié)都公布了,起始代碼全部開(kāi)源。
LLaMA2性能非常突出,超過(guò)了所有的開(kāi)源大模型。有人發(fā)現(xiàn),其最大參數(shù)的版本比GPT-3參數(shù)量小,但效果更好。
曾經(jīng)跟著馬斯克從OpenAI跳到特斯拉,后來(lái)又被OpenAI挖回去的科學(xué)家Andrej Karpathy,將LLaMA2的發(fā)布視為人工智能和大模型發(fā)展過(guò)程中的重要一天,因?yàn)檫@“是任何人都可以拿到模型權(quán)重的最強(qiáng)大語(yǔ)言模型。”
一時(shí)間,整個(gè)AI圈對(duì)Meta刮目相看。當(dāng)一批巨頭公司掀起大模型軍備競(jìng)賽,試圖通過(guò)技術(shù)封閉實(shí)現(xiàn)市場(chǎng)壟斷時(shí),Meta用LLaMA撕開(kāi)了一條口子。OpenAI沒(méi)做的事,Meta做到了。
英諾天使基金合伙人王晟戲稱(chēng)楊立昆為“Klaus LeCun”( 楊立昆英文名為Yann LeCun,Klaus Fuchs在二戰(zhàn)期間向蘇聯(lián)提供了曼哈頓計(jì)劃的信息)。王晟開(kāi)玩笑:“不能只讓美國(guó)擁有原子彈。”
王晟發(fā)現(xiàn),ChatGPT出現(xiàn)之后,科技圈對(duì)大模型熱情且迷茫。投資人中很多是看熱鬧,“因?yàn)榈谝豢床欢诙桓彝,第三投不到。一個(gè)新的技術(shù)范式出現(xiàn),沒(méi)人知道它的能力邊界在哪里。”
王晟對(duì)「定焦」說(shuō),LLaMA開(kāi)源對(duì)行業(yè)影響很大。“Meta過(guò)去這些年積累的大模型技術(shù),本來(lái)都是不傳之秘,結(jié)果一開(kāi)源,迅速把很多認(rèn)知拉平了。”
之前,國(guó)內(nèi)團(tuán)隊(duì)研發(fā)大模型,只能從零到一不斷試錯(cuò),一旦有個(gè)點(diǎn)被卡住了,即便從技術(shù)角度來(lái)說(shuō)并不是太難,但靠自己可能也需要花一兩年時(shí)間才能解決,需要親自踩很多坑,F(xiàn)在Meta直接把它的經(jīng)驗(yàn)和數(shù)據(jù)拿出來(lái),在思路和方法上給了行業(yè)非常重要的指引。
“在這個(gè)過(guò)程中大家學(xué)習(xí)了很多。假如沒(méi)有LLAMA開(kāi)源,國(guó)內(nèi)大模型今天的水平可能會(huì)差很多,我們會(huì)大幅度被人甩下。”王晟說(shuō)。
這也是為什么國(guó)內(nèi)一下子突然涌現(xiàn)出200多個(gè)大模型。王小川的百川智能在公司成立僅兩個(gè)月就發(fā)布了一款大模型,其實(shí)就是借鑒了LLaMA。李開(kāi)復(fù)的零一萬(wàn)物推出的大模型,也是使用LLaMA的開(kāi)源模型架構(gòu)。
LLaMA開(kāi)源對(duì)OpenAI最直觀的影響,是有一堆中國(guó)公司跳出來(lái)“吊打”GPT。在他們的口徑中,已經(jīng)在多項(xiàng)指標(biāo)上超過(guò)了GPT模型,雖然很多榜單都是刷出來(lái)的。
更深層次的影響在于,大模型開(kāi)源社區(qū)的力量快速壯大,全球的程序員都能為開(kāi)源做貢獻(xiàn)。他們開(kāi)發(fā)出各種開(kāi)源數(shù)據(jù)集,迭代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說(shuō),谷歌沒(méi)有護(hù)城河,OpenAI也沒(méi)有。
Meta在科技圈的形象變得高大起來(lái)。回顧Meta的發(fā)展,其實(shí)它一直都有開(kāi)源的傳統(tǒng)。
早在2016年,Meta團(tuán)隊(duì)就開(kāi)發(fā)并開(kāi)源了深度學(xué)習(xí)框架PyTorch,它和谷歌的TensorFlow成為深度學(xué)習(xí)領(lǐng)域的兩大主流框架。
跟OpenAI現(xiàn)在才開(kāi)始秘密推進(jìn)芯片制造項(xiàng)目不同,Meta在三年前就設(shè)計(jì)了自研AI推理芯片,并采用了開(kāi)源架構(gòu)。
在語(yǔ)言翻譯方面它推出了很多開(kāi)源模型,兩年前發(fā)布的NLLB模型是維基百科的翻譯供應(yīng)商之一,2023年發(fā)布的SeamlessM4T可以翻譯近百種語(yǔ)言,同時(shí)它還發(fā)布了全球最大的開(kāi)放多模態(tài)翻譯數(shù)據(jù)集。
有研究人員經(jīng)過(guò)對(duì)比認(rèn)為,Meta更傾向于信任、問(wèn)責(zé)制以及通過(guò)開(kāi)源實(shí)現(xiàn)人工智能的民主化。
反觀OpenAI,它依然在技術(shù)上保持領(lǐng)先,但拒絕開(kāi)放。
“沒(méi)人知道OpenAI進(jìn)展到什么程度了,包括它正在研發(fā)的GPT-5,是不是繼續(xù)用的transformer都是未知數(shù)。現(xiàn)在大家都跟著GPT-3.5的技術(shù)路線在跑,假設(shè)它悄悄變換了方向,那大家就掉坑里了。因?yàn)闆](méi)人知道正確路線是什么。”一位AI公司的創(chuàng)始人說(shuō)。
同時(shí)它試圖阻擋競(jìng)爭(zhēng)對(duì)手,以保持自己的先發(fā)優(yōu)勢(shì)。
字節(jié)跳動(dòng)在2023年12月被OpenAI停用賬戶(hù),因?yàn)樗谡{(diào)用OpenAI的API開(kāi)發(fā)自身大語(yǔ)言模型的時(shí)候,違反了OpenAI的服務(wù)條款。有悖商業(yè)倫理的行為肯定是不對(duì)的,但外界由此關(guān)注到OpenAI的商業(yè)條款,它禁止客戶(hù)使用GPT輸出的內(nèi)容開(kāi)發(fā)任何可能會(huì)給OpenAI帶來(lái)競(jìng)爭(zhēng)的AI模型。
值得注意的是,微軟也有類(lèi)似條款。它們將商業(yè)上的競(jìng)爭(zhēng)優(yōu)勢(shì)看得很重要。
人工智能公司開(kāi)放傳神(OpenCSG)創(chuàng)始人、CEO陳冉認(rèn)為,開(kāi)源的市場(chǎng)空間遠(yuǎn)比閉源大,但未來(lái)一定是開(kāi)源和閉源兩條路同時(shí)走,“OpenAI開(kāi)源不開(kāi)源其實(shí)不重要了。”
開(kāi)源閉源,誰(shuí)對(duì)誰(shuí)錯(cuò)?
究竟是OpenAI被利益蒙蔽了雙眼,還是Meta大公無(wú)私要為全人類(lèi)做貢獻(xiàn)?
或許,它們?cè)诒举|(zhì)上并無(wú)不同。OpenAI既沒(méi)有那么自私,Meta也不像網(wǎng)友鼓吹的那樣高尚,區(qū)別只在于路線和策略。
若論對(duì)整個(gè)AI行業(yè)的貢獻(xiàn),OpenAI毫無(wú)疑問(wèn)是最大的。畢竟,這一輪AI浪潮是由ChatGPT掀起的。它點(diǎn)燃了一把火,加速了大模型的普及。事實(shí)上,前兩年大模型開(kāi)源社區(qū)基本是圍著GPT-3在轉(zhuǎn)。
OpenAI不像谷歌、Meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈(zèng)的資金早花得差不多了,沒(méi)錢(qián)是做不了研發(fā)的,總不能用愛(ài)發(fā)電。所以O(shè)penAI抱了微軟的大腿,奧爾特曼想盡辦法為OpenAI賺錢(qián)。
陳冉認(rèn)為,OpenAI的成功其實(shí)是商業(yè)模式的成功,本質(zhì)是投資人看到了巨大的商業(yè)價(jià)值和盈利模式。開(kāi)源與閉源之間的競(jìng)爭(zhēng)方向一定是掙錢(qián)模式的創(chuàng)新競(jìng)爭(zhēng)。
Meta將技術(shù)開(kāi)源,也不是只為他人做嫁衣。開(kāi)源是一種策略,能吸引更多開(kāi)發(fā)人員免費(fèi)幫它迭代技術(shù)、修復(fù)漏洞,正所謂眾人拾柴火焰高,但最核心的技術(shù)還是掌握在Meta手里,該打擊對(duì)手的時(shí)候它不會(huì)手軟。就像谷歌,它旗下的安卓是開(kāi)源系統(tǒng),但國(guó)內(nèi)手機(jī)廠商做自己的系統(tǒng)還是會(huì)有很多限制。
而在大模型火起來(lái)之前,Meta掉進(jìn)了元宇宙的深坑里無(wú)法自拔,砸錢(qián)、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT則是照亮前路的那束光。
再往深了看,閉源的OpenAI和開(kāi)源的Meta,從根本上對(duì)AI的價(jià)值判斷有分歧。
如果將AI比作未來(lái)世界的核武器,OpenAI認(rèn)為它很危險(xiǎn),得謹(jǐn)慎,不能濫用。Meta則認(rèn)為,核武器不能只掌握在少數(shù)幾個(gè)玩家手里,應(yīng)該開(kāi)放研究。
關(guān)于AI的利弊之辯,是科技圈的一個(gè)老話題。馬斯克就相信“AI危險(xiǎn)論”,他擔(dān)心有一天機(jī)器的智力、意識(shí)都超過(guò)了人類(lèi),可能會(huì)取代人類(lèi),摧毀人類(lèi)文明。所以他當(dāng)年?duì)款^成立OpenAI,只是后來(lái)OpenAI沒(méi)按他設(shè)想的路徑走。
基于“防止AI取代人類(lèi)”的愿景,行業(yè)里又延伸出兩大派別。一派認(rèn)為大量獨(dú)立的AI系統(tǒng)比由大公司控制的少量AI系統(tǒng)更安全,AI的研究應(yīng)該開(kāi)源開(kāi)放;另一派認(rèn)為應(yīng)該封閉研究,這可以減輕安全風(fēng)險(xiǎn),防止不法分子濫用獲得的代碼。
OpenAI屬于后者。支持它的人認(rèn)為開(kāi)源策略加大了風(fēng)險(xiǎn),比如倫敦一家AI公司的CEO就認(rèn)為,Meta是最不負(fù)責(zé)任的人工智能參與者,他問(wèn):“我們應(yīng)該令核武器的設(shè)計(jì)透明化嗎?”
Meta將開(kāi)源視為最優(yōu)策略,楊立昆就認(rèn)為,機(jī)器最終會(huì)比人類(lèi)更聰明,人類(lèi)無(wú)法阻止壞人獲取它,AI必須是開(kāi)源的,只有讓更多人參與其中,最終開(kāi)發(fā)出的系統(tǒng)才會(huì)更安全。他認(rèn)為馬斯克的AI威脅論就是科幻小說(shuō)看多了。
楊立昆曾經(jīng)的合作伙伴,跟他一塊獲得圖靈獎(jiǎng)的杰弗里·辛頓,則持有不同觀點(diǎn),認(rèn)為AI將對(duì)人類(lèi)構(gòu)成嚴(yán)重威脅。他的思想也許對(duì)他的學(xué)生伊利亞造成了影響。伊利亞是OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家,幾乎決定了OpenAI的技術(shù)路線,他也是OpenAI宮斗事件中開(kāi)除奧爾特曼的關(guān)鍵人物。伊利亞一直致力于追求安全可靠的AGI。業(yè)內(nèi)普遍認(rèn)為,商業(yè)化和AGI的路線之爭(zhēng),引發(fā)了那場(chǎng)沖突。
所以,OpenAI和Meta有不同的信念。OpenAI將AGI視為終極目標(biāo),并且相信自己將會(huì)第一個(gè)實(shí)現(xiàn)它;Meta將開(kāi)放平臺(tái)視為最好的路徑,試圖制定開(kāi)源標(biāo)準(zhǔn)。當(dāng)然,它們都希望在這個(gè)過(guò)程里拿到應(yīng)得的商業(yè)利益。
往長(zhǎng)遠(yuǎn)看,AI的發(fā)展是螺旋式上升的,開(kāi)源也好,閉源也罷,都將為其注入動(dòng)能。究竟誰(shuí)是真的在為全人類(lèi)的未來(lái)操心,只有等待時(shí)間檢驗(yàn)了。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性?xún)r(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。