OpenAI向左，Meta往右

2024年01月26日 09:34:57 來(lái)源：定焦公眾號(hào)

　　OpenAI正變得越來(lái)越封閉，但它的對(duì)手Meta(前Facebook)，卻通過(guò)開(kāi)源贏得不少贊譽(yù)。

　　1月18日，馬克·扎克伯格宣布，Meta正在計(jì)劃構(gòu)建自己的AGI(通用人工智能)，將在絕大多數(shù)領(lǐng)域中都達(dá)到或超越人類(lèi)智能水平。同時(shí)他強(qiáng)調(diào)，保證會(huì)向大眾開(kāi)放這一技術(shù)，以便人人都能從中獲益。

　　與OpenAI拒絕Open他們的算法、路線、論文相反，Meta選擇Open到底。此前震驚業(yè)內(nèi)的大模型LLaMA，大獲好評(píng)的LLaMA2，以及正在研發(fā)的LLaMA3，都是開(kāi)源的。它們成為很多AI公司研究、學(xué)習(xí)甚至抄襲的對(duì)象。

　　通過(guò)開(kāi)源這一手段，Meta在某種程度上打破了大模型的壟斷，成為OpenAI和谷歌雙雄相爭(zhēng)之外的第三股力量。一些人將扎克伯格視為大模型時(shí)代的英雄，有人在扎克伯格的帖子下留言，建議Meta更名為OpenAI，OpenAI更名為CloseAI。

　　事實(shí)上，Meta過(guò)去開(kāi)源了它研發(fā)的幾乎所有基礎(chǔ)設(shè)施，比如用于Web和APP開(kāi)發(fā)框架的React，以及機(jī)器學(xué)習(xí)框架PyTorch，而ChatGPT就是基于PyTorch開(kāi)發(fā)的，OpenAI也運(yùn)行在PyTorch上。按照Meta首席科學(xué)家楊立昆的話說(shuō)，除谷歌外，全世界都運(yùn)行在PyTorch上，因?yàn)楣雀栌凶约旱南到y(tǒng)。

　　只是，這些東西在過(guò)去都被Meta的負(fù)面新聞掩蓋了——干預(yù)選舉進(jìn)程、提供虛假信息、危害青少年健康，在硅谷，罵Facebook曾是一種“政治正確”，人們認(rèn)為這是一家價(jià)值觀敗壞的公司。

　　如今風(fēng)評(píng)大變，Meta一時(shí)仿佛成了整個(gè)AI圈的希望，它的股價(jià)在2023年上漲了160%，在美國(guó)前五大科技巨頭中漲幅僅次于英偉達(dá)，最近重返萬(wàn)億美元市值，股價(jià)創(chuàng)新高。而曾以挑戰(zhàn)者姿態(tài)崛起的OpenAI，前不久剛經(jīng)歷了一場(chǎng)宮斗，散發(fā)出越來(lái)越濃的銅臭味。

　　OpenAI向左，Meta往右，兩家原本沒(méi)有太多交集的公司，正走出截然不同的路。

　　OpenAI，走向封閉

　　在討論這兩家公司的境況之前，我們先把時(shí)間拉回到十年前。

　　2013年，有一家叫DeepMind的AI公司，同時(shí)引起了谷歌和Facebook(當(dāng)時(shí)還沒(méi)更名為Meta)的注意。

　　當(dāng)時(shí)這家公司剛嶄露頭角，嗅覺(jué)敏銳的谷歌和Facebook都想收購(gòu)它。最終，谷歌在競(jìng)購(gòu)中勝出，2014年1月將DeepMind收入囊中。三年后，DeepMind開(kāi)發(fā)的AI機(jī)器人AlphaGo，以4:1擊敗了韓國(guó)圍棋冠軍李世石，一舉成名。

　　谷歌收購(gòu)DeepMind時(shí)，有兩個(gè)人心里很不是滋味。一個(gè)是扎克伯格，他當(dāng)時(shí)已經(jīng)意識(shí)到AI的巨大前景;另一個(gè)是馬斯克，他不想AI被谷歌這樣的大公司控制。

　　于是，扎克伯格決定自己做，他花重金從紐約大學(xué)請(qǐng)來(lái)了計(jì)算機(jī)科學(xué)領(lǐng)域的權(quán)威人物楊立昆，啟動(dòng)FAIR項(xiàng)目，在Facebook成立了AI實(shí)驗(yàn)室。馬斯克則和奧爾特曼成立了OpenAI，用來(lái)對(duì)抗谷歌。

　　從當(dāng)時(shí)的情形來(lái)看，扎克伯格是為了自己的公司，馬斯克是為了全人類(lèi)。馬斯克認(rèn)為，由大公司控制的少量AI系統(tǒng)很不安全，唯一的辦法是讓盡可能多的人都擁有AI。所以O(shè)penAI一開(kāi)始就定位開(kāi)源，是一個(gè)非營(yíng)利性的機(jī)構(gòu)。

　　馬斯克當(dāng)時(shí)說(shuō):“我們希望有一種類(lèi)似于Linux版本的AI，不受任何個(gè)人或公司的控制。”

　　一個(gè)為私，一個(gè)為公，兩家公司一開(kāi)始就選了不同的路。

　　馬斯克提到的Linux，是一款免費(fèi)開(kāi)源的操作系統(tǒng)。在互聯(lián)網(wǎng)早期，計(jì)算機(jī)剛開(kāi)始普及時(shí)，可用的操作系統(tǒng)不多，要么源代碼被軟件廠商嚴(yán)格保密，要么收取很高昂的費(fèi)用。一個(gè)歐洲大學(xué)生開(kāi)發(fā)出Linux操作系統(tǒng)的雛形，然后免費(fèi)對(duì)外公開(kāi)了自己的代碼。

　　由于開(kāi)源，全球程序員都加入進(jìn)來(lái)改進(jìn)代碼，最終創(chuàng)造了Linux操作系統(tǒng)，且使用完全免費(fèi)。這大大加速了計(jì)算機(jī)的普及。我們今天熟知的安卓系統(tǒng)，就是基于Linux內(nèi)核，全球大部分手機(jī)都跑在這個(gè)系統(tǒng)上。

　　馬斯克的想法很簡(jiǎn)單，AI時(shí)代也需要有這樣一個(gè)開(kāi)源開(kāi)放的操作系統(tǒng)，市場(chǎng)不能讓巨頭獨(dú)占。

　　OpenAI的啟動(dòng)資金來(lái)源于一批科技大佬捐贈(zèng)，它一開(kāi)始的確是按開(kāi)源的路徑走的，2019年發(fā)布的GPT-2，就是一個(gè)開(kāi)源大模型，當(dāng)年還有人用GPT-2為《權(quán)利的游戲》改寫(xiě)劇本結(jié)尾。

　　但也是在GPT-2發(fā)布之后，OpenAI逐漸走向封閉。它隨后成立營(yíng)利性子公司，接受了微軟的數(shù)十億美元投資。

　　在那之后，2020年發(fā)布的GPT-3，2022年升級(jí)的GPT-3.5，以及2023年3月發(fā)布的GPT-4，都是閉源模型，一開(kāi)始OpenAI還公布論文，到后來(lái)連模型具體參數(shù)都不再公布。

　　而從整個(gè)大模型行業(yè)的競(jìng)爭(zhēng)格局來(lái)看，“OpenAI-微軟”“DeepMind-谷歌”的雙巨頭組合格局正式形成。

　　馬斯克對(duì)此非常不滿。他說(shuō)，OpenAI設(shè)立時(shí)是一家開(kāi)源公司，現(xiàn)在變成了一個(gè)閉源、受微軟控制的逐利公司。這根本不是他想要的。

　　這期間Meta沒(méi)閑著。除了折騰元宇宙，Meta的AI團(tuán)隊(duì)一直在研究大語(yǔ)言模型，并發(fā)布了一些開(kāi)源項(xiàng)目。大家各做各的，互不干涉。

　　在OpenAI發(fā)布ChatGPT的幾周前，Meta發(fā)布了一個(gè)類(lèi)似的聊天機(jī)器人Galactica，專(zhuān)門(mén)用于撰寫(xiě)科學(xué)論文。誰(shuí)知道這個(gè)產(chǎn)品不僅沒(méi)引起轟動(dòng)，還招來(lái)一片罵聲，網(wǎng)友痛斥它會(huì)破壞科學(xué)出版。以至于Meta的人取消了演示，覺(jué)都睡不著。

　　當(dāng)時(shí)人們關(guān)心的是Meta的元宇宙項(xiàng)目是不是快涼了，裁員裁到哪了，沒(méi)人關(guān)心它的AI做得咋樣。至于OpenAI，大家覺(jué)得它代表新勢(shì)力，對(duì)它更加包容。

　　按照楊立昆的說(shuō)法，兩周后ChatGPT問(wèn)世，被視為救世主降臨。隨后的很長(zhǎng)時(shí)間里，OpenAI都是全球科技界的當(dāng)紅炸子雞，登上神壇奪走了所有目光。人們津津樂(lè)道于，OpenAI是如何沖破谷歌的封鎖，對(duì)巨頭形成壓制。

　　在崇尚個(gè)人英雄主義的美國(guó)，創(chuàng)業(yè)新秀挑戰(zhàn)舊勢(shì)力的劇本，向來(lái)充滿話題性。于是大模型頭部選手的競(jìng)爭(zhēng)，變成了OpenAI和谷歌的雙雄爭(zhēng)霸。

　　但一向好強(qiáng)的扎克伯格不會(huì)袖手旁觀。Meta秘密研發(fā)的LLaMA大模型，已經(jīng)箭在弦上。

　　Meta才是全村的希望?

　　2023年2月，ChatGPT發(fā)布之后3個(gè)月，LLaMA的第一個(gè)版本開(kāi)源，一開(kāi)始這個(gè)模型只能用作研究。7月，升級(jí)之后的LLaMA2支持免費(fèi)商用。Meta把模型訓(xùn)練數(shù)據(jù)、訓(xùn)練方法、數(shù)據(jù)標(biāo)注等大量細(xì)節(jié)都公布了，起始代碼全部開(kāi)源。

　　LLaMA2性能非常突出，超過(guò)了所有的開(kāi)源大模型。有人發(fā)現(xiàn)，其最大參數(shù)的版本比GPT-3參數(shù)量小，但效果更好。

　　曾經(jīng)跟著馬斯克從OpenAI跳到特斯拉，后來(lái)又被OpenAI挖回去的科學(xué)家Andrej Karpathy，將LLaMA2的發(fā)布視為人工智能和大模型發(fā)展過(guò)程中的重要一天，因?yàn)檫@“是任何人都可以拿到模型權(quán)重的最強(qiáng)大語(yǔ)言模型。”

　　一時(shí)間，整個(gè)AI圈對(duì)Meta刮目相看。當(dāng)一批巨頭公司掀起大模型軍備競(jìng)賽，試圖通過(guò)技術(shù)封閉實(shí)現(xiàn)市場(chǎng)壟斷時(shí)，Meta用LLaMA撕開(kāi)了一條口子。OpenAI沒(méi)做的事，Meta做到了。

　　英諾天使基金合伙人王晟戲稱(chēng)楊立昆為“Klaus LeCun”( 楊立昆英文名為Yann LeCun，Klaus Fuchs在二戰(zhàn)期間向蘇聯(lián)提供了曼哈頓計(jì)劃的信息)。王晟開(kāi)玩笑:“不能只讓美國(guó)擁有原子彈。”

　　王晟發(fā)現(xiàn)，ChatGPT出現(xiàn)之后，科技圈對(duì)大模型熱情且迷茫。投資人中很多是看熱鬧，“因?yàn)榈谝豢床欢诙桓彝�，第三投不到。一個(gè)新的技術(shù)范式出現(xiàn)，沒(méi)人知道它的能力邊界在哪里。”

　　王晟對(duì)「定焦」說(shuō)，LLaMA開(kāi)源對(duì)行業(yè)影響很大。“Meta過(guò)去這些年積累的大模型技術(shù)，本來(lái)都是不傳之秘，結(jié)果一開(kāi)源，迅速把很多認(rèn)知拉平了。”

　　之前，國(guó)內(nèi)團(tuán)隊(duì)研發(fā)大模型，只能從零到一不斷試錯(cuò)，一旦有個(gè)點(diǎn)被卡住了，即便從技術(shù)角度來(lái)說(shuō)并不是太難，但靠自己可能也需要花一兩年時(shí)間才能解決，需要親自踩很多坑�，F(xiàn)在Meta直接把它的經(jīng)驗(yàn)和數(shù)據(jù)拿出來(lái)，在思路和方法上給了行業(yè)非常重要的指引。

　　“在這個(gè)過(guò)程中大家學(xué)習(xí)了很多。假如沒(méi)有LLAMA開(kāi)源，國(guó)內(nèi)大模型今天的水平可能會(huì)差很多，我們會(huì)大幅度被人甩下。”王晟說(shuō)。

　　這也是為什么國(guó)內(nèi)一下子突然涌現(xiàn)出200多個(gè)大模型。王小川的百川智能在公司成立僅兩個(gè)月就發(fā)布了一款大模型，其實(shí)就是借鑒了LLaMA。李開(kāi)復(fù)的零一萬(wàn)物推出的大模型，也是使用LLaMA的開(kāi)源模型架構(gòu)。

　　LLaMA開(kāi)源對(duì)OpenAI最直觀的影響，是有一堆中國(guó)公司跳出來(lái)“吊打”GPT。在他們的口徑中，已經(jīng)在多項(xiàng)指標(biāo)上超過(guò)了GPT模型，雖然很多榜單都是刷出來(lái)的。

　　更深層次的影響在于，大模型開(kāi)源社區(qū)的力量快速壯大，全球的程序員都能為開(kāi)源做貢獻(xiàn)。他們開(kāi)發(fā)出各種開(kāi)源數(shù)據(jù)集，迭代出更多新模型，縮小與閉源大模型的差距。所以谷歌的工程師說(shuō)，谷歌沒(méi)有護(hù)城河，OpenAI也沒(méi)有。

　　Meta在科技圈的形象變得高大起來(lái)。回顧Meta的發(fā)展，其實(shí)它一直都有開(kāi)源的傳統(tǒng)。

　　早在2016年，Meta團(tuán)隊(duì)就開(kāi)發(fā)并開(kāi)源了深度學(xué)習(xí)框架PyTorch，它和谷歌的TensorFlow成為深度學(xué)習(xí)領(lǐng)域的兩大主流框架。

　　跟OpenAI現(xiàn)在才開(kāi)始秘密推進(jìn)芯片制造項(xiàng)目不同，Meta在三年前就設(shè)計(jì)了自研AI推理芯片，并采用了開(kāi)源架構(gòu)。

　　在語(yǔ)言翻譯方面它推出了很多開(kāi)源模型，兩年前發(fā)布的NLLB模型是維基百科的翻譯供應(yīng)商之一，2023年發(fā)布的SeamlessM4T可以翻譯近百種語(yǔ)言，同時(shí)它還發(fā)布了全球最大的開(kāi)放多模態(tài)翻譯數(shù)據(jù)集。

　　有研究人員經(jīng)過(guò)對(duì)比認(rèn)為，Meta更傾向于信任、問(wèn)責(zé)制以及通過(guò)開(kāi)源實(shí)現(xiàn)人工智能的民主化。

　　反觀OpenAI，它依然在技術(shù)上保持領(lǐng)先，但拒絕開(kāi)放。

　　“沒(méi)人知道OpenAI進(jìn)展到什么程度了，包括它正在研發(fā)的GPT-5，是不是繼續(xù)用的transformer都是未知數(shù)。現(xiàn)在大家都跟著GPT-3.5的技術(shù)路線在跑，假設(shè)它悄悄變換了方向，那大家就掉坑里了。因?yàn)闆](méi)人知道正確路線是什么。”一位AI公司的創(chuàng)始人說(shuō)。

　　同時(shí)它試圖阻擋競(jìng)爭(zhēng)對(duì)手，以保持自己的先發(fā)優(yōu)勢(shì)。

　　字節(jié)跳動(dòng)在2023年12月被OpenAI停用賬戶(hù)，因?yàn)樗谡{(diào)用OpenAI的API開(kāi)發(fā)自身大語(yǔ)言模型的時(shí)候，違反了OpenAI的服務(wù)條款。有悖商業(yè)倫理的行為肯定是不對(duì)的，但外界由此關(guān)注到OpenAI的商業(yè)條款，它禁止客戶(hù)使用GPT輸出的內(nèi)容開(kāi)發(fā)任何可能會(huì)給OpenAI帶來(lái)競(jìng)爭(zhēng)的AI模型。

　　值得注意的是，微軟也有類(lèi)似條款。它們將商業(yè)上的競(jìng)爭(zhēng)優(yōu)勢(shì)看得很重要。

　　人工智能公司開(kāi)放傳神(OpenCSG)創(chuàng)始人、CEO陳冉認(rèn)為，開(kāi)源的市場(chǎng)空間遠(yuǎn)比閉源大，但未來(lái)一定是開(kāi)源和閉源兩條路同時(shí)走，“OpenAI開(kāi)源不開(kāi)源其實(shí)不重要了。”

　　開(kāi)源閉源，誰(shuí)對(duì)誰(shuí)錯(cuò)?

　　究竟是OpenAI被利益蒙蔽了雙眼，還是Meta大公無(wú)私要為全人類(lèi)做貢獻(xiàn)?

　　或許，它們?cè)诒举|(zhì)上并無(wú)不同。OpenAI既沒(méi)有那么自私，Meta也不像網(wǎng)友鼓吹的那樣高尚，區(qū)別只在于路線和策略。

　　若論對(duì)整個(gè)AI行業(yè)的貢獻(xiàn)，OpenAI毫無(wú)疑問(wèn)是最大的。畢竟，這一輪AI浪潮是由ChatGPT掀起的。它點(diǎn)燃了一把火，加速了大模型的普及。事實(shí)上，前兩年大模型開(kāi)源社區(qū)基本是圍著GPT-3在轉(zhuǎn)。

　　OpenAI不像谷歌、Meta那些巨頭擁有雄厚的資金積累，早年大佬捐贈(zèng)的資金早花得差不多了，沒(méi)錢(qián)是做不了研發(fā)的，總不能用愛(ài)發(fā)電。所以O(shè)penAI抱了微軟的大腿，奧爾特曼想盡辦法為OpenAI賺錢(qián)。

　　陳冉認(rèn)為，OpenAI的成功其實(shí)是商業(yè)模式的成功，本質(zhì)是投資人看到了巨大的商業(yè)價(jià)值和盈利模式。開(kāi)源與閉源之間的競(jìng)爭(zhēng)方向一定是掙錢(qián)模式的創(chuàng)新競(jìng)爭(zhēng)。

　　Meta將技術(shù)開(kāi)源，也不是只為他人做嫁衣。開(kāi)源是一種策略，能吸引更多開(kāi)發(fā)人員免費(fèi)幫它迭代技術(shù)、修復(fù)漏洞，正所謂眾人拾柴火焰高，但最核心的技術(shù)還是掌握在Meta手里，該打擊對(duì)手的時(shí)候它不會(huì)手軟。就像谷歌，它旗下的安卓是開(kāi)源系統(tǒng)，但國(guó)內(nèi)手機(jī)廠商做自己的系統(tǒng)還是會(huì)有很多限制。

　　而在大模型火起來(lái)之前，Meta掉進(jìn)了元宇宙的深坑里無(wú)法自拔，砸錢(qián)、虧損、裁員，看不到任何希望。大模型是那根救命稻草，ChatGPT則是照亮前路的那束光。

　　再往深了看，閉源的OpenAI和開(kāi)源的Meta，從根本上對(duì)AI的價(jià)值判斷有分歧。

　　如果將AI比作未來(lái)世界的核武器，OpenAI認(rèn)為它很危險(xiǎn)，得謹(jǐn)慎，不能濫用。Meta則認(rèn)為，核武器不能只掌握在少數(shù)幾個(gè)玩家手里，應(yīng)該開(kāi)放研究。

　　關(guān)于AI的利弊之辯，是科技圈的一個(gè)老話題。馬斯克就相信“AI危險(xiǎn)論”，他擔(dān)心有一天機(jī)器的智力、意識(shí)都超過(guò)了人類(lèi)，可能會(huì)取代人類(lèi)，摧毀人類(lèi)文明。所以他當(dāng)年?duì)款^成立OpenAI，只是后來(lái)OpenAI沒(méi)按他設(shè)想的路徑走。

　　基于“防止AI取代人類(lèi)”的愿景，行業(yè)里又延伸出兩大派別。一派認(rèn)為大量獨(dú)立的AI系統(tǒng)比由大公司控制的少量AI系統(tǒng)更安全，AI的研究應(yīng)該開(kāi)源開(kāi)放;另一派認(rèn)為應(yīng)該封閉研究，這可以減輕安全風(fēng)險(xiǎn)，防止不法分子濫用獲得的代碼。

　　OpenAI屬于后者。支持它的人認(rèn)為開(kāi)源策略加大了風(fēng)險(xiǎn)，比如倫敦一家AI公司的CEO就認(rèn)為，Meta是最不負(fù)責(zé)任的人工智能參與者，他問(wèn):“我們應(yīng)該令核武器的設(shè)計(jì)透明化嗎?”

　　Meta將開(kāi)源視為最優(yōu)策略，楊立昆就認(rèn)為，機(jī)器最終會(huì)比人類(lèi)更聰明，人類(lèi)無(wú)法阻止壞人獲取它，AI必須是開(kāi)源的，只有讓更多人參與其中，最終開(kāi)發(fā)出的系統(tǒng)才會(huì)更安全。他認(rèn)為馬斯克的AI威脅論就是科幻小說(shuō)看多了。

　　楊立昆曾經(jīng)的合作伙伴，跟他一塊獲得圖靈獎(jiǎng)的杰弗里·辛頓，則持有不同觀點(diǎn)，認(rèn)為AI將對(duì)人類(lèi)構(gòu)成嚴(yán)重威脅。他的思想也許對(duì)他的學(xué)生伊利亞造成了影響。伊利亞是OpenAI的聯(lián)合創(chuàng)始人兼首席科學(xué)家，幾乎決定了OpenAI的技術(shù)路線，他也是OpenAI宮斗事件中開(kāi)除奧爾特曼的關(guān)鍵人物。伊利亞一直致力于追求安全可靠的AGI。業(yè)內(nèi)普遍認(rèn)為，商業(yè)化和AGI的路線之爭(zhēng)，引發(fā)了那場(chǎng)沖突。

　　所以，OpenAI和Meta有不同的信念。OpenAI將AGI視為終極目標(biāo)，并且相信自己將會(huì)第一個(gè)實(shí)現(xiàn)它;Meta將開(kāi)放平臺(tái)視為最好的路徑，試圖制定開(kāi)源標(biāo)準(zhǔn)。當(dāng)然，它們都希望在這個(gè)過(guò)程里拿到應(yīng)得的商業(yè)利益。

　　往長(zhǎng)遠(yuǎn)看，AI的發(fā)展是螺旋式上升的，開(kāi)源也好，閉源也罷，都將為其注入動(dòng)能。究竟誰(shuí)是真的在為全人類(lèi)的未來(lái)操心，只有等待時(shí)間檢驗(yàn)了。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信