正在逐步覆蓋!騰訊提醒勿為實(shí)況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機(jī)型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛(ài)“湊熱鬧”,但東軟集團(tuán)喜歡“追風(fēng)口”快手電商新增近800個(gè)“0元開(kāi)店”類(lèi)目,推出多項(xiàng)新商入駐權(quán)益年內(nèi)狂攬五項(xiàng)第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報(bào)到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線(xiàn)阿里云盤(pán)出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢(shì)也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級(jí),核心場(chǎng)景性能提升超20%屏幕面板 10 月出貨,蘋(píng)果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋(píng)果史上最大:iPhone 16系列電池容量公布后移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)App兼容測(cè)試持續(xù)占據(jù)核心地位歐盟警告蘋(píng)果:六個(gè)月內(nèi)開(kāi)放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實(shí)現(xiàn)營(yíng)收5970億元,同比增長(zhǎng)13.53%傳三星計(jì)劃2025年推出卷軸屏手機(jī)蘋(píng)果新專(zhuān)利探索折疊iPhone未來(lái),任意表面實(shí)現(xiàn)觸敏控制蘋(píng)果iPhone16/Pro系列手機(jī)今日首銷(xiāo),5999~9999元起各方媒體的聚焦關(guān)注,中南高科實(shí)力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開(kāi)了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    谷歌大殺器終于來(lái)了,最大規(guī)模Gemini震撼發(fā)布:真超GPT4,三大版本,手機(jī)直接可用

    2023年12月07日 16:33:22   來(lái)源:微信公眾號(hào) 機(jī)器之心

      本文來(lái)自于微信公眾號(hào) 機(jī)器之心(ID:almosthuman2014),作者:機(jī)器之心。

      時(shí)代變了?

      迄今為止規(guī)模最大,能力最強(qiáng)的谷歌大模型來(lái)了。

      當(dāng)?shù)貢r(shí)間12月6日,谷歌 CEO 桑達(dá)爾・皮查伊官宣Gemini1.0版正式上線(xiàn)。

      這次發(fā)布的 Gemini 大模型是原生多模態(tài)大模型,是谷歌大模型新時(shí)代的第一步,它包括三種量級(jí):能力最強(qiáng)的 Gemini Ultra,適用于多任務(wù)的 Gemini Pro 以及適用于特定任務(wù)和端側(cè)的 Gemini Nano。

      現(xiàn)在,谷歌的類(lèi) ChatGPT 應(yīng)用 Bard 已經(jīng)升級(jí)到了 Gemini Pro 版本,實(shí)現(xiàn)了更為高級(jí)的推理、規(guī)劃、理解等能力,同時(shí)繼續(xù)保持免費(fèi)。谷歌預(yù)計(jì)在明年初將推出「Bard Advanced」,其將使用 Gemini Ultra。

      這是 Bard 問(wèn)世以來(lái)最大的更新。

      自 ChatGPT 發(fā)布以來(lái),我們一直對(duì)谷歌聲稱(chēng)的競(jìng)品 Gemini 模型的能力非常好奇,這款大模型早在今年3月就有了風(fēng)聲,5月的 I/O 大會(huì)上進(jìn)入「即將推出」的狀態(tài)。

      隨著知情人士不斷透露新信息,我們能了解到:據(jù)說(shuō) Gemini 有萬(wàn)億參數(shù),訓(xùn)練動(dòng)用的算力是 GPT-4的五倍。但 Gemini 的正式發(fā)布卻似乎因?yàn)楦鞣N原因而屢遭推遲。

      為了與 OpenAI 和微軟展開(kāi)競(jìng)爭(zhēng),谷歌果斷從 PaLM2切換到了 Gemini 上,甚至在今年4月份直接把谷歌大腦(Google Brain)和 DeepMind 合并在了一起,Gemini 就由新組成的 Google DeepMind 匯合兩個(gè)實(shí)驗(yàn)室的力量進(jìn)行攻關(guān)。

      可見(jiàn)谷歌在大模型軍備競(jìng)賽上孤注一擲的心態(tài)。

      那么,Gemini 真的能夠給我們帶來(lái)驚喜嗎?除了在各種 Benchmark 上拿到最優(yōu)成績(jī),甚至超越人類(lèi)以外,有趣的是,在新聞發(fā)布會(huì)上,面對(duì)記者有關(guān)「Gemini 相比以前的大模型有哪些新能力」的提問(wèn),Google DeepMind 產(chǎn)品副總裁 Eli Collins 回答說(shuō):「我懷疑有」,表示谷歌仍然在努力了解 Gemini Ultra 的全部能力。

      以下為谷歌 CEO 皮查伊的聲明:

      每一次技術(shù)變革都是推進(jìn)科學(xué)發(fā)現(xiàn)、加速人類(lèi)進(jìn)步和改善生活的機(jī)會(huì)。我相信我們現(xiàn)在所看到的人工智能轉(zhuǎn)變將是我們一生中最深刻的轉(zhuǎn)變,遠(yuǎn)遠(yuǎn)大于之前向移動(dòng)或網(wǎng)絡(luò)的轉(zhuǎn)變。人工智能有潛力為世界各地的人們創(chuàng)造從日常生活到非凡的機(jī)會(huì)。它將帶來(lái)新一波的創(chuàng)新和經(jīng)濟(jì)進(jìn)步,并以前所未有的規(guī)模推動(dòng)知識(shí)、學(xué)習(xí)、創(chuàng)造力和生產(chǎn)力。

      這讓我感到興奮:有機(jī)會(huì)讓人工智能為世界各地的每個(gè)人提供幫助。

      作為一家人工智能優(yōu)先的公司,我們已經(jīng)走過(guò)了近八年的歷程,進(jìn)步的步伐只會(huì)不斷加快:數(shù)百萬(wàn)人現(xiàn)在在我們的產(chǎn)品中使用生成式人工智能來(lái)完成一年前無(wú)法完成的事情,從尋找答案到更復(fù)雜的問(wèn)題使用新工具進(jìn)行協(xié)作和創(chuàng)造的問(wèn)題。與此同時(shí),開(kāi)發(fā)人員正在使用我們的模型和基礎(chǔ)設(shè)施來(lái)構(gòu)建新的生成式人工智能應(yīng)用程序,世界各地的初創(chuàng)公司和企業(yè)正在利用我們的人工智能工具不斷成長(zhǎng)。

      這是令人難以置信的勢(shì)頭,然而,我們才剛剛開(kāi)始觸及可能性的表面。

      我們正在大膽而負(fù)責(zé)任地開(kāi)展這項(xiàng)工作。這意味著我們的研究要雄心勃勃,追求能夠?yàn)槿祟?lèi)和社會(huì)帶來(lái)巨大利益的能力,同時(shí)建立保障措施并與政府和專(zhuān)家合作,應(yīng)對(duì)人工智能變得更加強(qiáng)大的風(fēng)險(xiǎn)。我們將繼續(xù)投資最好的工具、基礎(chǔ)模型和基礎(chǔ)設(shè)施,并在我們的人工智能原則的指導(dǎo)下將它們引入我們的產(chǎn)品和其他產(chǎn)品中。

      谷歌大模型 Gemini 正式發(fā)布

      谷歌 DeepMind CEO 和聯(lián)合創(chuàng)始人 Demis Hassabis 代表 Gemini 團(tuán)隊(duì)正式推出了大模型 Gemini。

      Hassabis 表示長(zhǎng)久以來(lái),谷歌一直想要建立新一代的 AI 大模型。在他看來(lái),AI 帶給人們的不再只是智能軟件,而是更有用、更直觀的專(zhuān)家助手或助理。

      今天,谷歌大模型 Gemini 終于亮相了,成為其有史以來(lái)打造的最強(qiáng)大、最通用的模型。Gemini 是谷歌各個(gè)團(tuán)隊(duì)大規(guī)模合作的成果,包括谷歌研究院的研究者。

      特別值得關(guān)注的是,Gemini 是一個(gè)多模態(tài)大模型,意味著它可以泛化并無(wú)縫地理解、操作和組合不同類(lèi)型的信息,包括文本、代碼、音頻、圖像和視頻。

      谷歌表示,Gemini 還是他們迄今為止最靈活的模型,能夠高效地運(yùn)行在數(shù)據(jù)中心和移動(dòng)設(shè)備等多類(lèi)型平臺(tái)上。Gemini 提供的 SOTA 能力將顯著增強(qiáng)開(kāi)發(fā)人員和企業(yè)客戶(hù)構(gòu)建和擴(kuò)展 AI 的方式。

      目前,Gemini1.0提供了三個(gè)不同的尺寸版本,分別如下:

      Gemini Ultra:規(guī)模最大、能力最強(qiáng),用于處理高度復(fù)雜的任務(wù);

      Gemini Pro:在各種任務(wù)上擴(kuò)展的最佳模型;

      Gemini Nano:用于端側(cè)(on-device)任務(wù)的最高效模型。

      谷歌對(duì) Gemini 模型進(jìn)行了嚴(yán)格的測(cè)試,并評(píng)估了它們?cè)诟鞣N任務(wù)中的表現(xiàn)。從自然圖像、音頻和視頻理解,到數(shù)學(xué)推理等任務(wù),Gemini Ultra 在大型語(yǔ)言模型研發(fā)被廣泛使用的32個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試集中,在其中30個(gè)測(cè)試集的性能超過(guò)當(dāng)前 SOTA 結(jié)果。

      另外,Gemini Ultra 在 MMLU(大規(guī)模多任務(wù)語(yǔ)言理解數(shù)據(jù)集)中的得分率高達(dá)90.0%,首次超越了人類(lèi)專(zhuān)家。MMLU 數(shù)據(jù)集包含數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個(gè)科目,用于測(cè)試大模型的知識(shí)儲(chǔ)備和解決問(wèn)題能力。

      針對(duì) MMLU 測(cè)試集的新方法使得 Gemini 能夠在回答難題之前利用其推理能力進(jìn)行更仔細(xì)的思考,相比僅僅根據(jù)問(wèn)題的第一印象作答,Gemini 的表現(xiàn)有顯著改進(jìn)。

      在大多數(shù)基準(zhǔn)測(cè)試中,Gemini 的性能都超越了 GPT-4。

      更多細(xì)節(jié),請(qǐng)查看詳細(xì)的測(cè)試報(bào)告:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

      在最新版本的 MMMU 測(cè)試集中,Gemini Ultra 也取得了得分為59.4% 的最佳成績(jī)。增強(qiáng)版的測(cè)試集由需要慎重推理的多模態(tài)任務(wù)組成。

      在圖像基準(zhǔn)方面的測(cè)試中,Gemini Ultra 不需要從圖像中提取文本就能進(jìn)行 OCR 處理,這凸顯了 Gemin 內(nèi)置的強(qiáng)大多模態(tài)能力,也初步顯示了 Gemini 具有更復(fù)雜推理能力的先兆。

      下一代全方位能力升級(jí)

      Gemini 在設(shè)計(jì)時(shí)原生地支持多模態(tài),從一開(kāi)始便在不同模態(tài)上進(jìn)行了預(yù)訓(xùn)練,然后利用額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào)以提升有效性。因此,Gemini 能夠無(wú)縫地理解和推理各種輸入,遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有多模態(tài)模型,并且它的能力在幾乎每個(gè)領(lǐng)域都是最強(qiáng)的。

      復(fù)雜推理能力

      Gemini1.0具有復(fù)雜多模態(tài)推理能力,可以幫助理解復(fù)雜的書(shū)面和視覺(jué)信息。這使得它尤其擅長(zhǎng)發(fā)現(xiàn)海量數(shù)據(jù)中難以辨別的知識(shí)。Gemini1.0通過(guò)閱讀、過(guò)濾和理解信息具有了從數(shù)十萬(wàn)份文件中提取 insights 的超凡能力,這有助于科學(xué)、金融等諸多領(lǐng)域以超快的速度取得新突破。

      同時(shí)理解文字、圖像、音頻以及更多模態(tài)的信息

      經(jīng)過(guò)訓(xùn)練,Gemini1.0可以同時(shí)識(shí)別和理解文本、圖像、音頻等,因此它能夠更全面地理解輸入中信息的細(xì)節(jié),也能回答與復(fù)雜主題相關(guān)的問(wèn)題。因此,它特別擅長(zhǎng)對(duì)數(shù)學(xué)和物理等復(fù)雜學(xué)科的問(wèn)題進(jìn)行推理。

      如下圖所示,一位老師畫(huà)了一個(gè)滑雪者從斜坡上下來(lái)的物理問(wèn)題,而一位學(xué)生則提出了一個(gè)解決方案來(lái)計(jì)算滑雪者在斜坡底部的速度。利用Gemini的多模態(tài)推理能力,該模型能夠讀懂凌亂的筆跡,正確理解問(wèn)題的表述,將問(wèn)題和解決方案都轉(zhuǎn)換為數(shù)學(xué)公式,識(shí)別出學(xué)生在解決問(wèn)題時(shí)出錯(cuò)的具體推理步驟,然后給出問(wèn)題的正確解決方案。

      高級(jí)編碼

      Gemini 可以理解、解釋和生成流行編程語(yǔ)言(如 Python、Java、C++、Go)的高質(zhì)量代碼,具備強(qiáng)大的跨語(yǔ)言工作和推理復(fù)雜信息的能力使其成為世界領(lǐng)先的編碼基礎(chǔ)模型之一。

      Gemini Ultra 在多個(gè)編碼基準(zhǔn)測(cè)試中表現(xiàn)出色,包括 HumanEval(用于評(píng)估編碼任務(wù)性能的重要行業(yè)標(biāo)準(zhǔn))和 Natural2Code(谷歌內(nèi)部數(shù)據(jù)集),該數(shù)據(jù)集使用作者生成的源代碼而不是基于網(wǎng)絡(luò)的信息。

      Gemini 還可以用作更高級(jí)編碼系統(tǒng)的引擎。兩年前,谷歌推出了 AlphaCode,這是第一個(gè)在編程競(jìng)賽中達(dá)到競(jìng)爭(zhēng)性水平的人工智能代碼生成系統(tǒng)。

      使用 Gemini 的專(zhuān)門(mén)版本,谷歌創(chuàng)建了更先進(jìn)的代碼生成系統(tǒng) AlphaCode2,它擅長(zhǎng)解決超出編碼范圍、涉及復(fù)雜數(shù)學(xué)和理論計(jì)算機(jī)科學(xué)的競(jìng)爭(zhēng)性編程問(wèn)題。

      經(jīng)過(guò)與原始 AlphaCode 在相同平臺(tái)上進(jìn)行評(píng)估,AlphaCode2展現(xiàn)出巨大的改進(jìn),解決的問(wèn)題數(shù)量幾乎是原來(lái)的兩倍。

      專(zhuān)用 TPU 訓(xùn)練

      谷歌使用內(nèi)部設(shè)計(jì)的張量處理單元 (TPU) v4和 v5e 在人工智能優(yōu)化基礎(chǔ)設(shè)施上對(duì) Gemini1.0進(jìn)行了大規(guī)模訓(xùn)練,并將其設(shè)計(jì)為最可靠、可擴(kuò)展的訓(xùn)練模型和最高效的服務(wù)模型。

      在 TPU 上,Gemini 的運(yùn)行速度明顯快于早期規(guī)模較小、能力較弱的模型。這些定制設(shè)計(jì)的 AI 加速器是谷歌人工智能產(chǎn)品的核心,這些產(chǎn)品為搜索、YouTube、Gmail、谷歌地圖、Google Play 和 Android 等數(shù)十億用戶(hù)提供服務(wù)。它們還幫助世界各地的公司經(jīng)濟(jì)高效地訓(xùn)練大規(guī)模人工智能模型。

      今天,谷歌同時(shí)發(fā)布了迄今為止最強(qiáng)大、最高效、可擴(kuò)展的 TPU 系統(tǒng) —Cloud TPU v5p,專(zhuān)為訓(xùn)練尖端的人工智能模型而設(shè)計(jì)。新一代 TPU 將加速 Gemini 的發(fā)展,幫助開(kāi)發(fā)人員和企業(yè)客戶(hù)更快地訓(xùn)練大規(guī)模生成式 AI 模型,讓新產(chǎn)品和新功能更快地與客戶(hù)見(jiàn)面。

      Google 數(shù)據(jù)中心內(nèi)的一排 Cloud TPU v5p AI 加速器超級(jí)計(jì)算機(jī)。

      谷歌旗下產(chǎn)品將全線(xiàn)升級(jí)

      從今天開(kāi)始,谷歌將在其產(chǎn)品中添加 Gemini,例如 Bard 將使用 Gemini Pro 的微調(diào)版本來(lái)執(zhí)行更高級(jí)的推理、規(guī)劃、理解等任務(wù)。這也是 Bard 自推出以來(lái)最大的升級(jí)。

      升級(jí)版 Bard 將在170多個(gè)國(guó)家 / 地區(qū)提供英語(yǔ)版本,并且在不久的將來(lái)會(huì)擴(kuò)展到更多模態(tài),并支持更多種語(yǔ)言。

      谷歌還將 Gemini 引入了 Pixel。Pixel8Pro 將是第一款運(yùn)行 Gemini Nano 的智能手機(jī)。

      Pixel8Pro 在錄音機(jī)應(yīng)用中使用 Gemini Nano 來(lái)總結(jié)會(huì)議音頻,即使沒(méi)有網(wǎng)絡(luò)連接也可以實(shí)現(xiàn)。

      在接下來(lái)的幾個(gè)月中,Gemini 將陸續(xù)出現(xiàn)在谷歌更多的產(chǎn)品和服務(wù)中,包括搜索、廣告、Chrome、Duet AI 等等。

      谷歌表示其已經(jīng)在搜索中試驗(yàn)了 Gemini,它使用戶(hù)的搜索生成體驗(yàn) (SGE) 速度更快,延遲減少了40%,同時(shí)質(zhì)量也得到了提升。

      使用指南及未來(lái)規(guī)劃

      最后,開(kāi)發(fā)者如何使用 Gemini?

      從12月13日開(kāi)始,開(kāi)發(fā)人員和企業(yè)客戶(hù)可以通過(guò) Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 訪(fǎng)問(wèn) Gemini Pro。

      從 Pixel8Pro 設(shè)備開(kāi)始,Android 開(kāi)發(fā)人員還可以通過(guò) AICore 使用 Gemini Nano 進(jìn)行構(gòu)建。Android AICore 是 Android14中的一項(xiàng)新系統(tǒng)服務(wù),可處理模型管理、運(yùn)行時(shí)、安全功能等,簡(jiǎn)化用戶(hù)將 AI 融入應(yīng)用程序的工作。

      AICore 通過(guò) Gemini Nano 實(shí)現(xiàn)低秩適應(yīng) (LoRA) 微調(diào)。這個(gè)強(qiáng)大的概念使應(yīng)用程序的開(kāi)發(fā)人員能夠根據(jù)自己的訓(xùn)練數(shù)據(jù)創(chuàng)建小型 LoRA 適配器。LoRA 適配器由 AICore 加載,從而產(chǎn)生針對(duì)應(yīng)用程序自身用例進(jìn)行微調(diào)的大型語(yǔ)言模型。

      另外,谷歌劇透了 Gemini Ultra 將會(huì)在不久后發(fā)布,以及 Bard 的下一步升級(jí)計(jì)劃。

      Gemini Ultra 模型目前正處于信任和安全檢查階段,包括由可信賴(lài)的外部各方組成的紅隊(duì)(red team),并使用微調(diào)和人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)進(jìn)一步完善模型。

      在這個(gè)過(guò)程中,谷歌會(huì)先向部分客戶(hù)、開(kāi)發(fā)人員、合作伙伴以及安全和責(zé)任專(zhuān)家提供 Gemini Ultra,供其進(jìn)行早期實(shí)驗(yàn)和反饋,然后在明年初向開(kāi)發(fā)人員和企業(yè)客戶(hù)推出。

      Gemini Ultra 是谷歌最大、功能最強(qiáng)大的模型,專(zhuān)為高度復(fù)雜的任務(wù)而設(shè)計(jì)。普通用戶(hù)體驗(yàn) Gemini Ultra 的首個(gè)方式會(huì)是通過(guò) Bard Advanced,谷歌將在明年年初推出 Bard Advanced。

      谷歌表示,未來(lái)將努力擴(kuò)展 Gemini 的功能,包括在規(guī)劃和記憶方面的進(jìn)步,以及增加上下文窗口以處理更多信息,從而做出更好的響應(yīng)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。