拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資植物生長好幫手:廣明源金線蓮組培燈照亮生長每一步ROG純白系列DIY好物:簡約不失高雅,買它準(zhǔn)沒錯!穩(wěn)扎穩(wěn)打,中影光峰4K 14米 VLED LED電影屏通過DCI認(rèn)證并投入市場安吉爾空間大師亮相IFA 斬獲年度創(chuàng)新產(chǎn)品成果大獎電動自行車強(qiáng)制性“國標(biāo)”再修訂,綠源電動車以創(chuàng)新技術(shù)引領(lǐng)產(chǎn)業(yè)高質(zhì)量發(fā)展輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對承壓的小家電市場,小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場總結(jié):規(guī)模下探,結(jié)構(gòu)降級,空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢待發(fā)云天勵飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革
  • 首頁 > 云計算頻道 > 大模型

    谷歌DeepMind聯(lián)手復(fù)仇,Jeff Dean、Hassabis萬字長文總結(jié)2023絕地反擊

    2023年12月25日 11:11:02   來源:新智元公眾號

      剛剛,谷歌DeepMind首席科學(xué)家Jeff Dean,首席執(zhí)行官Demis Hassabis兩大佬聯(lián)手發(fā)布了2023人工智能領(lǐng)域超權(quán)威的谷歌年度研究總結(jié)。

      Google DeepMind,交卷!

      剛剛,Jeff Dean和Hassabis聯(lián)手發(fā)文,一同回顧了Google Research和Google DeepMind在2023年的全部成果。

      這一年開年,比起風(fēng)靡全球的ChatGPT,谷歌看上去輸慘了。當(dāng)時,數(shù)不清的資本熱錢向著OpenA流去,OpenAI的市值、知名度瞬間飆至前所未有的高度。

      4月,陷入被動的谷歌放出終極大殺招:谷歌大腦和DeepMind正式合并!「王不見王」的兩大部門驚人合體,Jeff Dean和Hassabis終于聯(lián)手。

      5月,谷歌在I/O大會上一雪前恥。全新的PaLM2反超GPT-4,辦公全家桶炸裂升級,Bard直接史詩級進(jìn)化。

      12月,谷歌深夜放出了復(fù)仇殺器Gemini,最強(qiáng)原生多模態(tài)直接碾壓了GPT-4。雖然在產(chǎn)品demo上有加工制作的成分,但不可否認(rèn),谷歌已經(jīng)把全世界的多模態(tài)研究推至前所未有的高度。

      讓我們看一看,谷歌的諸位神人們是怎樣團(tuán)結(jié)在一起,打響23年的復(fù)仇之戰(zhàn)的。

      產(chǎn)品和技術(shù)的進(jìn)步

      這一年,生成式AI正式進(jìn)入了大爆發(fā)。

      2月,谷歌緊急推出了Bard,慢于OpenAI兩個月推出了自己的AI聊天機(jī)器人。

      5月,谷歌在I/O大會上宣布了積累數(shù)月和數(shù)年的研究和成果,包括語言模型PaLM2。它整合了計算優(yōu)化擴(kuò)展、改進(jìn)的數(shù)據(jù)集組合和模型架構(gòu),即使在很高級的推理任務(wù)中,表現(xiàn)也很出色。

      針對不同目的對PaLM2進(jìn)行微調(diào)和指令調(diào)整后,谷歌將其集成到了眾多Google產(chǎn)品和功能中,包括:

      1. Bard

      現(xiàn)在,Bard能支持40多種語言和230多個國家和地區(qū),在日常使用的Google工具(如Gmail、Google地圖、YouTube)中,都可以使用Bard查找信息。

      2. 搜索生成體驗(SGE)

      它用LLM重新構(gòu)想如何組織信息以及如何幫用戶瀏覽信息,為谷歌的核心搜索產(chǎn)品創(chuàng)建了更流暢的對話式交互模型。

      3. MusicLM

      這個由AudioLM和MuLAN提供支持的文本到音樂模型,可以從文本、哼唱、圖像或視頻、音樂伴奏、歌曲中制作音樂。

      4. Duet AI

      Google Workspace中的Duet AI可以幫助用戶創(chuàng)作文字、創(chuàng)建圖像、分析電子表格、起草和總結(jié)電子郵件和聊天消息,總結(jié)會議等。Google Cloud中的Duet AI可以幫助用戶編寫、部署、擴(kuò)展和監(jiān)控應(yīng)用,以及識別和解決網(wǎng)絡(luò)安全威脅。

      繼去年發(fā)布文本到圖像生成模型Imagen之后,今年6月,谷歌又發(fā)布了Imagen Editor,它提供了使用區(qū)域掩碼和自然語言提示編輯生成圖像的功能,從而對模型輸出進(jìn)行更精確的控制。

      隨后,谷歌又發(fā)布了Imagen2,它通過專門的圖像美學(xué)模型改進(jìn)了輸出,這個圖像美學(xué)模型參考了人類對良好照明、取景、曝光和清晰度的偏好。

      10月,谷歌推出了Google搜索的一項新功能,幫助用戶練習(xí)口語、提高語言技能。

      實現(xiàn)這一功能的關(guān)鍵技術(shù),就是和谷歌翻譯團(tuán)隊合作開發(fā)的一種全新深度學(xué)習(xí)模型,名為Deep Aligner。

      與基于隱馬爾可夫模型(HMM)的對齊方法相比,這個單一的新模型極大提高了所有測試語言對的對齊質(zhì)量,將平均對齊錯誤率從25%降低到5%。

      11月,谷歌與YouTube合作發(fā)布了Lyria,這是谷歌迄今為止最先進(jìn)的AI音樂生成模型。

      12月,谷歌推出了Gemini,這是谷歌最強(qiáng)大、最通用的AI模型。

      從一開始,Gemini就被構(gòu)建為跨文本、音頻、圖像和視頻的多模態(tài)模型。

      Gemini有三種不同尺寸,Nano、Pro和Ultra。Nano是最小、最高效的模型,用于為Pixel等產(chǎn)品提供設(shè)備端體驗。Pro模型功能強(qiáng)大,最適合跨任務(wù)擴(kuò)展。Ultra模型是最大、性能最強(qiáng)的模型,適用于高度復(fù)雜的任務(wù)。

      根據(jù)Gemini模型的技術(shù)報告,Gemini Ultra的性能超過了32個廣泛使用的學(xué)術(shù)基準(zhǔn)中的30個最新結(jié)果。

      Gemini Ultra的得分為90.04%,是第一款在MMLU上表現(xiàn)優(yōu)于人類專家的模型,并在新的MMMU基準(zhǔn)測試中獲得了59.4%的最高分。

      在AlphaCode的基礎(chǔ)上,谷歌推出了由Gemini的專用版本支持的AlphaCode2,這是第一個在編程競賽中取得中位數(shù)水平表現(xiàn)的AI系統(tǒng)。

      跟原始AlphaCode相比,AlphaCode2解決的問題為1.7倍以上,表現(xiàn)要優(yōu)于85%的參賽者。

      同時,Gemini Pro模型的加持讓Bard也獲得了大升級,理解、總結(jié)、推理、編碼和計劃能力都大大提高。

      在八項基準(zhǔn)測試中的六項中,Gemini Pro的表現(xiàn)都優(yōu)于GPT-3.5,包括LLM的關(guān)鍵標(biāo)準(zhǔn)之一MMLU和衡量小學(xué)數(shù)學(xué)推理的GSM8K。

      明年初,Gemini Ultra也會引入Bard,屆時必將引發(fā)全新的尖端AI體驗。

      而且,Gemini Pro也可用于Vertex AI,這是Google Cloud的端到端 AI 平臺,使開發(fā)人員能夠構(gòu)建處理文本、代碼、圖像和視頻信息的應(yīng)用程序。

      應(yīng)用程序,可以處理文本、代碼、圖像和視頻信息的應(yīng)用程序。Gemini Pro 也于12月在 AI Studio 中推出。

      可以看到,Gemini能夠做到的事情包括但不限于——

      解鎖科學(xué)文獻(xiàn)中的見解。

      擅長競爭性編程。

      處理和理解原始音頻。

      Gemini可以回答為什么這個菜還沒炒熟:因為雞蛋是生的

      解釋數(shù)學(xué)和物理中的推理。

      了解用戶意圖,提供定制體驗。

      機(jī)器學(xué)習(xí)/人工智能

      除了在產(chǎn)品和技術(shù)方面的進(jìn)步外,這一年谷歌也在機(jī)器學(xué)習(xí)和AI研究的更廣泛領(lǐng)域,取得了許多重要進(jìn)展。

      如今最先進(jìn)的機(jī)器學(xué)習(xí)模型,核心架構(gòu)便是谷歌研究人員在2017年開發(fā)的Transformer架構(gòu)。

      起初,Transformer是為語言而開發(fā)的,但如今,它已被證明在計算機(jī)視覺、音頻、基因組學(xué)、蛋白質(zhì)折疊等各種領(lǐng)域都有極大作用。

      今年谷歌在擴(kuò)展視覺Transformer方面的工作,在各種視覺任務(wù)中都達(dá)到了SOTA,還能用于構(gòu)建功能更強(qiáng)大的機(jī)器人。

      擴(kuò)展模型的多功能性,需要執(zhí)行更高層次和多步驟推理的能力。

      今年,谷歌通過幾個研究接近了這個目標(biāo)。

      例如,算法提示(algorithmic prompting)的新方法,通過演示一系列算法步驟來教語言模型推理,然后模型可以將其應(yīng)用于新的上下文中。

      這種方法將中學(xué)數(shù)學(xué)基準(zhǔn)的準(zhǔn)確率從25.9%提高到了61.1%。

      通過提供算法提示,我們可以通過上下文學(xué)習(xí)來教模型算術(shù)規(guī)則

      在視覺問答領(lǐng)域,谷歌與UC伯克利的研究人員合作,通過將視覺模型與語言模型相結(jié)合,使其更好地回答復(fù)雜的視覺問題——「馬車在馬的右邊嗎?」

      CodeVQA方法的圖示。首先,大語言模型生成一個Python程序,該程序調(diào)用表示問題的可視化函數(shù)。在此示例中,使用簡單的VQA方法來回答問題的一部分,并使用對象定位器來查找所提及對象的位置。然后,程序通過組合這些函數(shù)的輸出來生成原始問題的答案

      其中語言模型被訓(xùn)練為通過合成程序執(zhí)行多步驟推理,來回答視覺問題。

      為了訓(xùn)練用于軟件開發(fā)的大型機(jī)器學(xué)習(xí)模型,谷歌開發(fā)了一個名為DIDACT的通用模型。

      它了解軟件開發(fā)生命周期的方方面面,可以自動生成代碼審查注釋、響應(yīng)代碼審查注釋、為代碼片段提出性能改進(jìn)建議、修復(fù)代碼以響應(yīng)編譯錯誤等等。

      與谷歌地圖團(tuán)隊的多年合作中,谷歌擴(kuò)展了逆強(qiáng)化學(xué)習(xí),并將其應(yīng)用于為超過10億用戶改進(jìn)路線建議的世界級問題。

      使用RHIP逆強(qiáng)化學(xué)習(xí)策略時,Google地圖相對于現(xiàn)有基準(zhǔn)的路線匹配率有所改進(jìn)

      這項工作最終使全球路線匹配率相對提高了16-24%,確保路線更好地符合用戶偏好。

      谷歌也在繼續(xù)研究提高機(jī)器學(xué)習(xí)模型推理性能的技術(shù)。

      在研究神經(jīng)網(wǎng)絡(luò)中剪枝連接的計算友好方法時,團(tuán)隊設(shè)計出一種近似算法,來解決計算上難以解決的最佳子集選擇問題,該算法能夠從圖像分類模型中修剪70%的邊緣,并且仍然保留原始模型的幾乎所有精度。

      原始網(wǎng)絡(luò)與修剪后的網(wǎng)絡(luò)

      在加速設(shè)備端擴(kuò)散模型的過程中,谷歌對注意力機(jī)制、卷積核和操作融合進(jìn)行各種優(yōu)化,以便在設(shè)備上運行高質(zhì)量的圖像生成模型。

      現(xiàn)在只需12秒,就能在智能手機(jī)上生成「被周圍花朵包圍的可愛小狗的逼真高分辨率圖像」。

      移動GPU上的LDM的示例輸出,prompt:「一張可愛的小狗的照片逼真的高分辨率圖像,周圍有花朵」

      語言和多模態(tài)模型的進(jìn)步,也有利于機(jī)器人研究工作。

      谷歌將單獨訓(xùn)練的語言、視覺和機(jī)器人控制模型組合成PaLM-E(一種用于機(jī)器人的具身多模態(tài)模型)和Robotic Transformer2(RT-2)。

      這是一種新穎的視覺-語言-行動(VLA) 模型,它從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識轉(zhuǎn)化為機(jī)器人控制的通用指令。

      RT-2架構(gòu)和訓(xùn)練:在機(jī)器人和網(wǎng)絡(luò)數(shù)據(jù)上共同微調(diào)預(yù)訓(xùn)練的視覺語言模型。生成的模型接收機(jī)器人攝像頭圖像,并直接預(yù)測機(jī)器人要執(zhí)行的動作

      此外,谷歌還研究了使用語言來控制四足機(jī)器人的步態(tài)。

      SayTap使用腳部接觸模式(例如,插圖中每只腳的0和1序列,其中0表示空中的腳,1表示地面的腳)作為橋接自然語言用戶命令和低級控制命令的接口。通過基于強(qiáng)化學(xué)習(xí)的運動控制器,SayTap允許四足機(jī)器人接受簡單直接的指令(例如,「緩慢向前小跑」)以及模糊的用戶命令(例如,「好消息,我們這個周末要去野餐!」),并做出相應(yīng)的反應(yīng)

      同時探索了通過使用語言來幫助制定更明確的獎勵函數(shù),以彌合人類語言和機(jī)器人動作之間的差距。

      語言到獎勵系統(tǒng)由兩個核心組件組成:(1) 獎勵翻譯器和 (2) 運動控制器。Reward Translator將來自用戶的自然語言指令映射到表示為python代碼的獎勵函數(shù)。運動控制器使用后退水平優(yōu)化來優(yōu)化給定的獎勵函數(shù),以找到最佳的低級機(jī)器人動作,例如應(yīng)施加到每個機(jī)器人電機(jī)的扭矩量。

      由于預(yù)訓(xùn)練數(shù)據(jù)集中缺乏數(shù)據(jù),LLM無法直接生成低級機(jī)器人動作。團(tuán)隊建議使用獎勵函數(shù)來彌合語言和低級機(jī)器人動作之間的差距,并從自然語言指令中實現(xiàn)新穎的復(fù)雜機(jī)器人運動

      在Barkour中,團(tuán)隊對四足機(jī)器人的敏捷性極限進(jìn)行了基準(zhǔn)測試。

      幾位狗狗被邀請來參與障礙賽,結(jié)果顯示:小型犬能在約10秒內(nèi)完成障礙賽,機(jī)器狗一般要花20秒左右

      算法與優(yōu)化

      設(shè)計高效、穩(wěn)健和可擴(kuò)展的算法始終是谷歌研究的重點。

      最為重磅的成果之一,便是打破了十年算法瓶頸的AlphaDev。

      它的創(chuàng)新意義在于,AlphaDev并不是通過改進(jìn)現(xiàn)有算法,而是利用強(qiáng)化學(xué)習(xí)完全從頭開始發(fā)現(xiàn)了更快的算法。

      結(jié)果顯示,AlphaDev發(fā)現(xiàn)新的排序算法,為LLVM libc++排序庫帶來了明顯的改進(jìn)。對于較短的序列,速度提高了70%,而對于超過250,000個元素的序列,速度提高了約1.7%。

      現(xiàn)在,這個算法已經(jīng)成為兩個標(biāo)準(zhǔn)C++編碼庫的一部分,每天都會被全球的程序員使用數(shù)萬億次。

      為了更好地評估大型程序的執(zhí)行性能,谷歌開發(fā)了可以用來預(yù)測大型圖(large graphs)特性的全新算法,并配合發(fā)布了全新的數(shù)據(jù)集TPUGraphs。

      TPUGraphs數(shù)據(jù)集包含4400萬個用于機(jī)器學(xué)習(xí)程序優(yōu)化的圖

      此外,谷歌還提出了一種新的負(fù)載均衡算法——Prequal,它能夠在分配服務(wù)器查詢時,顯著節(jié)約CPU資源、減少響應(yīng)時間和內(nèi)存使用。

      谷歌通過開發(fā)新的計算最小割、近似相關(guān)聚類和大規(guī)模并行圖聚類技術(shù),改進(jìn)了聚類和圖算法的SOTA。

      其中包括,專為擁有萬億條邊的圖設(shè)計的新型分層聚類算法TeraHAC;可以同時實現(xiàn)高質(zhì)量和高可擴(kuò)展性的文本聚類算法KwikBucks;以及用于近似多嵌入模型標(biāo)準(zhǔn)相似函數(shù)Chamfer Distance的高效算法,與高度優(yōu)化的精確算法相比,該算法的速度提高了50倍以上,并可擴(kuò)展至數(shù)十億個點。

      此外,谷歌還對大規(guī)模嵌入模型 (LEMs) 了進(jìn)行優(yōu)化。

      其中包括,統(tǒng)一嵌入 (Unified Embedding),它在大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)中提供了經(jīng)過實戰(zhàn)測試的特征表示,以及序列注意力 (Sequential Attention) 機(jī)制,它在模型訓(xùn)練過程中可以發(fā)現(xiàn)高效的稀疏模型結(jié)構(gòu)。

      科學(xué)與社會

      在不遠(yuǎn)的將來,AI在科學(xué)研究中的應(yīng)用,有望將某些領(lǐng)域的發(fā)現(xiàn)速度提升10倍、100倍甚至更多。

      從而推動生物工程、材料科學(xué)、天氣預(yù)測、氣候預(yù)報、神經(jīng)科學(xué)、遺傳醫(yī)學(xué)和醫(yī)療保健等眾多領(lǐng)域取得重大突破。

      氣候與可持續(xù)性

      在對飛機(jī)尾流 (contrails) 的研究中,谷歌通過分析大量天氣數(shù)據(jù)、歷史衛(wèi)星圖像和以往的飛行記錄,訓(xùn)練了一個能夠預(yù)測飛機(jī)尾流的形成區(qū)域,并據(jù)此調(diào)整航線的AI模型。結(jié)果顯示,這一系統(tǒng)可以將飛機(jī)尾流減少54%。

      為了幫助抵御氣候變化帶來的種種挑戰(zhàn),谷歌一直致力于開發(fā)全新的技術(shù)方法。

      舉例來說,谷歌的洪水預(yù)報服務(wù)目前已經(jīng)覆蓋了80個國家,能夠直接影響超過4.6億人口。

      此外,谷歌在天氣預(yù)測模型的開發(fā)上也有了最新的進(jìn)展。

      在MetNet和MetNet-2的基礎(chǔ)上,谷歌打造了更強(qiáng)的MetNet-3,可以在長達(dá)24小時的時間范圍內(nèi),實現(xiàn)超越傳統(tǒng)數(shù)值天氣模擬的效果。

      在中期天氣預(yù)報領(lǐng)域,全新AI模型GraphCast可在1分鐘內(nèi),精準(zhǔn)預(yù)測10天全球天氣,甚至還可以預(yù)測極端天氣事件。

      研究發(fā)現(xiàn),與行業(yè)黃金標(biāo)準(zhǔn)天氣模擬系統(tǒng)——高分辨率預(yù)報(HRES)相比,GraphCast在1380個測試變量中準(zhǔn)確預(yù)測超過90%。

      而且,GraphCast還能比傳統(tǒng)預(yù)報模型更早地識別出惡劣天氣事件——提前3天預(yù)測出未來氣旋的潛在路徑。

      值得一提的是,GraphCast模型的源代碼已經(jīng)全部開放,從而讓世界各地的科學(xué)家和預(yù)報員可以造福全球數(shù)十億人。

      健康與生命科學(xué)

      在醫(yī)療健康領(lǐng)域,AI展現(xiàn)出了巨大的潛力。

      初代Med-PaLM,是第一個通過美國醫(yī)學(xué)執(zhí)照考試的AI模型。隨后的Med-PaLM2,又在此基礎(chǔ)上進(jìn)一步提升了19%,達(dá)到了86.5%的專家級準(zhǔn)確率。

      而最近發(fā)布的多模態(tài)Med-PaLM M,不僅可以處理自然語言輸入,而且還能夠解釋醫(yī)學(xué)圖像、文本數(shù)據(jù)以及其他多種數(shù)據(jù)類型。

      Med-PaLM M是一個大規(guī)模多模態(tài)生成模型,它能用相同的模型權(quán)重靈活地編碼和解釋生物醫(yī)學(xué)數(shù)據(jù),包括臨床語言、成像和基因組學(xué)數(shù)據(jù)

      不僅如此,AI系統(tǒng)還能在現(xiàn)有醫(yī)療數(shù)據(jù)中探索出全新的信號和生物標(biāo)記。

      通過分析視網(wǎng)膜圖像,谷歌證明了可以從眼睛的照片中預(yù)測出多個與不同器官系統(tǒng)(如腎臟、血液、肝臟)相關(guān)的全新生物標(biāo)記。

      在另一項研究中,谷歌還發(fā)現(xiàn),將視網(wǎng)膜圖像與基因信息相結(jié)合有助于揭示一些與衰老相關(guān)的根本因素。

      在基因組學(xué)領(lǐng)域,谷歌與60家機(jī)構(gòu)的119位科學(xué)家合作,繪制出了新的人類基因組圖譜。

      并且,在開創(chuàng)性的AlphaFold基礎(chǔ)上,為所有7100萬個可能的錯義變體中的89%,提供了預(yù)測目錄。

      此外,谷歌還發(fā)布了AlphaFold最新進(jìn)展——「AlphaFold-latest」,它可以對蛋白質(zhì)數(shù)據(jù)庫(PDB)中幾乎所有分子,進(jìn)行原子級精確的結(jié)構(gòu)預(yù)測。

      這一進(jìn)展不僅深化了我們對生物分子的理解,而且還大幅提升了在配體(小分子)、蛋白質(zhì)、核酸(DNA和RNA)以及含有翻譯后修飾(PTMs)的生物大分子等多個重要領(lǐng)域的準(zhǔn)確性。

      量子計算

      量子計算機(jī)具有解決科學(xué)和工業(yè)領(lǐng)域重大現(xiàn)實問題的潛力。

      但要實現(xiàn)這一潛力,量子計算機(jī)的規(guī)模必須比現(xiàn)在大得多,而且必須能夠可靠地執(zhí)行經(jīng)典計算機(jī)無法執(zhí)行的任務(wù)。

      為了保證量子計算的可靠性,還需要將它的錯誤率從現(xiàn)在的10^3分之一降低到10^8分之一。

      今年,谷歌在開發(fā)大型實用量子計算機(jī)的道路上邁出了重要一步——有史以來首次通過增加量子比特來降低計算錯誤率。

      負(fù)責(zé)任的AI

      生成式AI正在醫(yī)療、教育、安全、能源、交通、制造和娛樂等眾多領(lǐng)域帶來革命性的影響。

      面對這些飛躍的發(fā)展,確保技術(shù)設(shè)計符合谷歌的AI原則依然是首要任務(wù)。

      讓AI普及

      在不斷推進(jìn)機(jī)器學(xué)習(xí)和人工智能的最新技術(shù)的同時,谷歌也致力于幫助人們理解并將AI應(yīng)用于特定問題。

      為此,谷歌推出了基于網(wǎng)頁的平臺Google AI Studio,幫助開發(fā)者打造并迭代輕量級的AI應(yīng)用。

      同時,為了幫助AI工程師能夠更深入地理解和調(diào)試AI,谷歌還推出了最先進(jìn)的開源機(jī)器學(xué)習(xí)模型調(diào)試工具——LIT1.0。

      作為谷歌最受歡迎的工具之一,Colab可以讓開發(fā)者和學(xué)生直接在瀏覽器中訪問強(qiáng)大的計算資源,目前已擁有超過1000萬用戶。

      前段時間,谷歌又在Colab中加入了AI代碼輔助功能,讓所有的用戶都夠在數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工作流中,擁有更加便捷和一體化的體驗。

      就在最近,谷歌為了確保AI能夠在實際應(yīng)用中提供正確無誤的信息,創(chuàng)新性地推出了FunSearch方法。

      通過進(jìn)化算法和大語言模型的結(jié)合,F(xiàn)unSearch能夠在數(shù)學(xué)科學(xué)領(lǐng)域生成經(jīng)過驗證的真實知識。

      具體來說,F(xiàn)unSearch將預(yù)訓(xùn)練的LLM與自動「評估器」配對使用。前者的目標(biāo)是以計算機(jī)代碼的形式提供創(chuàng)造性的解決方案,后者則防止幻覺和錯誤的想法。在這兩個組件之間反復(fù)迭代之后,初始的解決方案便會「進(jìn)化」為新知識。

      社區(qū)參與

      通過發(fā)表研究成果、參與和組織學(xué)術(shù)會議,谷歌正在持續(xù)推動AI和計算機(jī)科學(xué)的發(fā)展。

      今年,谷歌已發(fā)表了500多篇論文。其中,有不少都被收錄在了包括ICML、ICLR、NeurIPS、ICCV、CVPR、ACL、CHI和Interspeech等眾多頂會之中。

      此外,谷歌還聯(lián)合33個學(xué)術(shù)實驗室,通過匯總來自22種不同機(jī)器人類型的數(shù)據(jù),創(chuàng)建了Open X-Embodiment數(shù)據(jù)集和RT-X模型。

      谷歌在MLCommons標(biāo)準(zhǔn)組織的支持下,帶頭在行業(yè)內(nèi)推動AI安全基準(zhǔn)的建立,參與者包括 OpenAI、Anthropic、Microsoft、Meta、Hugging Face等在生成式AI領(lǐng)域舉足輕重的機(jī)構(gòu)。

      展望未來

      隨著多模態(tài)模型(multimodal models)的不斷進(jìn)步,它們將助力人類在科學(xué)、教育乃全新的知識領(lǐng)域取得驚人的成就。

      隨著時間的推進(jìn),谷歌的產(chǎn)品和研究也不斷進(jìn)步,而人們也將會找到更多富有創(chuàng)意的AI應(yīng)用方式。

      在這篇年終總結(jié)的最后,讓我們回到開頭的話題,正如谷歌在「Why We Focus on AI (and to what end)」中所言:

      「如果大膽而負(fù)責(zé)地推進(jìn)AI的發(fā)展,我們相信AI能夠成為一項基礎(chǔ)技術(shù),徹底改變?nèi)澜缛说纳?mdash;—這正是我們追求的目標(biāo),也是我們的激情所在!」

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。