8月18日消息,為了趕超 OpenAI 及其他競爭對手,Google 的 CEO 桑達爾·皮查伊(Sundar Pichai)于 4 月合并了兩個具有不同文化和代碼的大型人工智能團隊——「Google Brain」和「DeepMind」。
據(jù) The Information,新合并的「AI SWAT」團隊計劃于秋天發(fā)布一組大型機器學習模型「Gemini」,據(jù)開發(fā)人員透露,Gemini 預計將使Google 能夠制造出競爭對手無法制造的產(chǎn)品。
彭博社風投分支 Bloomberg Beta 的 AI 初創(chuàng)公司投資人詹姆斯·錢匹(James Chami)表示:「似乎終于有模型能與 GPT-4 旗鼓相當了」。
Gemini 開發(fā)人員表示,Gemini 不僅能像 GPT-4 一樣可以進行文本對話,還融合了 Midjourney 和 Stable Diffusion 的能力,能夠生成圖像。Gemini 的圖像能力此前還從未有過報道。
另外,它還能提供分析圖表、創(chuàng)建帶有文本描述的圖形、使用文本或語音命令控制軟件。
Google 把重注押在了 Gemini 身上,Gemini 會為 Bard 聊天機器人提供動力、推動 Google Docs、Slides 等企業(yè)級應用。
谷歌還希望通過云服務(wù)器租賃服務(wù),向開發(fā)者收取訪問 Gemini 的費用。
據(jù)報道,Google 對 Gemini 進行了大量 YouTube 視頻的訓練。Gemini 還可以把音頻和視頻集成到模型本身,形成多模態(tài)能力,許多研究人員認為這是 AI 的下一個前沿領(lǐng)域。
使用 YouTube 內(nèi)容,還可以幫助 Google 開發(fā)更先進的文本轉(zhuǎn)視頻軟件,根據(jù)用戶想看的內(nèi)容描述,自動生成詳細的視頻。
這類似于 Google 支持的初創(chuàng)公司 RunwayML 正在開發(fā)的技術(shù),好萊塢和內(nèi)容創(chuàng)作者正在密切關(guān)注此類軟件的發(fā)展。
Google Brain 和 DeepMind 的合并,令一些參與 Gemini 的工程師感到驚訝。合并后的團隊由 DeepMind 首席執(zhí)行官戴密斯·哈薩比斯(Demis Hassabis)領(lǐng)導。
知情人士稱,DeepMind 的兩位高管奧里奧爾·溫亞爾斯( Oriol Vinyals)和 Koray Kavukcuoglu 與前谷歌大腦負責人杰夫・迪恩(Jeff Dean)一起負責 Gemini 的開發(fā)。他們將監(jiān)督數(shù)百名參與 Gemini 開發(fā)的員工。
組織合并后,除了人員安排問題, Gemini 團隊在開發(fā)過程中還面臨著巨大的挑戰(zhàn),如確定可以使用哪些數(shù)據(jù)來訓練模型。
盡管如此,谷歌前高管、風險投資公司法利思投資創(chuàng)始人艾丁·森庫特( Aydin Senkut)表示,Gemini的發(fā)布表明,Google 決心再次走在最前沿,而不是極度保守。他說,「這是正確的方向,終于,他們有了火」。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。