12月14日 消息:谷歌Deepmind宣布了他們最先進(jìn)的圖像生成模型Imagen2。該模型通過參考圖片和文本生成新圖片和局部編輯的效果比較強(qiáng)大。
這一最新模型的主要特點包括改進(jìn)的圖像描述理解。為了幫助創(chuàng)建更高質(zhì)量和更準(zhǔn)確的圖像,Imagen2的訓(xùn)練數(shù)據(jù)集中添加了更多描述,幫助該模型學(xué)習(xí)不同的標(biāo)題風(fēng)格,并更好地理解廣泛的用戶提示。
此外,Imagen2的數(shù)據(jù)集和模型在許多領(lǐng)域取得了改進(jìn),這些領(lǐng)域通常是文本到圖像工具所困擾的,包括渲染逼真的手部和人臉,以及保持圖像不受干擾的視覺偽影,從而實現(xiàn)更加真實的圖像生成。
Imagen2的擴(kuò)散技術(shù)提供了高度的靈活性,使得更容易控制和調(diào)整圖像的風(fēng)格。通過提供參考風(fēng)格圖像并結(jié)合文本提示,可以訓(xùn)練Imagen2生成遵循相同風(fēng)格的新圖像。
該模型還支持圖像編輯功能,如“修補(bǔ)”和“擴(kuò)展”。通過提供參考圖像和圖像蒙版,用戶可以使用一種稱為修補(bǔ)的技術(shù)直接在原始圖像中生成新內(nèi)容,或者使用擴(kuò)展技術(shù)將原始圖像延伸到其邊界之外。
為了應(yīng)對潛在的風(fēng)險和挑戰(zhàn),Google DeepMind在設(shè)計和開發(fā)過程中設(shè)置了嚴(yán)格的防護(hù)措施。Imagen2集成了SynthID,這是一種先進(jìn)的數(shù)字水印工具,使Google Cloud客戶能夠在圖像的像素中添加不可察覺的數(shù)字水印,而不會影響圖像質(zhì)量。這種數(shù)字水印可以在應(yīng)用修改,如濾鏡、裁剪或使用有損壓縮方案保存后仍然可檢測到。在發(fā)布功能給用戶之前,Google DeepMind進(jìn)行了嚴(yán)格的安全測試,以最小化潛在的危害風(fēng)險。安全檢查涵蓋了訓(xùn)練數(shù)據(jù)、輸入提示和系統(tǒng)生成的輸出,以避免生成潛在有問題的內(nèi)容。
現(xiàn)在,開發(fā)人員和云客戶可以通過Google Cloud Vertex AI中的Imagen API使用這一先進(jìn)的圖像生成模型。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。