• 讓一讓,全球最鮮活的AI小貓來了

    2024年12月05日 09:15:04   來源:刺猬公社公眾號

      2012年,計算機科學(xué)家吳恩達和Jeff Dean進行了一場試驗。

      他們用1.6萬個CPU、1000萬張貓咪圖片以及當時全球最大的深度學(xué)習(xí)網(wǎng)絡(luò),訓(xùn)練了3天,生成了世界上第一張AI貓臉圖像。這是人們基于深度學(xué)習(xí)模型自動生成圖片的開端,受限于當時的技術(shù)能力,圖片中的小貓稱得上是“面目全非”。

      12年后,當網(wǎng)友第一次看到背著白色翅膀的黑貓圖片時,幾乎所有人都以為,那是一張真實的照片。

      畢竟,寵物博主用翅膀飾品裝扮自家貓咪后,再用膠片機拍照記錄,不算是什么稀奇事。直到看見帖子下方的“AIGC”標簽,人們才驚奇地發(fā)現(xiàn):“這竟然是AI生成的?”

      懷揣著巨大的好奇心,越來越多網(wǎng)友順著網(wǎng)線,前往一個名為“Recraft AI”的應(yīng)用,嘗試生成自己心目中的理想小貓。

      情況一發(fā)不可收拾。

      最近幾天,各式各樣的“小貓膠片照”填滿了小紅書、抖音等社交平臺的信息流。無論是舉著紅酒杯的小貓、在鍵盤上打字的小貓,還是舉著魔棒正在施法的小貓,全是Recraft AI的杰作。

      近年來,AI領(lǐng)域的所有進展中,離普通用戶最近的非AI生圖莫屬。

      自2021年年初,OpenAI發(fā)布DALL-E大模型,AI得以通過文字生圖起,三年內(nèi)誕生的AI生圖工具已經(jīng)進化、迭代了一波又一波。專攻技術(shù)能力突破的有Stable Diffusion、Midjourney、FLUX等等,專攻C端應(yīng)用的也有妙鴨相機、Remini等等。

      從最初追求極致的“像”,到如今逐漸厭倦AI味兒,開始追求風格與審美,這屆網(wǎng)友正在將Recraft AI捧上新的“神壇”。

      沒有AI味的“造夢AI”

      這次火起來的,其實是Recraft AI內(nèi)置的一種預(yù)設(shè)風格“Hard Flash”。

      該模式可以模擬膠片攝影時,開啟閃光燈之后的拍攝效果,生成的圖片主體突出,對比度高,彩色飽滿濃郁。目前,該AI網(wǎng)站支持免費用戶每天獲得50個積分,生成50張圖片,雖然中文提示詞的生成效果仍不如英文,但Recraft支持中文口令直接輸入。

      如果說,ChatGPT的出現(xiàn)讓作者焦慮,Midjourney的出現(xiàn)讓畫家憂愁,這一次,慌的是攝影師。

      小紅書,是Recraft最初被國內(nèi)用戶關(guān)注到的地方,目前相關(guān)話題下已經(jīng)有超過1萬條筆記。

      其中不乏有攝影愛好者哀嚎“我宣布,攝影不存在了”;也有專業(yè)的膠片攝影博主在看完Recraft生成的圖片后,認為該AI的構(gòu)圖和色彩、審美極佳,開始思索還有什么是人類攝影師能夠抓住的東西;甚至有人開始研究Recraft的調(diào)色與構(gòu)圖,試圖進行“反向?qū)W習(xí)”。

      盡管其他AI工具的畫風更加細膩,生成的圖片更為精美,但看久了難免會有一種“AI味兒”。

      無論是不和諧的色彩過渡、結(jié)構(gòu)上的不自然;還是過度平滑、整齊的勾線,毫無瑕疵的質(zhì)感,總之,早期“一眼假”的是AI味兒,如今過于逼真無瑕的,也是一種AI味兒。

      在一眾追求細節(jié)、力爭真實的AI繪畫工具面前,強烈、鮮明的視覺風格是Recraft出圈的關(guān)鍵。

      刺猬公社(ID:ciweigongshe)嘗試用幾個不同的模型,輸入相同的口令“many animals”。從最終生成的結(jié)果來看,Recraft內(nèi)置的Hard Flash模式,一眼望去的確有種不一樣的feel。

      Recraft并沒有像FLUX或是DALL·E3那樣進行常規(guī)構(gòu)圖,而是將不同的動物一字排開,畫面中土地與天空的大面積留白,似乎給圖像增添了別樣的情緒:這是一頭孤獨的獅子。

      當AI生成的畫面能夠傳達情緒,Recraft AI也被貼上了“夢核”“怪誕”的標簽,越來越多網(wǎng)友的創(chuàng)作欲開始被激發(fā)。

      有人將自己喜歡的電影臺詞或是歌詞當做口令輸入Recraft,期待著會生成什么畫面。

      在一條有著1.6萬點贊的小紅書筆記中,博主“帆”將《宇宙探索編輯部》的臺詞輸入了Recraft,生成的圖片雖然并不能百分百復(fù)刻臺詞內(nèi)容,但整體的畫面風格簡直“比宇宙探索編輯部還宇宙探索”。

      也有人試圖用Recraft記錄自己的夢境,或是表達難以言喻的情緒,有熱心網(wǎng)友專門整理出了,能讓Recraft生成更空靈、更夢幻感圖片的常用提示詞。甚至也有網(wǎng)友從中發(fā)現(xiàn)了新商機,幫助無法使用Recraft的用戶,生成他們心目的夢核圖片,一張幾塊錢。

      網(wǎng)友們的熱情參與下,繼妙鴨相機、Remini黏土特效之后,又一場AI狂歡的浪潮掀起。大家似乎都想親自試一試,給AI輸入“咒語”,生成一張?zhí)祚R行空的圖片,實現(xiàn)一種“魔法成真”的奇妙感受。

      于是,近期的小紅書、抖音等社交媒體似乎被“魔法”包圍了:HelloKitty站在窗邊看煙花、小狗在雪地里吃蛋糕、金魚在藍色天空中飛過……

      11月25日,小紅書官方科技薯還專門發(fā)起了一項活動,用戶使用Recraft生圖,帶相關(guān)話題發(fā)布筆記,將有機會被推流。

      在社媒的推動下,據(jù)點點數(shù)據(jù)顯示,過去一周Recraft在國內(nèi)App Store的下載量已經(jīng)躍升至“圖形和設(shè)計榜單”第二。

      AI黑馬,什么來頭?

      盡管Recraft AI已經(jīng)俘獲了國內(nèi)大量網(wǎng)友的芳心,但實際上,該模式既不能體現(xiàn)、也不能代表Recraft AI的技術(shù)實力。

      在很多經(jīng)常使用AI生圖工具的用戶看來,此前已有的許多AI繪畫大模型均能通過口令輸入,實現(xiàn)類似的膠片效果。

      真正能夠證明Recraft AI實力的,是其今年發(fā)布的Recraft V3模型。

      正式官宣Recraft V3模型前,Recraft AI曾用“red-panda”的化名參與Artificial Analysis網(wǎng)站中AI圖像競技場的投票,并一舉超過FLUX、Midjourney、Ideogram、Stable Diffusion3.5排名第一,成為AI生成圖像賽道的一匹黑馬。

      因為“red-panda”(小熊貓)這個名字,最初還有很多人猜測該模型背后站著的是不是一家中國公司,直到今年10月,Recraft AI在推特上認領(lǐng)該模型,人們才開始關(guān)注這家已經(jīng)成立了兩年的AI企業(yè)。

      Recraft AI成立于2022年,是一家總部位于英國的初創(chuàng)公司。

      創(chuàng)始人兼首席執(zhí)行官安娜•維羅尼卡•多羅古什(Anna Veronika Dorogush),此前曾在谷歌和微軟從事軟件工程相關(guān)工作,后來加入了俄羅斯最大的搜索引擎平臺Yandex,是CatBoost開源梯度提升庫的創(chuàng)造者。

      今年1月,Recraft AI獲得了一筆由美國風投機構(gòu)Khosla Ventures領(lǐng)投的1100萬美元A輪融資,GitHub 前首席執(zhí)行官納特•弗里德曼(Nat Friedman)也參與其中,該筆融資主要用于加速技術(shù)研發(fā)以及市場拓展。

      由于國內(nèi)大多用戶是通過社交媒體上傳播的“Hard Flash”模式,了解到的Recraft AI,所以人們通常會誤以為這是一家像Midjourney那樣的AI圖像生成公司。

      但了解之后便會發(fā)現(xiàn),Recraft AI成立的初衷一直是“專注于為平面設(shè)計師提供AI輔助工具”。因此,比起Midjourney,它其實更像是AI版的Cavan或者Photoshop。

      就連排名第一的Recraft V3模型,某種程度上也是Recraft AI為了方便設(shè)計師生成海報而訓(xùn)練的。

      在Recraft V3模型官方介紹的博客中,該公司聲稱此模型是“圖像生成領(lǐng)域里,唯一可以生成帶有長文本內(nèi)容的AI圖像模型”。

      舉個例子,如果一名設(shè)計師需要在海報上展現(xiàn)大量文字內(nèi)容,以往的AI生圖模型很容易在文字內(nèi)容上出現(xiàn)拼寫錯誤,所以設(shè)計師的常規(guī)做法可能是先借助AI生圖生成海報背景圖,再用其他工具將文字內(nèi)容P上去。

      而Recraft V3模型的邏輯則是,通過提升AI直接在圖像中渲染文字內(nèi)容的準確性,精簡設(shè)計師利用AI生成海報的流程。AI媒體“新智元”曾在文章中解釋該模型的運作機制:

      在構(gòu)建文本信息的過程中,Recraft團隊采用的是TextDiffuser-2的表征方式,每一行文本首先記錄了文本的內(nèi)容,隨后通過坐標來指明文本的具體區(qū)域。但是與TextDiffuser-2不同的是,Recraft用了三個坐標點表示文本,使得模型能夠支持渲染傾斜的文本。

      總之,結(jié)果就是借助Recraft V3,設(shè)計師對于海報中文字內(nèi)容的生成效果與把控力,大大提升了。

      除了AI生成漫畫風、寫實風、膠片風,矢量圖、插圖、圖標和3D圖像外,Recraft還提供套索、局部重繪、摳圖、mockup等設(shè)計工具。

      體驗過后,最令刺猬公社的設(shè)計同事驚艷的是其中的mockup功能。借助AI能力,Recraft AI能夠?qū)崿F(xiàn)圖樣或圖標自動貼合產(chǎn)品圖片,直接生成產(chǎn)品樣圖,省去了設(shè)計師手動調(diào)整參數(shù)的麻煩。此外,Recraft還引入了實時協(xié)作功能,同一項目的設(shè)計師可在無限畫布上對生成的內(nèi)容進行評論,并及時修改。

      懂模型不夠,還要懂內(nèi)容

      雖然似乎有80%的國內(nèi)用戶,并沒有像Recraft AI創(chuàng)始人設(shè)想的那樣,把它當成AI設(shè)計工具使用,但憑借Hard Flash走紅對其而言也并非壞事。

      從AI生成圖像領(lǐng)域的歷史來看,最近3年絕對是賽道內(nèi)各大玩家競爭最激烈的時期,大家都在爭先恐后地更新大模型,生怕一不小心就被甩在身后。

      2021年年初,OpenAI發(fā)布了DALL-E大模型,AI得以通過文字生圖;

      2022年3月,Midjourney上線,能根據(jù)用戶輸入的文字快速生成高質(zhì)量圖像;

      2022年8月,Stable Diffusion正式開源,通過將隨機噪點轉(zhuǎn)化為高保真圖像,實現(xiàn)從文本到圖像的生成;

      2024年8月,Black Forest Labs推出FLUX模型,其圖像質(zhì)量、文本理解和細節(jié)表現(xiàn)均超越了Stable Diffusion3以及Midjourney,成為了該領(lǐng)域新的領(lǐng)頭羊……

      而到了10月,人們討論的主角又迅速變成了Recraft。

      根據(jù)Recraft AI的官方數(shù)據(jù)顯示,在Recraft V3模型發(fā)布20天后,該應(yīng)用在全球的累計注冊用戶已經(jīng)超過了200萬。每次注冊登錄時,Recraft都會詢問用戶“通過什么途徑得知的該應(yīng)用”,據(jù)創(chuàng)始人多羅古什透露:“幾乎所有的增長都來自于社交媒體,以及用戶之間的口口相傳。”

      這背后暗含的變化是,隨著AI生成圖像工具逐漸走進普羅大眾的生活,AI企業(yè)們要想出圈,僅憑模型實力也許還不夠。就像多羅古什在采訪時說的那樣:“僅僅靠生成高質(zhì)量的AI圖像是不夠的,(產(chǎn)品)還需要建立一些能夠吸引人們注意力的東西。”

      以往一些主要面向C端的AI產(chǎn)品,其實早已證明了這點。

      比如去年火爆網(wǎng)絡(luò)的妙鴨相機和今年上半年火了一陣的Remini,這兩款產(chǎn)品一個瞄準了“AI寫真”,一個創(chuàng)建了“黏土特效”,兩者都是憑借極具代表性的產(chǎn)品功能,才在用戶心中留下了不可替代的產(chǎn)品標簽。

      對于Recraft AI來說,Hard Flash所帶來的膠片感,就是它在社媒出圈、在更多用戶心中形成認知的“抓手”。

      在一眾力爭畫面細節(jié)與真實感的AI模型中,Recraft出人意料地切入了允許不合常理的“想象力”賽道。

      一方面,風格統(tǒng)一的濾鏡畫風,加深了普通用戶對于該應(yīng)用的記憶,讓Recraft的名字在人們腦海中扎下了根。另一方面,這也十分巧妙了掩蓋了AI模型在部分能力上的欠缺,就算是生成的人物充滿塑料感、畫面總是以彩色幕布作為背景,但在“夢核”“怪誕”的風格標簽下,一切都變得合理。

      AI企業(yè)不斷追求技術(shù)能力的層層突破,自然仍是當下AI發(fā)展階段的重中之重。但若想帶領(lǐng)更多的普通用戶走進AI時代,也許除了突破性的AI技術(shù),同樣也需要進一步降低使用門檻、選擇適宜的產(chǎn)品定位以及營銷策略,唯有如此,才能有越來越多的AI產(chǎn)品“飛入尋常百姓家”。

      參考文章:

      1、新智元:深度解析Recraft V3突破文本渲染限制,「文生圖」黑馬是怎樣煉成的?

      2、Web3天空之城:AI 繪畫何以突飛猛進? 從歷史到技術(shù)突破, 一文讀懂火爆的 AI 繪畫發(fā)展史

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。