正在逐步覆蓋!騰訊提醒勿為實況圖重裝微信:以免丟失微信聊天記錄iPhone16多款機型破發(fā):最高比官網(wǎng)便宜600元劉積仁不愛“湊熱鬧”,但東軟集團喜歡“追風(fēng)口”快手電商新增近800個“0元開店”類目,推出多項新商入駐權(quán)益年內(nèi)狂攬五項第一,“字節(jié)系大模型”何以后發(fā)先至?科技云報到:有韌性才能更“任性”,云韌性構(gòu)筑業(yè)務(wù)最后一道防線阿里云盤出“BUG”客服回應(yīng):已修復(fù)圍剿BBA,比亞迪和騰勢也準(zhǔn)備出一份力阿里云服務(wù)器操作系統(tǒng)Alibaba Cloud Linux全新升級,核心場景性能提升超20%屏幕面板 10 月出貨,蘋果 M4 MacBook Air 被曝 2025Q1 發(fā)布蘋果史上最大:iPhone 16系列電池容量公布后移動互聯(lián)網(wǎng)時代,移動App兼容測試持續(xù)占據(jù)核心地位歐盟警告蘋果:六個月內(nèi)開放iPhone系統(tǒng) 否則重罰湖北省電子信息產(chǎn)業(yè)前8月實現(xiàn)營收5970億元,同比增長13.53%傳三星計劃2025年推出卷軸屏手機蘋果新專利探索折疊iPhone未來,任意表面實現(xiàn)觸敏控制蘋果iPhone16/Pro系列手機今日首銷,5999~9999元起各方媒體的聚焦關(guān)注,中南高科實力呈現(xiàn)高科“新質(zhì)”表現(xiàn)力拼多多解開了新疆的“包郵絕緣體”封印宏景智駕完成數(shù)億元C輪融資
  • 首頁 > 企業(yè)IT頻道 > 軟件即服務(wù)

    90后二次元北大校友做出AI漫畫創(chuàng)作工具,融資千萬

    2024年04月23日 09:44:11   來源:創(chuàng)業(yè)邦公眾號

      AI繪畫已經(jīng)火了兩年,但仍有一群人并不滿意。

      對于他們,僅僅是一張極盡精致的圖片還不夠,他們希望為畫中的人物賦予更完善的性格、好惡、身世、人際關(guān)系、世界觀,讓Ta有血有肉,仿佛真實存在。

      “這就是為什么我們的產(chǎn)品叫做‘AI驅(qū)動的角色幻想創(chuàng)作平臺’,而非AI繪畫這種描述。”胡修涵說。

      90后的胡修涵在2022年12月,AI繪畫正引發(fā)大規(guī)模討論,ChatGPT剛剛發(fā)布的時候創(chuàng)立了“看見概念”團隊,近期剛剛完成天使輪和Pre-A輪融資,總額超千萬元,投資方包括源碼資本和奇績創(chuàng)壇等。

      他們的產(chǎn)品“捏Ta”則在今年4月剛剛上線,分為微信小程序和APP兩種體驗渠道。

      今天凌晨,他們還推出了自研的開源二次元大模型,捏Ta藝術(shù)大模型(Neta Art XL)。

      作為真·老二次元,胡修涵對同人創(chuàng)作生態(tài)了如指掌,他提出,不管是基于已有IP的二次創(chuàng)作,還是自己原創(chuàng)故事和角色,本身都是愛好者們內(nèi)心創(chuàng)作欲的一種體現(xiàn)。

      只是產(chǎn)出二創(chuàng)的人畢竟還是少數(shù),大多數(shù)人的創(chuàng)作能力(尤其是在圖像上)是不足的。

      這時,就需要一種工具來填充這種創(chuàng)作能力上的不足。

      近千個可選標(biāo)簽,

      創(chuàng)作故事而非單張圖片

      相比創(chuàng)作單張圖像,捏Ta的“創(chuàng)作角色故事”的能力直觀體現(xiàn)在兩個方面。

      第一,平臺征集了大量已經(jīng)成熟的IP形象,游戲如原神、明日方舟、重返未來1999,動畫如咒術(shù)回戰(zhàn)、排球少年、Fate系列等等,共計近500個已有形象。

      基于這些形象,用戶可以輕松進行改變服飾、表情、動作,更換場景等方面的二次創(chuàng)作。

      可供選擇的圖像風(fēng)格共有近百個,如具體的藝術(shù)家風(fēng)格、厚涂、賽璐璐、像素小人等等。

      而涉及到具體細(xì)節(jié),如人物形象的表情動作和服飾、畫面的光照和鏡頭、場景特點等等,共有近千個可選擇的標(biāo)簽。

      除了最經(jīng)典的文字prompt之外,捏Ta也提供了“圖片捏”,即可以上傳手機相冊里已有的圖片,或此前生成的圖片進行二次創(chuàng)作。

      同時,“CP圖”則需要分別描述兩個角色,再套用平臺提供的CP模版(如證件照、下腰抱、親親等),就能直接看自家CP結(jié)婚。

      在圖片完成后,平臺也有添加字幕、臺詞、圖像拼接的功能,可以直接制作漫畫,講述故事。

      一般情況下,生成圖像的時間約為10-30秒。

      第二個特點則是捏Ta的核心功能,“奇旅”。

      平臺提供了一種類似橙光游戲的玩法,當(dāng)前有校園、異世界、娛樂圈等幾個故事模版,用戶可以帶著已有IP角色或自己的原創(chuàng)角色進入這種故事里,面臨不同需要做出選擇的場景。

      遇到這些場景時,用戶就需要根據(jù)自己的選擇,輸入prompt,創(chuàng)作出相應(yīng)的場景。

      這個功能對于普通人來說或許有些費解,但在養(yǎng)OC(Original Character,原創(chuàng)角色)的同人創(chuàng)作者來看卻剛剛好。

      養(yǎng)OC其實就是完善原創(chuàng)角色設(shè)定,并且是除了外表服飾性格喜好之外,更具體,更深入地構(gòu)建這個角色的童年、人際交往圈、性格缺陷、魅力來源、生長世界觀等等。最終或是拓展成一個完整的小說或漫畫故事,亦或用于在網(wǎng)絡(luò)社群里與其他養(yǎng)OC人進行社交。

      要完善原創(chuàng)角色設(shè)定,創(chuàng)作者們常用的一個做法,就是將角色放入一個場景,想象Ta在面臨某個具體的劇情時,會做什么樣的選擇。

      在此之前,OC養(yǎng)到后期要么自己動手,創(chuàng)作圖像或小說,要么就需要在圈內(nèi)花錢找人約文、約稿、約角色曲。

      但現(xiàn)在,基于捏Ta平臺就可以做到。正如“奇旅”玩法開展之時頁面上的那句“探索角色的更多面”。

      目前社區(qū)的產(chǎn)出有六到七成為有字幕和多幅圖像的類漫畫作品。胡修涵也透露,他們的平臺現(xiàn)在有近50萬用戶,其中女生占七成,也大都比較年輕。

      “她們的一個共同標(biāo)簽就是很多都寫過小說,或者說搞過同人創(chuàng)作。她們內(nèi)心其實有一個很強烈的心理,就是把自己內(nèi)心的想法做一個更圖像化的表達,讓更多人看到,這樣才能建立起內(nèi)心的正反饋。”他說。

      不過,當(dāng)前捏Ta平臺并沒有明顯的付費點,在生成圖像時所消耗的“電量”類似游戲中的“體力值”,可以隨著時間慢慢恢復(fù),也可以通過社區(qū)點贊分享等行為獲取。

      在“電量值”上是否會做類似游戲的“月卡買體力”玩法,胡修涵不置可否。不過他分享了當(dāng)前平臺已有的兩種方式。

      第一,得益于國內(nèi)繁榮的周邊物流供應(yīng)鏈,捏Ta也提供一個把用戶的原創(chuàng)角色定制成亞克力吊牌或吧唧(二次元宅圈的周邊徽章)等周邊道具的渠道。

      第二,從長遠來看,用戶捏的角色也有可能成為自身就具有內(nèi)容價值的產(chǎn)品,可以向第三方出租或售賣。

      “就像是openai的GPT商店,開發(fā)者可以把自己定制的GPT掛出來給其他用戶使用,從中收取傭金。但現(xiàn)在GPTs沒有跑通,可能意味著只有prompt的價值不高,或者至少建立不起某種經(jīng)濟循環(huán)。所以核心的點在于售賣的資產(chǎn)本身。”胡修涵說。

      15人團隊創(chuàng)立兩年,

      全網(wǎng)曝光2.5億

      剛過30歲的胡修涵,在2014年畢業(yè)于北京大學(xué),獲得了智能科學(xué)和經(jīng)濟學(xué)雙學(xué)位,并在此后的美國哥倫比亞大學(xué)取得了碩士學(xué)位。

      他最早進入了Meta的視頻戰(zhàn)略組,擔(dān)任一個30人左右團隊的技術(shù)主管,主要負(fù)責(zé)Facebook、WhatsApp、Instagram三個平臺的視頻相關(guān)全套技術(shù)方案。

      也就是在做短視頻、短劇類內(nèi)容、新聞、游戲直播時,負(fù)責(zé)內(nèi)容管理、視頻中插廣告的系統(tǒng)對接、版權(quán)數(shù)據(jù)分析等工作。

      在那時,他遇到了現(xiàn)在“看見概念”團隊的合伙人兼CPO宋禹君,清華大學(xué)本科,碩士則畢業(yè)于卡內(nèi)基梅隆大學(xué)的人機交互專業(yè)。

      胡修涵表示,由于最初做的都是內(nèi)容方面的工作,在Meta時能以7%占比的頭部內(nèi)容獲取平臺90%的觀看量,因此他們對于不同市場、不同內(nèi)容類型的需求變化較為敏感。

      2018年,胡修涵回國進入阿里巴巴,帶領(lǐng)團隊先后參與了2019雙十一大規(guī)模數(shù)據(jù)可視化的高性能渲染工作。

      2020年,他又進入了一家上海的B輪獨角獸特贊,擔(dān)任技術(shù)VP,從零搭建了這家公司的內(nèi)容資產(chǎn)管理產(chǎn)品線。

      當(dāng)特贊的新產(chǎn)品線收入從十幾萬上漲到上億級,時間來到了2022年12月份。

      在這時,Stable Diffusion已經(jīng)發(fā)布有4個月,它的開源是AI繪畫爆火的直接原因,也正是基于SD其開發(fā)的無數(shù)圖像生成模型將這一話題不斷發(fā)酵,一齊將AI繪畫推向了輿論熱潮的高峰。

      而顛覆AI圈的ChatGPT也在11月30日剛剛推出。

      這些都讓胡修涵覺得,C端的內(nèi)容生態(tài)創(chuàng)作端或許會因此而發(fā)生大的變革。

      于是當(dāng)月,胡修涵出走創(chuàng)業(yè),正式創(chuàng)立了“看見概念”公司,他瞄準(zhǔn)了二次元社區(qū)。

      2023年一年,團隊主要基于SD框架進行技術(shù)研發(fā),但原模型風(fēng)格不夠二次元審美,風(fēng)格上也比較難符合多樣化的鏡頭。而部分風(fēng)格優(yōu)良的模型則人物肢體穩(wěn)定性欠佳。

      因此,在生成人物的表情、動作、鏡頭、風(fēng)格表達多樣性,風(fēng)格易調(diào)用性,以及多人畫面的穩(wěn)定性等方面,團隊進行了大量的研發(fā)。

      2024年4月,團隊正式上線了“捏Ta”微信小程序。

      這個名字來源于日語“梗”(Neta)的讀音,在ACG圈中常被用作玩梗、致敬使用。在同人二創(chuàng)圈里,又和“養(yǎng)OC”“養(yǎng)娃”“捏角色”等概念相似。

      捏Ta的社交媒體曝光量已達到約2.5億次,位列視頻號動漫游戲日榜前十,日均用戶使用時長可達40分鐘。

      令胡修涵印象最深的,是一名用戶在200天內(nèi),用AI工具生成了500多個原創(chuàng)角色。

      剛剛推出的Neta Art XL模型,則覆蓋了超過1.3萬個角色,近千個不同風(fēng)格的藝術(shù)家,在部分二次元專屬名詞的識別和生成上,也進行了優(yōu)化。

      目前,整個“看見概念”團隊共有15人,其中大部分都是產(chǎn)品研發(fā)。

      團隊的核心技術(shù)成員來自Meta、字節(jié)跳動、B站、小馬智行(Pony.ai)等企業(yè),也曾深度參與二次元開源模型AIDXL以及視頻生成模型開源項目AnimateDiff的開發(fā)。

      面向群體:“當(dāng)年在辦公室摸魚寫網(wǎng)文”的人

      事實上,AI繪畫應(yīng)用產(chǎn)品在國內(nèi)早已有過一波井噴期。

      2021年年初,OpenAI推出了里程碑式的DALL·E模型和CLIP框架,前者被稱為2021年第一個令人興奮的AI技術(shù)突破,后者則是一種能將文本與圖像聯(lián)系起來的特殊的”圖像識別“。

      自此之后,AI繪畫就開始飛速發(fā)展。直到2022年8月,Stable Diffusion開源,短時間內(nèi)產(chǎn)生了一大批低門檻的AI繪畫工具。

      捏Ta為什么出現(xiàn)在現(xiàn)在?它與已有的AI繪畫式工具又有哪些不同?

      胡修涵認(rèn)為,當(dāng)圖像生成領(lǐng)域開始出現(xiàn)技術(shù)革新,產(chǎn)品慢慢涌現(xiàn)時,一開始或許會比較傾向于引入成熟的工作流程中,去快速解決已有的問題,并快速獲取一個正面反饋。

      而一開始跟進新技術(shù)的人,大多也是對技術(shù)敏感,對AI本身感興趣的人。這個群體會傾向于更專業(yè)的工具,也會自然希望把工具盡快集成自己的生產(chǎn)流程。

      就像是游戲影視行業(yè)的部分公司,他們引入AI繪畫搭建了新的工作流程,達成了更高效或者更便宜的效果,這時候新技術(shù)就被內(nèi)部消化掉了,也就沒有什么產(chǎn)品流出來。

      但捏Ta并非是一個創(chuàng)作力工具被應(yīng)用于工作能效,它本身就是基于具體的創(chuàng)作目的設(shè)計的,是一個泛娛樂化產(chǎn)品。

      與那些喜歡嘗鮮的AI愛好者不同,胡修涵提到,他們的用戶群體是泛C端,也就是“當(dāng)年做卡點音樂視頻,在辦公室摸魚寫網(wǎng)文的一群人”。

      這個群體是為了好玩,為了自我表達而創(chuàng)作,而不是為了解決某個工作問題,為了越做越快越做越好。

      在胡修涵看來,他們帶來的通常是一種長期的內(nèi)容創(chuàng)作,或許短期內(nèi)看似無法產(chǎn)生直接變現(xiàn),但長期則會形成一種有價值的消費社區(qū)生態(tài)。

      “所以專業(yè)的用戶其實是不屑于用我們這類工具的,因為我們有意識地把復(fù)雜度全藏起來了。但我覺得一個大眾性的好的產(chǎn)品,他針對的肯定不是先鋒用戶。就像我們的用戶,他們不是被AI打動的,而是因為對二次元的興趣才來玩我們的產(chǎn)品的。”胡修涵說。

      因此,在多次采訪中,胡修涵都強調(diào),他們希望捏Ta能成為一個創(chuàng)作平臺,有足夠多的內(nèi)容創(chuàng)作者在產(chǎn)出,也能形成社區(qū)進行交流。

      當(dāng)然,現(xiàn)在幾乎所有的內(nèi)容創(chuàng)作平臺都面臨著一個長期的困境:內(nèi)容產(chǎn)出不夠怎么辦?在胡修涵看來,最好的方法就是讓越來越多的人都能參與創(chuàng)作

      而到更遠的時候,基于更加成熟的生成技術(shù),以及更大更優(yōu)質(zhì)的用戶,社區(qū)中誕生的原創(chuàng)優(yōu)質(zhì)角色和圍繞其展開的故事越來越多,其中最頭部的可能就會成為新一代的大熱偶像IP。

      AI繪畫:拼湊、融合、還是未來?

      不過,對于同人二創(chuàng)圈,AI的參與一直是一件相當(dāng)微妙的事。

      對于很多創(chuàng)作者來說,圖像是自我表達的一種方式,而由冰冷機器生成的圖像難免欠缺靈魂,甚至有“AI繪畫是拼湊尸塊”的言論。

      作為技術(shù)開發(fā)者,胡修涵先解釋了AI繪畫的大致流程:多層神經(jīng)網(wǎng)絡(luò)模型會學(xué)習(xí)圖像和與圖像對應(yīng)的一系列文本描述,然后將圖片中的內(nèi)容翻譯成一個“高維文本向量”,也就是“理解圖像”。

      當(dāng)這種翻譯足夠合理,理解足夠深刻時,模型就能反過來,將一系列的文本描述變回相應(yīng)的畫面。

      所以,AI繪畫并非是很多人想象的像素重組或元素拼接,而是在概念上做了一個融合創(chuàng)新。

      “我會覺得AI繪畫很像是去追哈利波特世界里的金色飛賊。在使用內(nèi)容創(chuàng)作模型時,你實際上就是要用盡可能多的文字限制,把你最想要的那個鏡頭畫面逼到一個角落。”胡修涵說。

      而對于這種論調(diào)帶來的對整個AI繪畫的消極甚至反對態(tài)度,胡修涵也十分冷靜。

      作為老二次元,胡修涵非?隙,整個泛二次元群體中有大量“沉默的大多數(shù)”,他們對于AI繪畫的抵觸心理不強,對于畫師和繪圈也沒有那么高的忠誠度——沒有足夠的繪畫技巧、沒有時間精力,或者沒有金錢去約稿,所以無法開始自我創(chuàng)作和表達,這才是這群人的核心需求。

      并且,在胡修涵看來,跳出這個群體,AI繪畫也是一種無法阻擋的趨勢。

      他提到,今年兩會上,央視就用AI生成了一系列海報,這就代表了一種非常具有傾向性的鼓勵和引導(dǎo)。

      此外,他們的平臺在沒有投流推廣下實現(xiàn)了2.5億次以上的流量曝光,這也說明總有人喜歡這些內(nèi)容。而隨著技術(shù)的不斷迭代,人們的思想也不不斷改變,未來參與進來的人或許會有更多。

      至于AI繪畫帶來的版權(quán)問題,胡修涵認(rèn)為,某個內(nèi)容創(chuàng)作需要人的勞動成本,這是一個前AI時代的經(jīng)濟理論邏輯。

      隨著AI的發(fā)展,單個內(nèi)容的生產(chǎn)和傳播成本發(fā)生了極大的改變,這時候就需要重新考慮相關(guān)問題。

      比如,對于AI繪畫的定義,未來可能會發(fā)展到需要畫師的“開光”。

      “畫師可以認(rèn)證那些AI生成的東西,說這幾張圖掌握了我的精髓,那可能這些圖的收益就要分他一部分;沒有經(jīng)過認(rèn)證或授權(quán)的AI圖像的價值就極低……總之,未來應(yīng)該會有一套新的版權(quán)價值體系。”胡修涵說。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。