家庭能源智聯(lián)自由 海辰儲能發(fā)布首套免安裝家庭微網(wǎng)系統(tǒng)HeroESOpenAI發(fā)布o(jì)3:AI 推理能力的重大突破,得分高達(dá)87.5%亞馬遜云科技推出Amazon Q Developer新功能小象超市,摸著美團(tuán)外賣出海E Ink元太科技連三年入選道瓊可持續(xù)雙指數(shù)撬動6000億GTV后,抖音計劃偷襲美團(tuán)大本營AGI Open Network(AON):賦能每個人創(chuàng)建、部署和貨幣化AI Agent貸款利率史上最低了嗎?東融教你看懂歷年啥水平“客服來電”有詐?抖音客服上線“驗(yàn)證助手”助用戶識別詐騙OpenAI新模型GPT-5研發(fā)未達(dá)預(yù)期:成本高昂 效果不佳曝天馬打入果鏈:為蘋果HomePod供應(yīng)LCD屏 每塊屏僅10美元曝OPPO或首發(fā)新款天璣次旗艦芯片 兩大子品牌Q2發(fā)力諾基亞攜手阿聯(lián)酋運(yùn)營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒放棄曲面屏開發(fā)!最新專利曝光暗示有望回歸三大運(yùn)營商11月成績單:用戶數(shù)據(jù)增幅放緩打造下一個英偉達(dá),孫正義的2026芯片計劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢AI時代云安全新范式,暢捷通智能守護(hù)小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance
  • 首頁 > 企業(yè)IT頻道 > 軟件即服務(wù)

    90后二次元北大校友做出AI漫畫創(chuàng)作工具,融資千萬

    2024年04月23日 09:44:11   來源:創(chuàng)業(yè)邦公眾號

      AI繪畫已經(jīng)火了兩年,但仍有一群人并不滿意。

      對于他們,僅僅是一張極盡精致的圖片還不夠,他們希望為畫中的人物賦予更完善的性格、好惡、身世、人際關(guān)系、世界觀,讓Ta有血有肉,仿佛真實(shí)存在。

      “這就是為什么我們的產(chǎn)品叫做‘AI驅(qū)動的角色幻想創(chuàng)作平臺’,而非AI繪畫這種描述。”胡修涵說。

      90后的胡修涵在2022年12月,AI繪畫正引發(fā)大規(guī)模討論,ChatGPT剛剛發(fā)布的時候創(chuàng)立了“看見概念”團(tuán)隊,近期剛剛完成天使輪和Pre-A輪融資,總額超千萬元,投資方包括源碼資本和奇績創(chuàng)壇等。

      他們的產(chǎn)品“捏Ta”則在今年4月剛剛上線,分為微信小程序和APP兩種體驗(yàn)渠道。

      今天凌晨,他們還推出了自研的開源二次元大模型,捏Ta藝術(shù)大模型(Neta Art XL)。

      作為真·老二次元,胡修涵對同人創(chuàng)作生態(tài)了如指掌,他提出,不管是基于已有IP的二次創(chuàng)作,還是自己原創(chuàng)故事和角色,本身都是愛好者們內(nèi)心創(chuàng)作欲的一種體現(xiàn)。

      只是產(chǎn)出二創(chuàng)的人畢竟還是少數(shù),大多數(shù)人的創(chuàng)作能力(尤其是在圖像上)是不足的。

      這時,就需要一種工具來填充這種創(chuàng)作能力上的不足。

      近千個可選標(biāo)簽,

      創(chuàng)作故事而非單張圖片

      相比創(chuàng)作單張圖像,捏Ta的“創(chuàng)作角色故事”的能力直觀體現(xiàn)在兩個方面。

      第一,平臺征集了大量已經(jīng)成熟的IP形象,游戲如原神、明日方舟、重返未來1999,動畫如咒術(shù)回戰(zhàn)、排球少年、Fate系列等等,共計近500個已有形象。

      基于這些形象,用戶可以輕松進(jìn)行改變服飾、表情、動作,更換場景等方面的二次創(chuàng)作。

      可供選擇的圖像風(fēng)格共有近百個,如具體的藝術(shù)家風(fēng)格、厚涂、賽璐璐、像素小人等等。

      而涉及到具體細(xì)節(jié),如人物形象的表情動作和服飾、畫面的光照和鏡頭、場景特點(diǎn)等等,共有近千個可選擇的標(biāo)簽。

      除了最經(jīng)典的文字prompt之外,捏Ta也提供了“圖片捏”,即可以上傳手機(jī)相冊里已有的圖片,或此前生成的圖片進(jìn)行二次創(chuàng)作。

      同時,“CP圖”則需要分別描述兩個角色,再套用平臺提供的CP模版(如證件照、下腰抱、親親等),就能直接看自家CP結(jié)婚。

      在圖片完成后,平臺也有添加字幕、臺詞、圖像拼接的功能,可以直接制作漫畫,講述故事。

      一般情況下,生成圖像的時間約為10-30秒。

      第二個特點(diǎn)則是捏Ta的核心功能,“奇旅”。

      平臺提供了一種類似橙光游戲的玩法,當(dāng)前有校園、異世界、娛樂圈等幾個故事模版,用戶可以帶著已有IP角色或自己的原創(chuàng)角色進(jìn)入這種故事里,面臨不同需要做出選擇的場景。

      遇到這些場景時,用戶就需要根據(jù)自己的選擇,輸入prompt,創(chuàng)作出相應(yīng)的場景。

      這個功能對于普通人來說或許有些費(fèi)解,但在養(yǎng)OC(Original Character,原創(chuàng)角色)的同人創(chuàng)作者來看卻剛剛好。

      養(yǎng)OC其實(shí)就是完善原創(chuàng)角色設(shè)定,并且是除了外表服飾性格喜好之外,更具體,更深入地構(gòu)建這個角色的童年、人際交往圈、性格缺陷、魅力來源、生長世界觀等等。最終或是拓展成一個完整的小說或漫畫故事,亦或用于在網(wǎng)絡(luò)社群里與其他養(yǎng)OC人進(jìn)行社交。

      要完善原創(chuàng)角色設(shè)定,創(chuàng)作者們常用的一個做法,就是將角色放入一個場景,想象Ta在面臨某個具體的劇情時,會做什么樣的選擇。

      在此之前,OC養(yǎng)到后期要么自己動手,創(chuàng)作圖像或小說,要么就需要在圈內(nèi)花錢找人約文、約稿、約角色曲。

      但現(xiàn)在,基于捏Ta平臺就可以做到。正如“奇旅”玩法開展之時頁面上的那句“探索角色的更多面”。

      目前社區(qū)的產(chǎn)出有六到七成為有字幕和多幅圖像的類漫畫作品。胡修涵也透露,他們的平臺現(xiàn)在有近50萬用戶,其中女生占七成,也大都比較年輕。

      “她們的一個共同標(biāo)簽就是很多都寫過小說,或者說搞過同人創(chuàng)作。她們內(nèi)心其實(shí)有一個很強(qiáng)烈的心理,就是把自己內(nèi)心的想法做一個更圖像化的表達(dá),讓更多人看到,這樣才能建立起內(nèi)心的正反饋。”他說。

      不過,當(dāng)前捏Ta平臺并沒有明顯的付費(fèi)點(diǎn),在生成圖像時所消耗的“電量”類似游戲中的“體力值”,可以隨著時間慢慢恢復(fù),也可以通過社區(qū)點(diǎn)贊分享等行為獲取。

      在“電量值”上是否會做類似游戲的“月卡買體力”玩法,胡修涵不置可否。不過他分享了當(dāng)前平臺已有的兩種方式。

      第一,得益于國內(nèi)繁榮的周邊物流供應(yīng)鏈,捏Ta也提供一個把用戶的原創(chuàng)角色定制成亞克力吊牌或吧唧(二次元宅圈的周邊徽章)等周邊道具的渠道。

      第二,從長遠(yuǎn)來看,用戶捏的角色也有可能成為自身就具有內(nèi)容價值的產(chǎn)品,可以向第三方出租或售賣。

      “就像是openai的GPT商店,開發(fā)者可以把自己定制的GPT掛出來給其他用戶使用,從中收取傭金。但現(xiàn)在GPTs沒有跑通,可能意味著只有prompt的價值不高,或者至少建立不起某種經(jīng)濟(jì)循環(huán)。所以核心的點(diǎn)在于售賣的資產(chǎn)本身。”胡修涵說。

      15人團(tuán)隊創(chuàng)立兩年,

      全網(wǎng)曝光2.5億

      剛過30歲的胡修涵,在2014年畢業(yè)于北京大學(xué),獲得了智能科學(xué)和經(jīng)濟(jì)學(xué)雙學(xué)位,并在此后的美國哥倫比亞大學(xué)取得了碩士學(xué)位。

      他最早進(jìn)入了Meta的視頻戰(zhàn)略組,擔(dān)任一個30人左右團(tuán)隊的技術(shù)主管,主要負(fù)責(zé)Facebook、WhatsApp、Instagram三個平臺的視頻相關(guān)全套技術(shù)方案。

      也就是在做短視頻、短劇類內(nèi)容、新聞、游戲直播時,負(fù)責(zé)內(nèi)容管理、視頻中插廣告的系統(tǒng)對接、版權(quán)數(shù)據(jù)分析等工作。

      在那時,他遇到了現(xiàn)在“看見概念”團(tuán)隊的合伙人兼CPO宋禹君,清華大學(xué)本科,碩士則畢業(yè)于卡內(nèi)基梅隆大學(xué)的人機(jī)交互專業(yè)。

      胡修涵表示,由于最初做的都是內(nèi)容方面的工作,在Meta時能以7%占比的頭部內(nèi)容獲取平臺90%的觀看量,因此他們對于不同市場、不同內(nèi)容類型的需求變化較為敏感。

      2018年,胡修涵回國進(jìn)入阿里巴巴,帶領(lǐng)團(tuán)隊先后參與了2019雙十一大規(guī)模數(shù)據(jù)可視化的高性能渲染工作。

      2020年,他又進(jìn)入了一家上海的B輪獨(dú)角獸特贊,擔(dān)任技術(shù)VP,從零搭建了這家公司的內(nèi)容資產(chǎn)管理產(chǎn)品線。

      當(dāng)特贊的新產(chǎn)品線收入從十幾萬上漲到上億級,時間來到了2022年12月份。

      在這時,Stable Diffusion已經(jīng)發(fā)布有4個月,它的開源是AI繪畫爆火的直接原因,也正是基于SD其開發(fā)的無數(shù)圖像生成模型將這一話題不斷發(fā)酵,一齊將AI繪畫推向了輿論熱潮的高峰。

      而顛覆AI圈的ChatGPT也在11月30日剛剛推出。

      這些都讓胡修涵覺得,C端的內(nèi)容生態(tài)創(chuàng)作端或許會因此而發(fā)生大的變革。

      于是當(dāng)月,胡修涵出走創(chuàng)業(yè),正式創(chuàng)立了“看見概念”公司,他瞄準(zhǔn)了二次元社區(qū)。

      2023年一年,團(tuán)隊主要基于SD框架進(jìn)行技術(shù)研發(fā),但原模型風(fēng)格不夠二次元審美,風(fēng)格上也比較難符合多樣化的鏡頭。而部分風(fēng)格優(yōu)良的模型則人物肢體穩(wěn)定性欠佳。

      因此,在生成人物的表情、動作、鏡頭、風(fēng)格表達(dá)多樣性,風(fēng)格易調(diào)用性,以及多人畫面的穩(wěn)定性等方面,團(tuán)隊進(jìn)行了大量的研發(fā)。

      2024年4月,團(tuán)隊正式上線了“捏Ta”微信小程序。

      這個名字來源于日語“梗”(Neta)的讀音,在ACG圈中常被用作玩梗、致敬使用。在同人二創(chuàng)圈里,又和“養(yǎng)OC”“養(yǎng)娃”“捏角色”等概念相似。

      捏Ta的社交媒體曝光量已達(dá)到約2.5億次,位列視頻號動漫游戲日榜前十,日均用戶使用時長可達(dá)40分鐘。

      令胡修涵印象最深的,是一名用戶在200天內(nèi),用AI工具生成了500多個原創(chuàng)角色。

      剛剛推出的Neta Art XL模型,則覆蓋了超過1.3萬個角色,近千個不同風(fēng)格的藝術(shù)家,在部分二次元專屬名詞的識別和生成上,也進(jìn)行了優(yōu)化。

      目前,整個“看見概念”團(tuán)隊共有15人,其中大部分都是產(chǎn)品研發(fā)。

      團(tuán)隊的核心技術(shù)成員來自Meta、字節(jié)跳動、B站、小馬智行(Pony.ai)等企業(yè),也曾深度參與二次元開源模型AIDXL以及視頻生成模型開源項(xiàng)目AnimateDiff的開發(fā)。

      面向群體:“當(dāng)年在辦公室摸魚寫網(wǎng)文”的人

      事實(shí)上,AI繪畫應(yīng)用產(chǎn)品在國內(nèi)早已有過一波井噴期。

      2021年年初,OpenAI推出了里程碑式的DALL·E模型和CLIP框架,前者被稱為2021年第一個令人興奮的AI技術(shù)突破,后者則是一種能將文本與圖像聯(lián)系起來的特殊的”圖像識別“。

      自此之后,AI繪畫就開始飛速發(fā)展。直到2022年8月,Stable Diffusion開源,短時間內(nèi)產(chǎn)生了一大批低門檻的AI繪畫工具。

      捏Ta為什么出現(xiàn)在現(xiàn)在?它與已有的AI繪畫式工具又有哪些不同?

      胡修涵認(rèn)為,當(dāng)圖像生成領(lǐng)域開始出現(xiàn)技術(shù)革新,產(chǎn)品慢慢涌現(xiàn)時,一開始或許會比較傾向于引入成熟的工作流程中,去快速解決已有的問題,并快速獲取一個正面反饋。

      而一開始跟進(jìn)新技術(shù)的人,大多也是對技術(shù)敏感,對AI本身感興趣的人。這個群體會傾向于更專業(yè)的工具,也會自然希望把工具盡快集成自己的生產(chǎn)流程。

      就像是游戲影視行業(yè)的部分公司,他們引入AI繪畫搭建了新的工作流程,達(dá)成了更高效或者更便宜的效果,這時候新技術(shù)就被內(nèi)部消化掉了,也就沒有什么產(chǎn)品流出來。

      但捏Ta并非是一個創(chuàng)作力工具被應(yīng)用于工作能效,它本身就是基于具體的創(chuàng)作目的設(shè)計的,是一個泛娛樂化產(chǎn)品。

      與那些喜歡嘗鮮的AI愛好者不同,胡修涵提到,他們的用戶群體是泛C端,也就是“當(dāng)年做卡點(diǎn)音樂視頻,在辦公室摸魚寫網(wǎng)文的一群人”。

      這個群體是為了好玩,為了自我表達(dá)而創(chuàng)作,而不是為了解決某個工作問題,為了越做越快越做越好。

      在胡修涵看來,他們帶來的通常是一種長期的內(nèi)容創(chuàng)作,或許短期內(nèi)看似無法產(chǎn)生直接變現(xiàn),但長期則會形成一種有價值的消費(fèi)社區(qū)生態(tài)。

      “所以專業(yè)的用戶其實(shí)是不屑于用我們這類工具的,因?yàn)槲覀冇幸庾R地把復(fù)雜度全藏起來了。但我覺得一個大眾性的好的產(chǎn)品,他針對的肯定不是先鋒用戶。就像我們的用戶,他們不是被AI打動的,而是因?yàn)閷Χ卧呐d趣才來玩我們的產(chǎn)品的。”胡修涵說。

      因此,在多次采訪中,胡修涵都強(qiáng)調(diào),他們希望捏Ta能成為一個創(chuàng)作平臺,有足夠多的內(nèi)容創(chuàng)作者在產(chǎn)出,也能形成社區(qū)進(jìn)行交流。

      當(dāng)然,現(xiàn)在幾乎所有的內(nèi)容創(chuàng)作平臺都面臨著一個長期的困境:內(nèi)容產(chǎn)出不夠怎么辦?在胡修涵看來,最好的方法就是讓越來越多的人都能參與創(chuàng)作

      而到更遠(yuǎn)的時候,基于更加成熟的生成技術(shù),以及更大更優(yōu)質(zhì)的用戶,社區(qū)中誕生的原創(chuàng)優(yōu)質(zhì)角色和圍繞其展開的故事越來越多,其中最頭部的可能就會成為新一代的大熱偶像IP。

      AI繪畫:拼湊、融合、還是未來?

      不過,對于同人二創(chuàng)圈,AI的參與一直是一件相當(dāng)微妙的事。

      對于很多創(chuàng)作者來說,圖像是自我表達(dá)的一種方式,而由冰冷機(jī)器生成的圖像難免欠缺靈魂,甚至有“AI繪畫是拼湊尸塊”的言論。

      作為技術(shù)開發(fā)者,胡修涵先解釋了AI繪畫的大致流程:多層神經(jīng)網(wǎng)絡(luò)模型會學(xué)習(xí)圖像和與圖像對應(yīng)的一系列文本描述,然后將圖片中的內(nèi)容翻譯成一個“高維文本向量”,也就是“理解圖像”。

      當(dāng)這種翻譯足夠合理,理解足夠深刻時,模型就能反過來,將一系列的文本描述變回相應(yīng)的畫面。

      所以,AI繪畫并非是很多人想象的像素重組或元素拼接,而是在概念上做了一個融合創(chuàng)新。

      “我會覺得AI繪畫很像是去追哈利波特世界里的金色飛賊。在使用內(nèi)容創(chuàng)作模型時,你實(shí)際上就是要用盡可能多的文字限制,把你最想要的那個鏡頭畫面逼到一個角落。”胡修涵說。

      而對于這種論調(diào)帶來的對整個AI繪畫的消極甚至反對態(tài)度,胡修涵也十分冷靜。

      作為老二次元,胡修涵非?隙,整個泛二次元群體中有大量“沉默的大多數(shù)”,他們對于AI繪畫的抵觸心理不強(qiáng),對于畫師和繪圈也沒有那么高的忠誠度——沒有足夠的繪畫技巧、沒有時間精力,或者沒有金錢去約稿,所以無法開始自我創(chuàng)作和表達(dá),這才是這群人的核心需求。

      并且,在胡修涵看來,跳出這個群體,AI繪畫也是一種無法阻擋的趨勢。

      他提到,今年兩會上,央視就用AI生成了一系列海報,這就代表了一種非常具有傾向性的鼓勵和引導(dǎo)。

      此外,他們的平臺在沒有投流推廣下實(shí)現(xiàn)了2.5億次以上的流量曝光,這也說明總有人喜歡這些內(nèi)容。而隨著技術(shù)的不斷迭代,人們的思想也不不斷改變,未來參與進(jìn)來的人或許會有更多。

      至于AI繪畫帶來的版權(quán)問題,胡修涵認(rèn)為,某個內(nèi)容創(chuàng)作需要人的勞動成本,這是一個前AI時代的經(jīng)濟(jì)理論邏輯。

      隨著AI的發(fā)展,單個內(nèi)容的生產(chǎn)和傳播成本發(fā)生了極大的改變,這時候就需要重新考慮相關(guān)問題。

      比如,對于AI繪畫的定義,未來可能會發(fā)展到需要畫師的“開光”。

      “畫師可以認(rèn)證那些AI生成的東西,說這幾張圖掌握了我的精髓,那可能這些圖的收益就要分他一部分;沒有經(jīng)過認(rèn)證或授權(quán)的AI圖像的價值就極低……總之,未來應(yīng)該會有一套新的版權(quán)價值體系。”胡修涵說。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。