大模型如何落地?怎么落地?成為今年科技領(lǐng)域的頭號(hào)主題。
在一個(gè)不為大多數(shù)人所知道的造字賽道中,這家清華創(chuàng)業(yè)公司——「圖形起源」悄然實(shí)現(xiàn)商業(yè)變現(xiàn):
幫助字體公司降低80%成本,提速10倍以上。Canva可畫上最受歡迎的前100套中文字體,大部分都是用他們的算法生成的。
這個(gè)賽道足夠小也確實(shí)剛需,設(shè)計(jì)公司、字體公司苦版權(quán)費(fèi)用久矣。
而他們憑借原本積累的圖形學(xué)與AI的技術(shù)優(yōu)勢,實(shí)現(xiàn)了人工所不能及的效率和精度。
來看看他們是如何發(fā)現(xiàn)以及靠AI造字來賺錢的。
靠AI造字賺錢,提速10倍以上
首先來了解一下什么是字體生產(chǎn)?
傳統(tǒng)的字體生產(chǎn)流程,往往需要設(shè)計(jì)師用手寫的方式來完成整套字體的制作,(一套字體最多近3萬字)并且在初稿完成后,還需要人工團(tuán)隊(duì)進(jìn)行逐字校對(duì)。
因?yàn)榧內(nèi)斯げ僮,這樣一套流程下來不僅周期長,往往需要一個(gè)季度。對(duì)于字體公司來說,這是一筆不小的成本支出。
與此同時(shí),也正因?yàn)槿斯,單個(gè)字體字形質(zhì)量風(fēng)格等細(xì)節(jié)上不好把控。
對(duì)于設(shè)計(jì)公司來說,制作過程中的高成本,也導(dǎo)致了商用版權(quán)字體采買費(fèi)用的高昂。
正是在同客戶交流時(shí),圖形起源團(tuán)隊(duì)發(fā)現(xiàn)了這一行業(yè)痛點(diǎn),耗時(shí)數(shù)月打造了一套字體生產(chǎn)線。
這不是簡單應(yīng)用一個(gè)大模型就能直接生成的。字體設(shè)計(jì)最大的區(qū)別在于它是矢量圖,可以無限放大而不失真。而目前AI生成的圖通常是位圖,有像素限制。
如何讓AI生成矢量圖,理解字體的錨點(diǎn)和矢量曲線的含義,成為核心的技術(shù)難點(diǎn)。
創(chuàng)始人史海天分享了他們的解決思路,整個(gè)流程分為四個(gè)階段:
首先,用一個(gè)傳統(tǒng)的Diffusion模型會(huì)生成位圖;
其次,用第二個(gè)超分辨率模型,把字體位圖的分辨率提到最高;
然后,用一種獨(dú)特的算法,讓AI能夠理解什么是“好的矢量設(shè)計(jì)”,設(shè)計(jì)第三個(gè)模型,以這種“好“的審美作為優(yōu)化目標(biāo),用訓(xùn)練后的模型把位圖轉(zhuǎn)化成矢量圖;
最后,訓(xùn)練一個(gè)專門檢查錯(cuò)別字和字形結(jié)構(gòu)的模型。
除此之外,他們還計(jì)劃開發(fā)筆畫拆分模型。
基于這樣的模型,他們能實(shí)現(xiàn)人類所不能達(dá)到高效和高質(zhì)量。
比如基于AI超分技術(shù)和AI矢量化,像各種筆畫、偏旁部首的邊緣細(xì)節(jié)處理,能禁得起任意放大維度,設(shè)計(jì)師能在海報(bào)等場景中使用。
客戶只需要完成前199個(gè)字的操作,AI就能在兩天內(nèi)訓(xùn)練并生成數(shù)萬字。并且也不限于簡體,像繁體字、生僻字,日文韓文拉丁這樣的多語種也OK。
在準(zhǔn)確率上,簡單字形(筆畫<15)單次生成的平均生成錯(cuò)字率小于1%,復(fù)雜字形(筆畫≥15)單次生成的平均生成錯(cuò)字率小于5%,已經(jīng)遠(yuǎn)高于人工審校的準(zhǔn)確度。
現(xiàn)在他們還打造了一個(gè)SaaS平臺(tái),整個(gè)交付過程都可以在線上進(jìn)行?蛻裟茈S時(shí)查看進(jìn)度,或自己完成全部生產(chǎn)過程,不用圖形起源的人工干預(yù)。
據(jù)透露,目前他們已經(jīng)生成了346套字體,累計(jì)4680244個(gè)字。
來自圖形起源
圖形起源成立于2020年底,是由當(dāng)時(shí)清華大學(xué)車輛學(xué)院畢業(yè)生史海天,讀碩士休學(xué)時(shí)候創(chuàng)辦。
在此之前,他們主要做3D創(chuàng)作引擎,并完成了三輪融資,受到像五源資本、真格基金等機(jī)構(gòu)的青睞。當(dāng)時(shí)他們的愿景是,希望在未來建立一個(gè)大眾化的3D內(nèi)容創(chuàng)作工具,以及一個(gè)普通人愿意在其中生活的社交世界。
不過現(xiàn)在史海天回憶當(dāng)時(shí)沒有找到很好的變現(xiàn)場景,如今大模型的到來,帶給他們?nèi)碌臋C(jī)遇。
當(dāng)時(shí)他們花了很長時(shí)間和資金來驗(yàn)證這件事情。史海天透露,他們當(dāng)時(shí)訓(xùn)了兩個(gè)大模型,一個(gè)用來識(shí)別,一個(gè)用來生成,訓(xùn)練目標(biāo)是AI生成的字體讓AI分辨不出。
不過這個(gè)行業(yè)的優(yōu)點(diǎn)在于,字體數(shù)據(jù)是比較全的,比如一套字能喂給AI一半字,讓AI可以生成剩下一半字。
最后他們也實(shí)現(xiàn)了交付級(jí)別的生成效果,目前一周能完成超過40套字體的交付,相當(dāng)于效率提升了幾百倍。
目前公司主要有兩個(gè)主營業(yè)務(wù)。
中文字庫擴(kuò)寫,也就是客戶給參考字體文件,圖形起源AI先進(jìn)行一波學(xué)習(xí),然后生成風(fēng)格統(tǒng)一的字形。
整個(gè)流程都是在SaaS平臺(tái)上進(jìn)行,平臺(tái)上支持人工校對(duì)、二次學(xué)習(xí)、批量生成、人工二次篩選等工作,以進(jìn)一步降低生成字體的錯(cuò)字率。
跨語種風(fēng)格遷移。顧名思義,就是根據(jù)任意語種任意字體,來生成同種風(fēng)格的任意語種任意字形。
目前他們能夠穩(wěn)定生成中日韓拉丁字母、希臘字母、西里爾字母,常見符號(hào)數(shù)字等,并且已經(jīng)在小米應(yīng)用商店有售賣。
而像藏文、阿拉伯文等小語種文字還在內(nèi)測階段。
最后想說,雖然現(xiàn)在看各個(gè)大廠都在卷生產(chǎn)力場景,市場很卷。但是具體到各個(gè)細(xì)分場景下,大企業(yè)也許就沒有那么多的資金精力去投入。
那些場景看上去需求有限,但確實(shí)同樣也是強(qiáng)剛需,也能實(shí)現(xiàn)商業(yè)變現(xiàn)。比如字體,比如排版。
對(duì)于創(chuàng)業(yè)公司來說,就是個(gè)不錯(cuò)的切入點(diǎn)。圖形起源就是一個(gè)。
如今大模型應(yīng)用如火如荼,到底還是看能不能解決實(shí)際問題。這條真理已經(jīng)是再明確不過了。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。