大模型如何落地?怎么落地?成為今年科技領(lǐng)域的頭號主題。
在一個不為大多數(shù)人所知道的造字賽道中,這家清華創(chuàng)業(yè)公司——「圖形起源」悄然實(shí)現(xiàn)商業(yè)變現(xiàn):
幫助字體公司降低80%成本,提速10倍以上。Canva可畫上最受歡迎的前100套中文字體,大部分都是用他們的算法生成的。
這個賽道足夠小也確實(shí)剛需,設(shè)計公司、字體公司苦版權(quán)費(fèi)用久矣。
而他們憑借原本積累的圖形學(xué)與AI的技術(shù)優(yōu)勢,實(shí)現(xiàn)了人工所不能及的效率和精度。
來看看他們是如何發(fā)現(xiàn)以及靠AI造字來賺錢的。
靠AI造字賺錢,提速10倍以上
首先來了解一下什么是字體生產(chǎn)?
傳統(tǒng)的字體生產(chǎn)流程,往往需要設(shè)計師用手寫的方式來完成整套字體的制作,(一套字體最多近3萬字)并且在初稿完成后,還需要人工團(tuán)隊進(jìn)行逐字校對。
因?yàn)榧內(nèi)斯げ僮,這樣一套流程下來不僅周期長,往往需要一個季度。對于字體公司來說,這是一筆不小的成本支出。
與此同時,也正因?yàn)槿斯ぃ瑔蝹字體字形質(zhì)量風(fēng)格等細(xì)節(jié)上不好把控。
對于設(shè)計公司來說,制作過程中的高成本,也導(dǎo)致了商用版權(quán)字體采買費(fèi)用的高昂。
正是在同客戶交流時,圖形起源團(tuán)隊發(fā)現(xiàn)了這一行業(yè)痛點(diǎn),耗時數(shù)月打造了一套字體生產(chǎn)線。
這不是簡單應(yīng)用一個大模型就能直接生成的。字體設(shè)計最大的區(qū)別在于它是矢量圖,可以無限放大而不失真。而目前AI生成的圖通常是位圖,有像素限制。
如何讓AI生成矢量圖,理解字體的錨點(diǎn)和矢量曲線的含義,成為核心的技術(shù)難點(diǎn)。
創(chuàng)始人史海天分享了他們的解決思路,整個流程分為四個階段:
首先,用一個傳統(tǒng)的Diffusion模型會生成位圖;
其次,用第二個超分辨率模型,把字體位圖的分辨率提到最高;
然后,用一種獨(dú)特的算法,讓AI能夠理解什么是“好的矢量設(shè)計”,設(shè)計第三個模型,以這種“好“的審美作為優(yōu)化目標(biāo),用訓(xùn)練后的模型把位圖轉(zhuǎn)化成矢量圖;
最后,訓(xùn)練一個專門檢查錯別字和字形結(jié)構(gòu)的模型。
除此之外,他們還計劃開發(fā)筆畫拆分模型。
基于這樣的模型,他們能實(shí)現(xiàn)人類所不能達(dá)到高效和高質(zhì)量。
比如基于AI超分技術(shù)和AI矢量化,像各種筆畫、偏旁部首的邊緣細(xì)節(jié)處理,能禁得起任意放大維度,設(shè)計師能在海報等場景中使用。
客戶只需要完成前199個字的操作,AI就能在兩天內(nèi)訓(xùn)練并生成數(shù)萬字。并且也不限于簡體,像繁體字、生僻字,日文韓文拉丁這樣的多語種也OK。
在準(zhǔn)確率上,簡單字形(筆畫<15)單次生成的平均生成錯字率小于1%,復(fù)雜字形(筆畫≥15)單次生成的平均生成錯字率小于5%,已經(jīng)遠(yuǎn)高于人工審校的準(zhǔn)確度。
現(xiàn)在他們還打造了一個SaaS平臺,整個交付過程都可以在線上進(jìn)行?蛻裟茈S時查看進(jìn)度,或自己完成全部生產(chǎn)過程,不用圖形起源的人工干預(yù)。
據(jù)透露,目前他們已經(jīng)生成了346套字體,累計4680244個字。
來自圖形起源
圖形起源成立于2020年底,是由當(dāng)時清華大學(xué)車輛學(xué)院畢業(yè)生史海天,讀碩士休學(xué)時候創(chuàng)辦。
在此之前,他們主要做3D創(chuàng)作引擎,并完成了三輪融資,受到像五源資本、真格基金等機(jī)構(gòu)的青睞。當(dāng)時他們的愿景是,希望在未來建立一個大眾化的3D內(nèi)容創(chuàng)作工具,以及一個普通人愿意在其中生活的社交世界。
不過現(xiàn)在史海天回憶當(dāng)時沒有找到很好的變現(xiàn)場景,如今大模型的到來,帶給他們?nèi)碌臋C(jī)遇。
當(dāng)時他們花了很長時間和資金來驗(yàn)證這件事情。史海天透露,他們當(dāng)時訓(xùn)了兩個大模型,一個用來識別,一個用來生成,訓(xùn)練目標(biāo)是AI生成的字體讓AI分辨不出。
不過這個行業(yè)的優(yōu)點(diǎn)在于,字體數(shù)據(jù)是比較全的,比如一套字能喂給AI一半字,讓AI可以生成剩下一半字。
最后他們也實(shí)現(xiàn)了交付級別的生成效果,目前一周能完成超過40套字體的交付,相當(dāng)于效率提升了幾百倍。
目前公司主要有兩個主營業(yè)務(wù)。
中文字庫擴(kuò)寫,也就是客戶給參考字體文件,圖形起源AI先進(jìn)行一波學(xué)習(xí),然后生成風(fēng)格統(tǒng)一的字形。
整個流程都是在SaaS平臺上進(jìn)行,平臺上支持人工校對、二次學(xué)習(xí)、批量生成、人工二次篩選等工作,以進(jìn)一步降低生成字體的錯字率。
跨語種風(fēng)格遷移。顧名思義,就是根據(jù)任意語種任意字體,來生成同種風(fēng)格的任意語種任意字形。
目前他們能夠穩(wěn)定生成中日韓拉丁字母、希臘字母、西里爾字母,常見符號數(shù)字等,并且已經(jīng)在小米應(yīng)用商店有售賣。
而像藏文、阿拉伯文等小語種文字還在內(nèi)測階段。
最后想說,雖然現(xiàn)在看各個大廠都在卷生產(chǎn)力場景,市場很卷。但是具體到各個細(xì)分場景下,大企業(yè)也許就沒有那么多的資金精力去投入。
那些場景看上去需求有限,但確實(shí)同樣也是強(qiáng)剛需,也能實(shí)現(xiàn)商業(yè)變現(xiàn)。比如字體,比如排版。
對于創(chuàng)業(yè)公司來說,就是個不錯的切入點(diǎn)。圖形起源就是一個。
如今大模型應(yīng)用如火如荼,到底還是看能不能解決實(shí)際問題。這條真理已經(jīng)是再明確不過了。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費(fèi)前列,女士夾克銷量同比增長72%,女士棉衣、女士羊毛衫銷量同比增長50%以上。男士外套銷量同比增長30%以上。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。