清華系“倉(cāng)頡”來(lái)了!大模型造字7天交付超40套,客戶(hù)成本大降80%
大模型如何落地?怎么落地?成為今年科技領(lǐng)域的頭號(hào)主題。
在一個(gè)不為大多數(shù)人所知道的造字賽道中,這家清華創(chuàng)業(yè)公司——「圖形起源」悄然實(shí)現(xiàn)商業(yè)變現(xiàn):
幫助字體公司降低80%成本,提速10倍以上。Canva可畫(huà)上最受歡迎的前100套中文字體,大部分都是用他們的算法生成的。


這個(gè)賽道足夠小也確實(shí)剛需,設(shè)計(jì)公司、字體公司苦版權(quán)費(fèi)用久矣。
而他們憑借原本積累的圖形學(xué)與AI的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)了人工所不能及的效率和精度。
來(lái)看看他們是如何發(fā)現(xiàn)以及靠AI造字來(lái)賺錢(qián)的。
靠AI造字賺錢(qián),提速10倍以上
首先來(lái)了解一下什么是字體生產(chǎn)?
傳統(tǒng)的字體生產(chǎn)流程,往往需要設(shè)計(jì)師用手寫(xiě)的方式來(lái)完成整套字體的制作,(一套字體最多近3萬(wàn)字)并且在初稿完成后,還需要人工團(tuán)隊(duì)進(jìn)行逐字校對(duì)。
因?yàn)榧內(nèi)斯げ僮鳎@樣一套流程下來(lái)不僅周期長(zhǎng),往往需要一個(gè)季度。對(duì)于字體公司來(lái)說(shuō),這是一筆不小的成本支出。
與此同時(shí),也正因?yàn)槿斯?,單個(gè)字體字形質(zhì)量風(fēng)格等細(xì)節(jié)上不好把控。
對(duì)于設(shè)計(jì)公司來(lái)說(shuō),制作過(guò)程中的高成本,也導(dǎo)致了商用版權(quán)字體采買(mǎi)費(fèi)用的高昂。
正是在同客戶(hù)交流時(shí),圖形起源團(tuán)隊(duì)發(fā)現(xiàn)了這一行業(yè)痛點(diǎn),耗時(shí)數(shù)月打造了一套字體生產(chǎn)線。
這不是簡(jiǎn)單應(yīng)用一個(gè)大模型就能直接生成的。字體設(shè)計(jì)最大的區(qū)別在于它是矢量圖,可以無(wú)限放大而不失真。而目前AI生成的圖通常是位圖,有像素限制。
如何讓AI生成矢量圖,理解字體的錨點(diǎn)和矢量曲線的含義,成為核心的技術(shù)難點(diǎn)。
創(chuàng)始人史海天分享了他們的解決思路,整個(gè)流程分為四個(gè)階段:
首先,用一個(gè)傳統(tǒng)的Diffusion模型會(huì)生成位圖;
其次,用第二個(gè)超分辨率模型,把字體位圖的分辨率提到最高;
然后,用一種獨(dú)特的算法,讓AI能夠理解什么是“好的矢量設(shè)計(jì)”,設(shè)計(jì)第三個(gè)模型,以這種“好“的審美作為優(yōu)化目標(biāo),用訓(xùn)練后的模型把位圖轉(zhuǎn)化成矢量圖;
最后,訓(xùn)練一個(gè)專(zhuān)門(mén)檢查錯(cuò)別字和字形結(jié)構(gòu)的模型。
除此之外,他們還計(jì)劃開(kāi)發(fā)筆畫(huà)拆分模型。
基于這樣的模型,他們能實(shí)現(xiàn)人類(lèi)所不能達(dá)到高效和高質(zhì)量。
比如基于AI超分技術(shù)和AI矢量化,像各種筆畫(huà)、偏旁部首的邊緣細(xì)節(jié)處理,能禁得起任意放大維度,設(shè)計(jì)師能在海報(bào)等場(chǎng)景中使用。

客戶(hù)只需要完成前199個(gè)字的操作,AI就能在兩天內(nèi)訓(xùn)練并生成數(shù)萬(wàn)字。并且也不限于簡(jiǎn)體,像繁體字、生僻字,日文韓文拉丁這樣的多語(yǔ)種也OK。
在準(zhǔn)確率上,簡(jiǎn)單字形(筆畫(huà)<15)單次生成的平均生成錯(cuò)字率小于1%,復(fù)雜字形(筆畫(huà)≥15)單次生成的平均生成錯(cuò)字率小于5%,已經(jīng)遠(yuǎn)高于人工審校的準(zhǔn)確度。
現(xiàn)在他們還打造了一個(gè)SaaS平臺(tái),整個(gè)交付過(guò)程都可以在線上進(jìn)行。客戶(hù)能隨時(shí)查看進(jìn)度,或自己完成全部生產(chǎn)過(guò)程,不用圖形起源的人工干預(yù)。
據(jù)透露,目前他們已經(jīng)生成了346套字體,累計(jì)4680244個(gè)字。
來(lái)自圖形起源
圖形起源成立于2020年底,是由當(dāng)時(shí)清華大學(xué)車(chē)輛學(xué)院畢業(yè)生史海天,讀碩士休學(xué)時(shí)候創(chuàng)辦。
在此之前,他們主要做3D創(chuàng)作引擎,并完成了三輪融資,受到像五源資本、真格基金等機(jī)構(gòu)的青睞。當(dāng)時(shí)他們的愿景是,希望在未來(lái)建立一個(gè)大眾化的3D內(nèi)容創(chuàng)作工具,以及一個(gè)普通人愿意在其中生活的社交世界。
不過(guò)現(xiàn)在史海天回憶當(dāng)時(shí)沒(méi)有找到很好的變現(xiàn)場(chǎng)景,如今大模型的到來(lái),帶給他們?nèi)碌臋C(jī)遇。
當(dāng)時(shí)他們花了很長(zhǎng)時(shí)間和資金來(lái)驗(yàn)證這件事情。史海天透露,他們當(dāng)時(shí)訓(xùn)了兩個(gè)大模型,一個(gè)用來(lái)識(shí)別,一個(gè)用來(lái)生成,訓(xùn)練目標(biāo)是AI生成的字體讓AI分辨不出。
不過(guò)這個(gè)行業(yè)的優(yōu)點(diǎn)在于,字體數(shù)據(jù)是比較全的,比如一套字能喂給AI一半字,讓AI可以生成剩下一半字。
最后他們也實(shí)現(xiàn)了交付級(jí)別的生成效果,目前一周能完成超過(guò)40套字體的交付,相當(dāng)于效率提升了幾百倍。
目前公司主要有兩個(gè)主營(yíng)業(yè)務(wù)。

中文字庫(kù)擴(kuò)寫(xiě),也就是客戶(hù)給參考字體文件,圖形起源AI先進(jìn)行一波學(xué)習(xí),然后生成風(fēng)格統(tǒng)一的字形。
整個(gè)流程都是在SaaS平臺(tái)上進(jìn)行,平臺(tái)上支持人工校對(duì)、二次學(xué)習(xí)、批量生成、人工二次篩選等工作,以進(jìn)一步降低生成字體的錯(cuò)字率。

跨語(yǔ)種風(fēng)格遷移。顧名思義,就是根據(jù)任意語(yǔ)種任意字體,來(lái)生成同種風(fēng)格的任意語(yǔ)種任意字形。
目前他們能夠穩(wěn)定生成中日韓拉丁字母、希臘字母、西里爾字母,常見(jiàn)符號(hào)數(shù)字等,并且已經(jīng)在小米應(yīng)用商店有售賣(mài)。
而像藏文、阿拉伯文等小語(yǔ)種文字還在內(nèi)測(cè)階段。
最后想說(shuō),雖然現(xiàn)在看各個(gè)大廠都在卷生產(chǎn)力場(chǎng)景,市場(chǎng)很卷。但是具體到各個(gè)細(xì)分場(chǎng)景下,大企業(yè)也許就沒(méi)有那么多的資金精力去投入。
那些場(chǎng)景看上去需求有限,但確實(shí)同樣也是強(qiáng)剛需,也能實(shí)現(xiàn)商業(yè)變現(xiàn)。比如字體,比如排版。
對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō),就是個(gè)不錯(cuò)的切入點(diǎn)。圖形起源就是一個(gè)。
如今大模型應(yīng)用如火如荼,到底還是看能不能解決實(shí)際問(wèn)題。這條真理已經(jīng)是再明確不過(guò)了。


































