在AI工具間來(lái)回切換了1年后,可靈用一張畫(huà)布終結(jié)了它 精華
這次去WAIC,論壇、探展直播、活動(dòng)等等,硬生生干了個(gè)周末,幾乎累麻了。。
我自己這兩天印象最深的,也是我覺(jué)得對(duì)我最有用的。
還是可靈的更新。
他們首發(fā)了1個(gè)全新的功能,靈動(dòng)畫(huà)布,還把之前的多圖參考做了巨幅升級(jí)。
這兩都挺酷的。
我當(dāng)時(shí)在現(xiàn)場(chǎng),錄了一下靈動(dòng)畫(huà)布的發(fā)布,真的,發(fā)完以后底下掌聲雷動(dòng)。

這個(gè)形態(tài)我當(dāng)時(shí)看完以后,眼前一亮,確實(shí)非常的有意思。
特別是對(duì)于AI創(chuàng)作者來(lái)說(shuō)。
當(dāng)時(shí)論壇結(jié)束以后,我問(wèn)他們啥時(shí)候能用,他們說(shuō)一會(huì)閉館了我們晚上回去讓產(chǎn)品給你開(kāi),但是你要是急的話,可以去樓上的可靈展區(qū)先試試看。
然后我就去樓上了。
給我看懵逼了。
我拍了一下當(dāng)時(shí)的展區(qū)的盛況。

根本就特么擠不進(jìn)去,我說(shuō)我還是等你們晚上給我開(kāi)吧,就掉頭回酒店了。
晚上的時(shí)候,他們給我發(fā)了一句,可以用了。
果然,我登上去,發(fā)現(xiàn)已經(jīng)開(kāi)好了。
靈動(dòng)畫(huà)布在工具欄的最左邊。

點(diǎn)進(jìn)來(lái)之后的界面,是這樣的。

其實(shí)你能看到,最大的三個(gè)功能,就是以模態(tài)為劃分的,圖片生成、視頻生成、音效生成。
這個(gè)界面你可以先不用管,我們隨便點(diǎn)開(kāi)一個(gè),比如圖片生成。

進(jìn)去以后,你會(huì)發(fā)現(xiàn),自己來(lái)來(lái)到畫(huà)布界面,出現(xiàn)了節(jié)點(diǎn)。
左邊是Prompt輸入框,右邊是可以選擇的參數(shù),比如模型、比例、多少?gòu)堉?lèi)的。
中間用一個(gè)線給鏈接起來(lái)。
你只需要點(diǎn)一下立即生成。
他就會(huì)拉出一條新的線,鏈接到一塊新的卡片上,而這些卡片,就是圖片的生成結(jié)果。

大概幾十秒以后,四張圖生成出來(lái)了。

接下來(lái),就是靈動(dòng)畫(huà)布這種畫(huà)板式的產(chǎn)品,最棒的一點(diǎn)了。
在傳統(tǒng)的可靈的UI界面里,如果我們想把可靈生成的圖,用圖生視頻的方式生成AI視頻的話。
需要點(diǎn)擊這個(gè)生成視頻。

然后帶著這張圖,跳到了視頻生成的界面。

在對(duì)著一堆的按鈕和參數(shù),調(diào)完以后,生成視頻。
但是我們都知道,做一個(gè)AI視頻的片子,可能需要幾百?gòu)垐D,幾百個(gè)視頻。
就這么來(lái)回跳來(lái)跳出,人會(huì)跳成智障,感覺(jué)自己是個(gè)跳跳虎,你很容易就迷失了,忘了自己的素材在哪里。
特別是所有的生成結(jié)果都堆在右邊的結(jié)果欄里,圖和視頻混著排,我不知道你們,我自己是真的經(jīng)常干著就找不到我之前的內(nèi)容在哪了。
而在靈動(dòng)畫(huà)布里,就天然的適合做這種任務(wù)。
同樣的,你可以把鼠標(biāo)放在視頻生成上,然后單擊,就會(huì)出來(lái)兩個(gè)關(guān)聯(lián)的節(jié)點(diǎn),這時(shí)候,這張圖片自己本身和文本就作為素材節(jié)點(diǎn),再加上參數(shù)節(jié)點(diǎn),點(diǎn)擊生成以后就可以直接生成視頻。

在這里面,你就可以切換模型,切換生成類(lèi)型,還有一些幾條、幾秒等參數(shù)。
而新升級(jí)的多圖參考,也在這個(gè)里面。

素材節(jié)點(diǎn)+參數(shù)節(jié)點(diǎn),就可以得到我們的視頻生成結(jié)果。
同時(shí),這個(gè)視頻生成結(jié)果本身也是一個(gè)素材節(jié)點(diǎn),后續(xù)可以用文本輸入+視頻參考的形式,給這個(gè)視頻去加音效。
我們需要用到的,主要就是節(jié)點(diǎn)之間的排列組合。
比如文本輸入+參數(shù)節(jié)點(diǎn)生成圖片,比如圖片&文本輸入+參數(shù)節(jié)點(diǎn)生成視頻,或者文本輸入+參數(shù)節(jié)點(diǎn)直接生成視頻。
其實(shí)底層邏輯和可靈之前的用法都是一樣的,但是不同的是,它把每一個(gè)工作的節(jié)點(diǎn)拎了出來(lái),讓你在這個(gè)畫(huà)布上就能夠?qū)崟r(shí)查看你的每一步工作。
我們還可以,微調(diào)Prompt,并行的開(kāi)跑好幾個(gè)任務(wù),之前我經(jīng)常這么干,就是為了要一個(gè)最好的效果,而現(xiàn)在,在畫(huà)板上,并行會(huì)比傳統(tǒng)的UI直觀非常多。

這個(gè)并發(fā)的感覺(jué),究極壯觀,強(qiáng)迫癥患者表示爽飛了。
2分鐘左右,視頻跑完了,你還可以,給他們加音效。
最后,從文字到圖片到帶有音效的視頻,就成了一個(gè)流。

而且這個(gè)畫(huà)布是無(wú)限的,也就是說(shuō),你在上面鋪開(kāi)一整個(gè)短片分鏡也沒(méi)關(guān)系。
如果畫(huà)布太大,在畫(huà)布上迷路了咋辦?沒(méi)關(guān)系,右下角可以縮放,隨時(shí)會(huì)隨時(shí)提示你正在什么地方。

如果你的畫(huà)布被弄得特別亂怎么辦?也沒(méi)關(guān)系,它有一個(gè)功能叫做整理畫(huà)布。

點(diǎn)擊一下,咻的一下,頁(yè)面又整潔了。
對(duì)于創(chuàng)作者來(lái)說(shuō),非常直觀、方便、快捷,而且還極度可控。
我相信很多朋友其實(shí)都感覺(jué)到了,這玩意很像ComfyUI。
其實(shí)這種節(jié)點(diǎn)畫(huà)布式產(chǎn)品,越來(lái)越成為一種主流的交互形態(tài)了,比如ComfyUI、扣子、百度的自由畫(huà)布、Flowith等等。
這種形態(tài),我覺(jué)得解決了一個(gè)我一直認(rèn)為的AI工具生態(tài)化的核心難題。
產(chǎn)品間的孤島化。
過(guò)去幾年,其實(shí)AI工具發(fā)展得非常迅猛,但用戶的體驗(yàn)卻越來(lái)越破碎。
還記得2024年,我們生圖用Midjourney、生視頻用可靈、TTS用hailuo,生成完音頻以后再扔回可靈做口型驅(qū)動(dòng),實(shí)在是太操蛋了。
標(biāo)簽上永遠(yuǎn)開(kāi)著十幾個(gè)網(wǎng)頁(yè)。
也是后來(lái)我是在忍不了來(lái)回切換,搞了一個(gè)49寸的巨長(zhǎng)無(wú)比的顯示器,直接人工把所有的工具變成了節(jié)點(diǎn)式顯示器畫(huà)布,5、6個(gè)網(wǎng)頁(yè)并排排列。
這邊生成的素材我下載下來(lái),然后傳到另一個(gè)產(chǎn)品里面,然后生成完再下載下來(lái)上傳到另一個(gè)地方,效率有提高,但還是難受。
節(jié)點(diǎn)式畫(huà)布直接打通了這種孤島,把多個(gè)不同工具和功能真正整合成了一個(gè)平臺(tái)級(jí)的生態(tài)。
而且因?yàn)槲易约菏荱I設(shè)計(jì)師出身,在很久以前就在用畫(huà)布式的工具,比如Sketch、Figma、AI(Adobe那個(gè)AI)等等,其他大家也有一個(gè)很棒的點(diǎn)。
就是,我們真正在創(chuàng)作的時(shí)候,其實(shí)不是線性的。
創(chuàng)作一直是一種非線性、網(wǎng)狀的拓?fù)浣Y(jié)構(gòu)。
我們的靈感并不是順序產(chǎn)生的,而是隨機(jī)、并發(fā)、發(fā)散出現(xiàn)的。
而這種產(chǎn)品形態(tài),本身就非常的契合創(chuàng)作本身。
而可靈本身有生態(tài)級(jí)優(yōu)勢(shì),圖片、視頻做的很棒,做這種進(jìn)一步的創(chuàng)作工具,本身就是水到渠成的。
靈動(dòng)畫(huà)布上,還有一些小細(xì)節(jié)。
比如底下這個(gè)對(duì)話框,我在對(duì)話框里寫(xiě)一句提示詞,點(diǎn)右邊這只小筆,它就可以給我優(yōu)化提示詞。

我在這個(gè)框里寫(xiě)了一句生成一只金毛犬,這是它刷刷刷給我寫(xiě)的,還直接給出了任務(wù)節(jié)點(diǎn):

生成好的結(jié)果那一欄,也會(huì)有添加到對(duì)話框的選項(xiàng)。比如我生成了一張圖片,就可以添加到對(duì)話框里,讓它再做參考。
說(shuō)實(shí)話,這比我之前用可靈要省事太多了,不用翻歷史創(chuàng)作天荒地老,要什么東西直接一拖畫(huà)布,就拿到了。
還有首尾幀,你把兩張圖直接拖進(jìn)去,一框選,就可以直接生成首尾幀視頻,或者直接多圖參考生視頻,也行。

而且這個(gè)靈動(dòng)畫(huà)布,還可以多人協(xié)作,點(diǎn)擊右上角的分享,就可以把自己的畫(huà)布分享給別人。
也可以輸入?yún)f(xié)作者的ID來(lái)添加協(xié)作者。

目前最多能加五個(gè)協(xié)作者,對(duì)于一個(gè)短片來(lái)說(shuō),已經(jīng)很夠用了。
可以看到,可靈AI現(xiàn)在越來(lái)越想往生態(tài)、專(zhuān)業(yè)上去做出一些定義了。
并且因?yàn)閮?nèi)測(cè)中,所以還有很多功能不全,我整理羅列了一下。

除了靈動(dòng)畫(huà)布之外,還有一個(gè)新升級(jí)的就是多圖參考。
可靈的多圖參考生視頻是今年一月份出的,現(xiàn)在又來(lái)了一波更新,也可以直接在畫(huà)布中使用。

這次多圖參考的升級(jí),主要就是人物和角色更自然、一致性也更強(qiáng)了。
同時(shí)支持4張圖。
并且,可以參考部分區(qū)域。

可以參考主體,可以只參考面部、服飾等等。
讓參考更加的精準(zhǔn)。
我們用這個(gè)功能,玩很多的花活。
比如,肌肉男在麥當(dāng)勞中舉著卡皮巴拉深蹲。


比如,讓大衛(wèi)和女孩一起在花園里散步,畫(huà)風(fēng)保持的非常完美。


比如,兩只貓一起玩毛球。


非常的有意思。
用多圖參考,保證一致性,我覺(jué)得才是用AI來(lái)做故事的起點(diǎn)。
除了多圖生視頻之外,多圖生圖也有很多花活。
在圖片生成一欄,點(diǎn)參考生圖——多圖參考,就能看到主體、場(chǎng)景和風(fēng)格三個(gè)生圖維度了。

這個(gè)界面,有點(diǎn)眼熟之前Google的whisk,都是依據(jù)主體 - 場(chǎng)景 - 風(fēng)格來(lái)出圖,不過(guò)可靈的自由度還要更高。
whisk每個(gè)維度只能放一張圖,但可靈的主體這欄足足可以放四張圖。
我直接用它生成了一個(gè)拼好飯的升級(jí)版,拼好購(gòu)。


還有喜聞樂(lè)見(jiàn)的邪門(mén)cp修羅場(chǎng)大亂燉。


賊好玩。
做幾個(gè)case我覺(jué)得也不是特別有意思,于是,有了一點(diǎn)小想法,我就花了一下午和一晚上的時(shí)間,用靈動(dòng)畫(huà)布和多圖參考,做了一個(gè)小片子。
一個(gè)模特女孩的一天。
在多圖參考生的模式下,一致性會(huì)強(qiáng)到非常離譜。
我寫(xiě)完這篇文章的時(shí)候,已經(jīng)凌晨?jī)牲c(diǎn)了。
我看了眼屏幕上的靈動(dòng)畫(huà)布,滿滿當(dāng)當(dāng)?shù)墓?jié)點(diǎn)里堆滿了我這一晚上的奇思妙想,突然有種莫名的滿足感。
或許,我們距離真正的無(wú)限創(chuàng)作時(shí)代。
又更近了一步。
本文轉(zhuǎn)載自??????數(shù)字生命卡茲克??????,作者:數(shù)字生命卡茲克

















