快手「可靈」再進化!視頻續寫可達3分鐘讓全球網友炸鍋 精華
最近,可靈AI直接讓一位網友的家人群里炸鍋了……
事情是這樣的,這位網友的父親需要做搭橋手術,為了給父親鼓舞,他便試著用可靈AI把爺爺的兩張老照片還原成了視頻。
在下面這個視頻中,爺爺正在朝鮮戰場,擔任營指導員。穿越時光隧道,1950年代風華正茂的爺爺,對著他揮了揮手。

這位網友把視頻發到家人群后,群里直接炸了!

下面這張黑白的合影,是全家唯有的一張全家福。

當已經故去的人忽然動了起來,音容笑貌一如往昔,每個人都淚目了。

家人們久久不能平靜,即使已過午夜,群里仍然不斷有消息響起。

用AI還原老照片后,全家人仿佛一起經歷了一場尋根之旅,從長輩口述的「家史」中,每個人都獲得了更多的自我身份認同感。
網友「玨哥」在他的公眾號「覺得有意思」里表示,在他看來,AI最大的意義就是成為一臺超級造夢機器:安排自己做個美夢,一覺醒來就有繼續去生活的勁頭了。
歪果仁都「饞哭了」
是的,這幾天快手可靈最新上線的圖生視頻和視頻續寫功能,不僅在國內掀起一波試用的熱潮,還「饞哭」了一眾外國網友。


如今,X上已經鋪滿了可靈生成和續寫的視頻。
比如這張著名的經典表情包,經過可靈的續寫后終于有了大結局!

每一步都在意料之外,但似乎又在情理之中(手動狗頭)
狗狗吃面也變得活靈活現。

要知道,曾經的快手可靈一出世,就讓外國網友們發出心悅誠服的感嘆:效果居然比Sora還要好!

同樣是吃漢堡,可靈生成的「咬痕」就要比Sora更加逼真
一些申請到試用資格的用戶紛紛表示「真香」。而那些不能親自體驗的國外網友,紛紛「跪求」幫忙生成。


可以說,可靈給全世界的開發者們,再次帶來了來自中國的億點點震撼!

作者:溫維斯Wenvis
值得一提的是,由于太過爆火,快影App截至目前已有累計超過20萬人排隊申請。
所以說,這次可靈的兩大全新功能,究竟強大在哪里?
圖生視頻
首先來看第一個功能——圖生視頻。
這一功能直接做到了化靜為動,讓我們從此可以按需定制視覺敘事。

可靈在文生視頻上的諸多強大功能,也被一一完美融入了,比如創造逼真的運動場景、精確模擬物理特性、將復雜概念巧妙融合、輸出電影級畫質、自由調節視頻縱橫比等等。
上傳一張圖片,接下來,就是奇跡出現的時刻。
永遠面帶謎之微笑的蒙娜麗莎,竟然戴上了墨鏡,瞟向觀眾們的小眼神,更多了一絲調皮和狡黠。

prompt: 蒙娜麗莎用手戴了眼鏡
構建復雜時空一絕
業內都知道,模型在轉換靜態圖像為動態視頻時,如何細膩而準確地實現大幅度運動場景,要克服不少難點。
對此,可靈充分利用了基礎模型架構中的3D時空聯合注意力機制,在構建復雜時空運動方面,表現令人驚嘆。

下面這個由靜圖生成的牧羊犬追球的視頻,自然流暢,效果非常絲滑。
無論是牧羊犬一下一下晃動的耳朵,還是隨風飄揚的毛發,看起來都很符合物理規律。

prompt: 可愛的牧羊犬在奔跑,網球在彈跳,溫馨的氛圍
汽車在公路上飛馳的這段視頻,可靈對整體畫面的處理效果簡直堪稱廣告級大片。
不僅汽車疾速前行的姿態逼真自然,對向車道上接連不斷的車流、道路兩旁向后掠去的樹木、虛化處理的隔離帶,無不模擬出了疾馳的速度感,幾乎挑不出破綻。

prompt:汽車在公路上高速行駛,速度感,廣告片
文本指令控制視頻,女孩一鍵轉身
更厲害的是,可靈的圖生視頻模型還融入了強大的提示詞融合技術。
這就意味著,用戶可以對模型下達文本指令,來人為地掌控視頻中對象的動態表現了。
比如上傳這張女孩的照片后,普通的模型,可能會默認增加發絲飄動、花朵搖曳、水面閃爍波紋的效果。

但在可靈中,我們可以輸入「轉身背對鏡頭」的提示詞。
模型輸出的視頻中,女孩就開始優雅轉身,并且增添了轉身瞬間微笑、眨眼的細節,顯得更加自然生動。


可靈的這個新功能,也讓我們的想象力可以充分放飛。
比如小編在看《權力的游戲》時經常想象的一個場景——「憤怒的巨龍,漫天飛沙,奇幻風格電影」,提示詞輸入后,幻想中的場景瞬間成真了!
巨龍昂首展翅,掀起漫天黃沙,咆哮聲震耳欲聾

這種文本與圖像意義的緊密聯動,無疑對影視制作等行業意義重大。(看來好萊塢導演撤掉8億美元攝影棚,的確是明智的選擇)
從此,視覺敘事可以按需定制,許多行業必將掀起新的颶風。
此外,這個模型還能支持不同風格的圖像輸入,無論自然寫實,還是風格化圖像。
同時,它還兼容各種長寬比的圖像輸入,可以說是為國內各個短視頻平臺量身打造。

這張豎版的騎士,黑袍飛舞,光劍仙氣環繞,氛圍感瞬間拉滿
實測效果
憑AI電影《山海奇境》刷屏全網的制作人陳坤,半年之后用可靈的圖生視頻功能重制了一遍《山海奇鏡》的預告片。
留言區的網友直呼「有大片的味道」。果然AI一天,人間一年。
本文轉自新智元,作者:新智元

















