一張圖生成3A級游戲畫面!騰訊混元全新開源Hunyuan-GameCraft 原創
只需一張靜態圖片、一段文字描述,一段3A級高清動態游戲視頻即刻生成。游戲內容的生產方式,正在被重新定義。
?
今天,騰訊混元團隊正式開源 Hunyuan-GameCraft。作為基于 HunyuanVideo 底模的高動態交互式游戲視頻生成框架,它專注于高動態交互式游戲視頻生成,允許用戶通過一張圖片 + 文字描述 + 動作指令,實時生成高清游戲動態視頻,例如第一人稱跑酷、第三人稱探險等場景。
?

?
傳統游戲視頻制作面臨三大痛點:動作僵硬、場景靜態、制作成本高昂。Hunyuan-GameCraft 的推出,正是為了解決這些根本問題。它通過統一連續動作空間,支持高精度控制,生成動態內容的同時,保持了角色和環境的長期一致性,將制作成本壓縮到消費級硬件可承載的范圍。
?
我們先來看幾個官方案例:
?
寧靜的風景是一條河流蜿蜒穿過郁郁蔥蔥的綠色田野,在明亮的藍天上點綴著蓬松的云朵。
?

?
風景如畫的鄉村景觀,在部分多云的天空下,傳統的風車周圍環繞著金色的田野。
?

?
風景如畫的鄉村風光,擁有古色古香的房屋、風車、郁郁蔥蔥的綠色植物和明亮藍天下寧靜的山脈背景。
?

?
在多種場景和風格的控制精度、長期一致性、歷史保存和動態性能方面,Hunyuan-GameCraft 具有強大功能。
?
技術架構層面 ,Hunyuan-GameCraft 實現了三大突破:
-
將離散的鍵盤鼠標動作信號統一映射到共享的連續相機表示空間,支持包括速度、角度等復雜輸入;
-
設計混合歷史條件訓練策略,通過結合當前輸入與歷史視頻幀信息,以自回歸方式生成序列,確保長期一致性;
-
采用模型蒸餾技術壓縮模型體積,推理速度提升 10-20 倍,單次動作響應延遲降至5秒內,滿足實時交互需求。
?

?
為了訓練這一系統,研究團隊構建了迄今最豐富的游戲視頻數據集——涵蓋《刺客信條》《荒野大鏢客》《賽博朋克2077》等 100 余款 3A 游戲,總計超過 100 萬段 1080p 高清游戲錄像片段。這些數據經過場景與動作感知的兩級劃分、光流梯度動作邊界檢測、質量過濾與亮度篩選,最終形成高精度標注的訓練樣本。
?
就在三周前,騰訊剛剛開源了混元 3D 世界模型 1.0——業界首個支持沉浸漫游、交互與仿真的開放世界生成模型,可將數周的 3D 場景建模工作縮短至幾分鐘。
?
而 Hunyuan-GameCraft 則進一步補充了動態游戲視頻生成能力,形成“靜態 3D 場景→動態交互內容”的完整工具鏈,推動游戲與數字內容創作的革新。
?
在游戲生成領域,Hunyuan-GameCraft 的技術路徑具有開創性。不同于傳統逐幀渲染或預錄制視頻,它通過動作信號與圖像條件的實時融合,創造出可交互的動態內容。用戶按下鍵盤方向鍵的瞬間,系統便基于輸入圖像和動作軌跡生成下一幀畫面,形成類似真實游戲的操控體驗。這種“輸入-生成”的實時閉環,為未來游戲形態提供了全新可能。
?
目前,Hunyuan-GameCraft 已在 GitHub 和 Hugging Face 全面開源,包含完整模型權重、訓練代碼和技術報告。技術團隊提供了清晰的部署指南,涵蓋推理、量化和 Docker 集成方案,開發者可快速上手實驗。
?
Hunyuan-GameCraft 的開源不只是技術成果的分享,更是對創作民主化的一次實質性推動——它讓每個有想象力的人,都能成為自己游戲世界的導演。

















