谷歌nano banana正式上線：單圖成本不到3毛錢，比OpenAI便宜95%

2025-08-27 09:25:00

人工智能新聞

據介紹，該模型具有「SOTA 的圖像生成與編輯能力、驚人的角色一致性以及閃電般的速度」。

昨晚，神秘且強大的圖像生成與編輯模型 nano banana 終于正式顯露真身。沒有意外，它果然來自谷歌，并且也獲得了一個正式但無趣的名字：gemini-2.5-flash-image-preview。

據介紹，該模型具有「SOTA 的圖像生成與編輯能力、驚人的角色一致性以及閃電般的速度」。

下面是谷歌官方分享的一些示例：

從其名字也可以猜測，谷歌應該還有一個非 flash 的 gemini-2.5-image 模型 —— 其性能應該會更加強大，但速度會更慢。

現目前，gemini-2.5-flash-image-preview 已經在 Google AI Studio 和 Gemini API 中提供了預覽。用戶可以免費試用。

可以看到，gemini-2.5-flash-image-preview 支持 32k 上下文，提供了溫度（可以控制模型的創造力）以及一些高級設置。

然而，遺憾的是，該模型尚不支持對中文輸入執行圖像生成和編輯，而是會給出文本響應。

另外，在 Gemini 中，用戶只需選擇 2.5 Flash 并使用合適的提示詞，也可以使用該模型。

價格方面，gemini-2.5-flash-image-preview 輸入/輸出文本的價格是 0.3/2.5 美元，輸入/輸出圖像的價格是 0.3/30 美元。知識截止時間是 2025 年 6 月。

大概計算下來，該模型生成每張圖像的成本大約為 0.039 美元（約 0.28 元），遠低于 OpenAI 的圖像生成成本。

具體功能（尤其是圖像編輯）上，谷歌官方博客介紹說他們尤其注重在不同圖片間保持人物形象的一致性。

「我們知道，當你編輯自己或熟悉的人時，哪怕是細微的差別都會顯得刺眼 ——『差一點但不完全一樣』的效果就是感覺不對。正因如此，我們的最新更新專門針對這一點，讓你的朋友、家人，甚至寵物，無論是嘗試 60 年代的蜂窩頭發型，還是給吉娃娃穿上芭蕾舞裙，都能始終看起來像他們自己。」

你只需要給 Gemini 一張照片，并告訴它你想要修改的地方，就能加上獨特的個人風格。該模型可以幫你把自己和寵物放在同一張照片里，把房間背景換成新壁紙的效果，或者把你帶到世界上任何你能想象的地方 —— 同時保持「你就是你」。完成后，你甚至可以把編輯過的照片再次上傳到 Gemini，把新圖變成一段有趣的視頻。

谷歌還分享了一些玩法示例。

換裝或換場景：上傳一張人物或寵物的照片，該模型會在任何新場景下都保持他們的外貌一致。你可以嘗試不同的服裝、職業，甚至看看你在另一個年代會是什么樣子 —— 但始終還是你自己。