谷歌nano banana正式上線:單圖成本不到3毛錢,比OpenAI便宜95%
昨晚,神秘且強大的圖像生成與編輯模型 nano banana 終于正式顯露真身。沒有意外,它果然來自谷歌,并且也獲得了一個正式但無趣的名字:gemini-2.5-flash-image-preview。

據介紹,該模型具有「SOTA 的圖像生成與編輯能力、驚人的角色一致性以及閃電般的速度」。
下面是谷歌官方分享的一些示例:

從其名字也可以猜測,谷歌應該還有一個非 flash 的 gemini-2.5-image 模型 —— 其性能應該會更加強大,但速度會更慢。
現目前,gemini-2.5-flash-image-preview 已經在 Google AI Studio 和 Gemini API 中提供了預覽。用戶可以免費試用。

可以看到,gemini-2.5-flash-image-preview 支持 32k 上下文,提供了溫度(可以控制模型的創造力)以及一些高級設置。
然而,遺憾的是,該模型尚不支持對中文輸入執行圖像生成和編輯,而是會給出文本響應。

另外,在 Gemini 中,用戶只需選擇 2.5 Flash 并使用合適的提示詞,也可以使用該模型。

價格方面,gemini-2.5-flash-image-preview 輸入/輸出文本的價格是 0.3/2.5 美元,輸入/輸出圖像的價格是 0.3/30 美元。知識截止時間是 2025 年 6 月。

大概計算下來,該模型生成每張圖像的成本大約為 0.039 美元(約 0.28 元),遠低于 OpenAI 的圖像生成成本。

具體功能(尤其是圖像編輯)上,谷歌官方博客介紹說他們尤其注重在不同圖片間保持人物形象的一致性。
「我們知道,當你編輯自己或熟悉的人時,哪怕是細微的差別都會顯得刺眼 ——『差一點但不完全一樣』的效果就是感覺不對。正因如此,我們的最新更新專門針對這一點,讓你的朋友、家人,甚至寵物,無論是嘗試 60 年代的蜂窩頭發型,還是給吉娃娃穿上芭蕾舞裙,都能始終看起來像他們自己。」
你只需要給 Gemini 一張照片,并告訴它你想要修改的地方,就能加上獨特的個人風格。該模型可以幫你把自己和寵物放在同一張照片里,把房間背景換成新壁紙的效果,或者把你帶到世界上任何你能想象的地方 —— 同時保持「你就是你」。完成后,你甚至可以把編輯過的照片再次上傳到 Gemini,把新圖變成一段有趣的視頻。
谷歌還分享了一些玩法示例。
換裝或換場景:上傳一張人物或寵物的照片,該模型會在任何新場景下都保持他們的外貌一致。你可以嘗試不同的服裝、職業,甚至看看你在另一個年代會是什么樣子 —— 但始終還是你自己。

谷歌甚至還專門構建了一個演示模板應用來展示不同年代的你是什么樣。

地址:https://aistudio.google.com/apps/bundled/past_forward
合成照片:你現在可以上傳多張照片,把它們融合成一個全新的場景。比如,把你和狗狗的照片合成在籃球場上,生成一張完美的合影。

多輪編輯:你可以不斷修改 Gemini 生成的圖像。比如,從一間空房間開始,先刷墻,再加書架、家具或茶幾。Gemini 會一路協助你,只改動你指定的部分,同時保留其余部分。

混合設計:把一張圖的風格應用到另一張圖的物體上。比如,把花瓣的顏色和質感應用到一雙雨靴上,或者用蝴蝶翅膀的花紋設計一件連衣裙。

原生世界知識:該模型還能夠利用 Gemini 的世界知識,從而解鎖全新的應用場景。為了展示這一點,谷歌在 Google AI Studio 中構建了一個模板應用,它可以將一個簡單畫布變成交互式教育導師。

地址:https://aistudio.google.com/apps/bundled/codrawing
此外,谷歌還提到所有在 Gemini 應用中生成或編輯的圖片都會帶有可見水印,以及谷歌的隱形 SynthID 數字水印,以清晰標識它們是 AI 生成的。
該模型一上線就迎來了一波測試熱潮,谷歌首席科學家 Jeff Dean 直接以身入局,將自己 P 成了一個足球運動員卡牌角色。

諾獎得主、DeepMind 創始人兼 CEO Demis Hassabis 也來了一張個人形象照。

網友們也是各灑創意,分享了很多有趣結果。






感興趣的讀者也可以訪問我們之前的測試報道《谷歌偷偷搞了個神秘模型 Nano-Banana?實測:強到離譜,但有 3 大硬傷》。
排行榜
gemini-2.5-flash-image-preview 正式上線后不久,各個榜單也開始曬出該模型的成績表現。
在 Artificial Analysis 圖像編輯排行榜上,該模型直接躍升至第一位,獲得了 1212 的 ELO 分數。

而在其文生圖榜單上,字節跳動的即夢 3.0 和 OpenAI 的 GPT-4o 還有少量優勢。

不過,在投票人數更多的 LM Arena 的榜單上,gemini-2.5-flash-image-preview 在這兩個任務上都已經成為冠軍。

下面展示了在各個指標上更詳細的分數,其中 gemini-2.5-flash-image-preview 在角色一致性、創意、圖表、事物 / 環境等方面優勢明顯,而在風格化方面,GPT-4o 目前最為領先。

你已經嘗試過 nano banana /gemini-2.5-flash-image-preview 了嗎?感覺如何?


































