谷歌Nano Banana Pro炸了!硅谷AI半壁江山同框,網友:PS已死
Gemini 3 Pro甫一亮相,新一代模型又接踵而至。
就在剛剛,谷歌正式祭出最強圖像生成模型——Nano Banana Pro,基于最新Gemini 3 Pro打造。
官名稱作,Gemini 3 Pro Image。

正如傳聞中所言,Nano Banana Pro就是AI圖像界的「新神」,不論在圖像編輯還是在生成上,都實現了史詩級進化。
它的知識儲備更廣,文字渲染超強,而且細節把控精準到了「像素級」。
不僅如此,Nano Banana Pro在做復雜信息圖簡直開掛,接近工程師眼中的世界。
基準測試中,新版Nano Banana相較于上一代性能顯著提升,GPT-Image、Flux Pro Kontext Max根本無法相提并論。




這一次,Nano Banana Pro還支持4K原生,速度更快,成本也有所提升。
生成的細節,只能用「恐怖」形容。尤其是以前生成的中文就像「鬼畫符」,如今漢字水平一流。




谷歌剛官宣沒幾分鐘,全網再度陷入狂歡,一大波實測洶涌來襲。

一句雞湯、一句古詩,甚至是一大段文言文,Nano Banana Pro一鍵直出頗有意境的圖片,而且手寫漢字完美到幾乎沒有一點瑕疵。









以上中文作品來自X網友:@CaomuQ625、@0xbisc、@Peanut_zhc、@frxiaobei、@0xPlato、@dylandddeng
真PS時代終結者,降臨了!

三個月,終極進化
三個月前,為創意而生的Nano Banana(Gemini 2.5 Flash)出世后,一夜爆紅全網。
從修復老照片到生成3D迷你手辦,Nano Banana在圖像編輯上樹立了新里程碑。
任何人天馬行空的想法,皆可變為現實。
如今,進階版Nano Banana Pro出世,谷歌僅用三個月的時間,完成了另一次蛻變。
不管是產品原型,還是將數據、手寫筆記轉變為信息/專業圖表,它都能一鍵可視化設計,讓創意輕松成真!

Hassabis稱自己長期以來夢想之一,是創造出室溫超導體。
這不,他讓Nano Banana Pro幫忙腦補了一下。

知識推理更強,直連搜索
背靠Gemini 3高級推理能力,Nano Banana Pro不僅能生成精美圖像,還能創作更有用的內容。
它可以連接到Google搜索的龐大的知識庫,從快速生成食譜,到可視化天氣、體育賽事等實時信息,皆可輕松實現。
如下圖所示,Nano Banana Pro通過搜索獲取實時天氣信息,構建了一張波普藝術風格的信息圖表。

相比之前的圖像生成模型,Nano Banana Pro在內容準確性上顯著提升,能生成更貼近事實的素材。
當啟用基于Google搜索的功能時,模型將直接連接實時網絡內容,確保輸出內容與最新數據一致。
這對于需要精確呈現的應用場景特別有價值,比如生物結構圖、歷史地圖。
就比如,讓Nano Banana Pro創建一個室內植物「海龜串」(String of Turtles)的信息圖表,包含原產地、養護要點和生長習性等信息。

提示詞:制作一張關于這種植物的信息圖表,重點關注有趣的信息
它還可以生成精準的教育演示圖,無論是理解全新知識,還是呈現復雜信息。
下圖中,Nano Banana Pro生成了自行車護理的步驟圖。

再比如,它可以直出白光通過三棱鏡被分解成彩色光,又通過第二個三棱鏡重新組合成白光的過程。

文字秒生,還支持多語種
在文字渲染上,Nano Banana Pro再次刷新天花板。
不論是簡短的標語,還是長段落,它都能在圖像中直接生成渲染精準、清晰易讀的文本,堪稱目前最佳模型。
這正是因為在理解圖像深度與細節方面的卓越表現,Gemini 3為圖像編輯與創作開啟了全新可能。
如今,人們可以在樣品、海報中融入更豐富的文字細節,體驗更多元的紋理、字體與書法效果。
相較于Nano Banana,Pro版更擅長處理邏輯和語言,生成清晰、準確且完美融合的文本。
下圖中,生成了一張創意美食攝影,其中每個單詞都用與食物相關的實際食材,以藝術形式拼寫出來。

提示詞:制作8個精致的極簡主義Logo,每個都是一個有趣的食物單詞,并用逼真的食物制作字母來表達這個單詞的含義。構圖:在單一純白色背景上渲染所有Logo
而且,用Nano Banana Pro做營銷物料、教育內容、應用程序等,特別合適。
在Google AI Studio漫畫生成器中,可以生成獨一無二的多頁漫畫,連對白字體、畫風都可以玩出高級花樣。
根據照片和選定的題材,創建所選語言的漫畫書
借助Gemini增強的多語言推理能力,Nano Banana Pro還可以生成多種語言的文本,或對內容進行本地化和翻譯。
它能理解圖像的語義語境,利用圖生圖技術,輕松實現菜單、標志或文檔等元素上的語言轉換,同時保持原始的藝術風格或版式布局。
比如輸入一張英文飲料廣告的原圖,Nano Banana Pro直出法語版本。
提示詞:翻譯成法語
下面demo,皆是Nano Banana Pro在文本渲染上強大能力的體現。
圖片
提示詞:在一個陽光明媚的日子里,柏林一條舒適街道的景色,陰影鮮明。老房子形狀奇特,像拼寫出「BERLIN」的字母,顏色為藍色、紅色、白色和黑色。房子看起來仍然像房子,與字母的相似之處處理得很微妙
圖片
提示詞:制作8個極簡主義Logo,每個都是一個富有表現力的單詞,并使字母在視覺上傳達信息或聲音,以戲劇性的方式表達該單詞的含義。構圖:所有Logo在一個白色背景上的黑色平面矢量渲染

提示詞:在有紋理的米白色背景上,設計一個充滿活力、引人注目的「TYPOGRAPHY」字樣。字母粗大、塊狀、超壓縮,通過重疊的亮藍色和熱粉色層營造出3D效果,每層都有半色調圓點圖案,喚起復古印刷美學。比例是16:9
4K直出,創意無限
一起看看Nano Banana Pro的新特性,以及大家都有哪些腦洞吧。
設計的一致性
Nano Banana Pro可以融合比以往更多的元素,使用多達14張圖像,并保持多達5個人物的連貫性和相似度。
這一能力,可謂業界No.1。
如下所示,一次性上傳14張毛絨怪圖片,Nano Banana Pro可以把它們全部塞進一張圖中,還能保持角色的高度一致性。

提示詞:14個毛茸茸的角色并排擠在一張破舊的米色布藝沙發和地板上的中景鏡頭。他們都面向前方,看著沙發前一張低矮木桌上的一臺老式木盒電視機。房間光線昏暗,左側窗戶透進溫暖的光線,電視的光芒照亮了生物的臉和毛茸茸的紋理。背景是一個舒適、略顯雜亂的客廳,有編織地毯、裝滿舊書的書架,背景中有鄉村廚房元素。整體氛圍溫暖、舒適且有趣
不管是草圖變實物,還是把設計圖做成逼真3D模型,它都可以輕松搞定,讓想法和成品之間不再有鴻溝。
想要什么風格、什么質感,一鍵都能套用到樣品,確保你的品牌在每個接觸點都保持無縫和一致。
各種超現實景觀,給到多種元素組圖,Nano Banana Pro將其無縫融合。

提示詞:將這些圖像組合成一張16:9格式的適當排列的電影感圖像
再比如,以沙漠景觀為背景的高級時尚大片,六張圖合一,人物連貫一致性超絲滑。

提示詞:將這五個人和這只狗放入一張圖片中,他們應該適合一張令人驚嘆的獲獎照片,風格是 [sic] 時尚社論。所有五個人的身份和他們的服裝以及狗必須始終保持一致,但他們可以而且應該從不同的角度和距離被看到,就像 [sic] 對場景來說最自然和合適的那樣。使顏色和燈光在他們身上看起來自然,讓他們看起來像是自然地融入了這個時裝秀
工作室級的創意控制
想要玩轉各種創意,你說了算。
也就是說,想要P任何細節,通過Nano Banana Pro升級的局部編輯功能,可選擇、細化和變換圖像的任何部分。
甚至,還可以調整攝像機角度,更改焦點并應用復雜的色彩分級,就連場景照明都能變。
比如,將白天更改為夜晚或創建散景效果,如下所示,展示了迷失在金色散景與晨霧海洋中的剪影。

提示詞:用散景替換體積光
再比如,使用照明控制遮蔽或照亮圖像的一部分,實現特定的戲劇效果。

提示詞:生成具有強烈明暗對照(chiaroscuro)效果的圖像。該男子應保留其原始特征和表情。引入刺眼的定向光,似乎來自上方并略微偏左,在臉上投下深邃、清晰的陰影。只有幾縷光照亮他的眼睛和顴骨,臉部的其余部分處于深深的陰影中
而且,Nano Banana Pro有更多比例可選,2K和4K都支持。

結合參考圖像讓產品設計栩栩如生
網友腦洞大開,設計門檻踢碎了
要說Nano Banana Pro的玩法,還是這屆網友腦洞大,生成的一大波實測比谷歌demo樣本更有創意。



生成一張黑板圖,勾股定理解題一鍵完成。

物理定律,輕松解析。



就連對玻璃和光線的理解,都十分到位:

英偉達剛剛公布的Q3財報,一圖搞定,打工人以后做PPT交給Nano Banana Pro就可以了。

上傳一張建筑平面設計圖,Nano Banana Pro瞬間轉化為3D模型,活靈活現。


各種文本渲染,完全不在話下。






就連手寫字的鏡像細節,也與物理世界理解一致。

順便,還能復刻一下推特主頁的設計草圖。

AI界大佬們一張合影,比真人還真。

最常見的OOTD,Nano Banana Pro更精進了。

上傳一張手指原圖,甚至還能解析出「指紋」,就差變身破案偵探了。

7個技巧,玩轉「納米香蕉Pro」
確立愿景:故事、主體與風格
為了獲得最佳效果并擁有更細膩的創意控制權,請在你的提示詞中包含以下要素:
- 主體:圖像中是誰或什么?請具體描述。(例如:一位眼神冷峻、擁有發光藍色光學元件的機器人咖啡師;一只戴著迷你巫師帽的毛茸茸三花貓)
- 構圖:鏡頭的取景方式是怎樣的?(例如:大特寫、廣角鏡頭、低角度鏡頭、人像)
- 動作:正在發生什么?(例如:正在沖泡一杯咖啡,正在施展魔法,在田野中奔跑的瞬間)
- 地點:場景發生在哪里?(例如:火星上的未來派咖啡館,一間雜亂的煉金術士圖書館,黃金時刻陽光普照的草地)
- 風格:整體審美風格是什么?(例如:3D動畫、黑色電影風格、水彩畫、超寫實、90年代產品攝影風格)
- 編輯指令:若要修改現有圖像,請直接且具體。(例如:將男子的領帶改為綠色,移除背景中的汽車)

細化細節:相機、燈光與格式
雖然簡單的提示詞依然有效,但要獲得專業級的結果,需要更具體的指令。在編寫提示詞時,請超越基礎描述,考慮以下高級要素:
- 構圖與縱橫比:定義畫布。(例如:一張9:16的垂直海報;富有電影感的21:9廣角鏡頭)
- 相機與燈光細節:像電影攝影師那樣執導鏡頭。(例如:低角度鏡頭,淺景深(f/1.8);黃金時刻的逆光創造出長長的陰影;帶有柔和青色調的電影色彩分級)
- 特定文本集成:清楚說明應該出現的文本內容及其外觀。(例如:標題「URBAN EXPLORER」以粗體、白色無襯線字體呈現在頂部)
- 事實約束(用于圖表):說明對準確性的要求,并確保你的輸入本身是符合事實的。(例如:科學準確的橫截面圖;確保維多利亞時代的歷史準確性)
- 參考輸入:使用上傳的圖像時,明確定義每張圖像的作用。(例如:使用圖像A作為角色的姿勢,圖像B作為藝術風格,圖像C作為背景環境)
提示詞示例:創意技巧展示
不同的提示詞策略可以幫助你創作從超寫實編輯到奇幻新世界的各種內容。
1. 生成具有驚人文本渲染效果的視覺作品
清晰、易讀的文本有助于創作出極具沖擊力的海報、復雜的圖表,甚至是精細的產品樣品。
圖片
提示詞:為這個場景創建一個黑白故事板草圖,展示電影的定場鏡頭、中景鏡頭、特寫鏡頭和POV鏡頭
圖片
提示詞:創建一張圖片,顯示短語「How much wood would a woodchuck chuck if a woodchuck could chuck wood」(如果一只土撥鼠能扔木頭,它能扔多少木頭)由土撥鼠扔出的木頭拼成
2. 利用現實世界知識進行創作
Nano Banana Pro可利用Gemini 3的現實世界知識和深度推理能力,提供精確、詳盡且豐富的圖像結果。
比如,制作一個豆蔻茶(Elaichi Chai)的分步信息圖表:
圖片
3. 翻譯并將你的創意本地化
生成本地化文本,或翻譯圖像內的文本。
在多種語言下,預覽產品的外觀,為進軍國際市場做好準備,并創建適用于不同地區的海報和信息圖表。
圖片
提示詞:將三個黃色和藍色易拉罐上的所有英文文本翻譯成韓文,同時保持其他所有內容不變
4. 使用工作室級控制進行編輯
利用豐富的控制選項,可以直接調整燈光和相機設置,如角度、焦點、色彩分級等,進而實現專業級的效果。
比如,應用照明和焦點控制將場景從白天轉換為夜晚:
圖片
提示詞:將此場景變為夜間
自然,也可以反過來:將此場景從夜晚變為白天:
圖片
或者,通過調整景深或焦點(例如,聚焦于花朵)來突出構圖的細節:
圖片
提示詞:聚焦于花朵
5. 精確調整尺寸
嘗試不同的縱橫比,并在各種產品中生成1K、2K或4K分辨率的清晰視覺效果。
圖片
提示詞:通過減少背景將縱橫比更改為1:1。角色保持在當前位置
6. 混合圖像并保持多角色一致性
即便多個角色出現在同一畫面中,也能保持其特征的一致性和相似度。
提取多達6到14張(輸入數量因平臺而異)完全不相關的圖像,并將它們融合以創造全新的作品。
圖片
提示詞:將這些圖像組合成一張16:9格式的適當排列的電影感圖像,并將人體模型上的裙子更改為圖像中的裙子
7. 創建并保持你的品牌外觀與調性
渲染并應用具有一致品牌風格的設計,輕松將概念可視化。
將圖案、Logo和藝術作品無縫貼合在3D物體和表面上——從服裝到包裝——同時保留自然的光照和紋理效果。
圖片
提示詞1:
創建一個圖形風格的流暢Logo,這是一種充滿活力且趣味盎然的文字插圖形式,深深植根于20世紀60年代和70年代的復古美學,大致基于草圖進行創作。其標志性特征是一種時髦的、受迷幻藝術啟發的字體,具有柔和、圓潤且流暢的字母形態。不要完全照搬草圖,而是從中汲取靈感。字母被巧妙地扭曲、拉伸和壓縮,摒棄僵硬的結構,相互融合形成一個連貫、可識別的形狀。
這種被稱為圖形文字(Calligram)的技法巧妙地融合了文本與圖像,單詞的形態在視覺上體現了其含義。單詞「WAVE」被藝術地排列成波浪的流線型輪廓。該設計是一個巧妙的視覺雙關語,使信息瞬間可被理解且令人難忘。
配色方案強化了復古感,采用簡單的雙色調方案,以溫暖、通常柔和或大地色調的淺藍色為背景,搭配深藍色的Logo。這種選擇增強了作品的懷舊魅力。整體效果呈現出一種異想天開的懷舊感和巧妙的平面設計風格。這是一種大膽而平易近人的風格,通過形狀和單詞的無縫結合傳達簡單、積極的信息,產生直接而令人愉悅的視覺沖擊。
提示詞2:
現在逐個創建視覺識別系統,使用10個高質量樣品,包含各種相關產品、廣告、廣告牌、公交車站牌等。一次生成一個,每個均為16:9比例。
使用和局限性
想要體驗Nano Banana Pro,只需在Gemini應用程序中選擇「使用Thinking模型創建圖像」即可。
免費用戶的贈送額度用完之后,將恢復到原始的Nano Banana模型;而氪金的Google AI Plus、Pro和Ultra會員,則會有更高的Pro額度。
對于專業人士,谷歌將會陸續上線到所有的平臺,包括Google Ads,Google Slides,Google Vids,Gemini API,Google AI Studio,Google Antigravity,Vertex AI,Gemini Enterprise,Flow等。
圖片
不過,雖然Nano Banana Pro已經很強了,但它在一些領域仍有待改進:
- 視覺與文本保真度:在渲染小字號文本、精細細節以及生成準確拼寫方面,效果可能尚不完美。
- 數據與事實準確性:請務必核實圖表、信息圖等基于數據的視覺內容的事實準確性。
- 翻譯與本地化:多語言文本生成可能會出現語法錯誤,或未能精準捕捉特定的文化差異。
- 復雜編輯與圖像融合:圖像融合或光照調整等高級編輯任務,有時可能會產生不自然的偽影。
- 角色特征:雖然通常表現可靠,但在多次編輯過程中,角色特征的一致性可能會出現波動。
值得一提的是,在SynthID數字水印技術的加持下,我們可以將圖像上傳到Gemini應用中,直接詢問它是否由Google AI生成。
圖片
最后的最后,還是想要吐槽一下,一周內AI大事件四連更,真是有點心力交瘁了...

參考資料:
https://blog.google/technology/developers/gemini-3-pro-image-developers/
https://blog.google/products/gemini/prompting-tips-nano-banana-pro/
https://blog.google/technology/ai/nano-banana-pro/
https://x.com/Gorden_Sun/status/1991441658941173902?s=20
https://x.com/0xbisc/status/1991471506099171363?s=20
https://x.com/CaomuQ625/status/1990831026239943060?s=20
https://x.com/Peanut_zhc/status/1991524507098791986?s=20
https://x.com/frxiaobei/status/1991474928596709747?s=20

























