香港商報
-- 天氣
谷歌又出新「王炸」 廣大網友玩瘋了

谷歌又出新「王炸」 廣大網友玩瘋了

責任編輯:王錦坤 2025-11-25 19:50:45 來源:香港商報網綜合

 當地時間11月20日,在用Gemini 3「屠榜」大模型圈後,谷歌(Google)又甩出另一張「王牌」,推出了其迄今為止最強的一代圖文生成模型——Nano Banana Pro(即Gemini 3 Pro Image;部分用戶稱之為Nanobanana2)。

Nano2.jpg

 谷歌於今年8月底發布基於Gemini 2.5 Flash模型的Nano Banana。由於該模型能夠將人物或者動漫照片變成栩栩如生的「3D打印手辦」,短時間內形成全球範圍內的破圈效應。谷歌CEO皮查伊披露,在Nano Banana的推動下,Gemini應用的月活用戶數在短短1個季度內,就從4.5億暴增至6.5億。

舊版手辦.jpg

 Nano Banana將圖片轉為樹脂模型的視覺效果,曾在網上掀起熱潮。(網絡圖片)

 谷歌表示,Nano Banana Pro能「以空前的控制力、無瑕的文字呈現和增強的世界知識,將用戶的構想變成工作室級的設計」。谷歌稱,Nano Banana Pro比以往任何時候都更好地可視化信息。

 據了解,Nano Banana Pro這次升級有幾個重要的方向:其一,語言和文字相關功能升級。其二,新增編輯功能。其三,邏輯性顯著增強。

語言文字相關功能升級

 據谷歌介紹,Nano Banana Pro不僅在細節表現力、圖像分辨率和文本渲染準確性方面強於前一代Nano Banana,還能以不同風格、字體和語言生成內容。

風格變化(官方).jpg

 相片可轉化為漫畫分鏡。(谷歌)

 谷歌強調,Nano Banana Pro是在圖像中生成正確且清晰可讀文字的最佳AI模型,不論是簡短的標語還是長段落均可採用,且支持更加豐富的紋理、字體和書法。藉助Gemini增強的多語言推理能力,用戶可以生成多種語言的文本,或者對內容進行翻譯和本地化。

翻譯文字(官方).jpg

 飲料罐上的英文被翻譯為韓文。(谷歌)

 網友稱,不只是改變畫面風格,Nano Banana Pro還能將信息轉化為另一種形式,如將平面設計圖轉化成三維效果圖。

設計圖.jpg

 網絡圖片

 網友反映,Nano Banana Pro可以模仿自己的手寫筆跡,生成更多文字內容,相似性非常高,甚至可以在試卷上做答。有人調侃稱,批改作業的老師會無法分辨。

 網絡圖片

 生成相對複雜的中文時,漢字也不是一團「鬼畫符」。

不是鬼畫符.jpg

 網友要求基於李商隱的詩《無題》生成圖片,並在畫面中附上原詩的字樣。(網絡圖片)

 即使是同時翻譯文字、上色加上變換風格,也不在話下。

 網友使用Nano Banana Pro處理《One Piece》漫畫。(網絡圖片)

新增編輯功能

 新一代圖像生成模型還新增了編輯功能。Nano Banana Pro支持拍攝角度、焦點、光線、景深、對焦、色彩等方面的調整。圖片比例可以進行1:1到9:16各種調整。分辨率也從Nano Banana的1024X1024上升到最高4K。

 Nano Banana Pro支持拍攝角度、焦點、光線、景深、對焦、色彩等方面的調整。(網絡圖片)

邏輯性顯著增強

 據Google Labs和Gemini副總裁Josh Woodward介紹:「Nano Banana Pro在信息圖表方面非常出色,可以用來製作幻燈片。它最多可以處理14張不同的圖像,或5個不同的角色,並在某種程度上保持角色一致性。」

官方例子.jpg

 官方示例生成圖片。(谷歌)

 Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures' faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused. |Google

 據悉,配合搜索互聯網知識庫的能力,Nano Banana Pro更能將現實世界的信息轉化為生動形象的可視化信息,例如製作一杯豆蔻茶的教程。

豆蔻茶(官方).jpg

 網絡圖片

 這意味着Nano Banana Pro的邏輯性顯著增強,不光能更好地理解用戶意圖,更能讓輸出結果更有邏輯、貼近現實世界。

截圖.png

 可以生成難度極高的「網頁截圖」。(網絡圖片)

 網友表示,輸出的內容明顯符合現實世界的邏輯。在生成建築效果圖時,還會留意到玻璃的倒影。

倒影.jpg

 網絡圖片

 一方面,這些強大的功能展現出在工作、娛樂等用途上的強大生產力。另一方面,以後我們看到的各類圖片,真實性恐怕也要打一個「問號」了……(綜合自網絡及各社交平台)



責任編輯:王錦坤 谷歌又出新「王炸」 廣大網友玩瘋了
香港商報PDF

友情鏈接

承印人、出版人:香港商報有限公司 地址:香港九龍觀塘道332號香港商報大廈 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83518734 83518291

地址:香港九龍觀塘道332號香港商報大廈