Nano Banana Pro 在圖像生成方面,相較於前一代模型有哪些顯著的提升? | 數位時代

Nano Banana Pro 相較於前一代的顯著提升

Nano Banana Pro 是 Google 基於 Gemini 3 Pro 建構的影像生成旗艦級模型,著重於結合「進階推理」與「真實世界知識」,旨在產出更符合情境的視覺內容。相較於前一代 Nano Banana(Gemini 2.5 Flash Image),Pro 版本專注於複雜構圖和高品質需求,讓使用者能更可靠地將抽象概念轉化為具體的視覺成果,適用於原型設計、數據視覺化、手寫筆記轉流程圖等多種場景。

圖像生成與文字處理能力的強化

Nano Banana Pro 顯著提升了在影像中直接生成文字的品質與可讀性,並支援多語言文本與在地化翻譯,尤其改善了繁體中文字體的清晰度,解決了前一代模型中繁體中文呈現為「鬼畫符」的問題。此外,Pro 版本在影像合成方面也進行了強化,能夠在複雜構圖中融合最多 14 張輸入圖像,並在合成場景中維持最多 5 位人物的相貌一致,適用於品牌素材套用、草圖轉商品視覺、藍圖轉擬真 3D 結構等任務。

創作控制與應用整合的進展

在創作控制方面,Nano Banana Pro 提供了更精細的局部編修能力,例如選取、細修並轉換影像局部,調整鏡位與焦點、進行高階色彩分級,甚至改變場景光線。輸出端也支援多種長寬比,並支援 2K/4K 解析度,便於從社群到印刷的多平台投放。此外,Google 在多條產品線同步導入 Nano Banana Pro,包括 Gemini app、Google Ads、Workspace、Gemini API/AI Studio、Vertex AI、Flow 等,使消費者、專業用戶、開發者與企業都能使用。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容