Gemini Nano Banana(又稱 Gemini 2.5 Flash Image)在 Google 推出後之所以能在社群媒體上迅速爆紅,主要歸功於其突破性的多圖融合能力、能夠維持角色一致性,以及對自然語言的精準理解。相較於過去的生成式 AI 工具,Nano Banana 有效解決了在細節處理和語意理解上的瓶頸,這使得使用者能夠創造出更具創意和精確度的圖像。
Nano Banana 具備處理複雜圖像任務的能力,包括將 Google 地圖座標轉換為等距圖像、將地圖地點轉換為真實世界視角、拆解照片元素以展示食材等。此外,它還可以生成 3D 立體剖面圖、將照片轉換為手繪過程、修復舊照片並上色。其他應用包括服裝試穿、將平面圖轉換為 3D 模型等。多圖融合功能讓使用者能夠輕鬆組合多張圖片,創造出獨特的視覺效果,這也大幅提升了使用者創作的自由度。
一般使用者可以透過 Google Gemini 應用程式或 Google AI Studio 來使用 Nano Banana。在 Gemini 應用程式中,選擇「2.5 Flash」模型並上傳照片,然後輸入自然語言指令,即可生成新的圖像。在 Google AI Studio 中,選擇「Gemini 2.5 Flash Image Preview」,上傳圖片並輸入提示詞(Prompt),即可進行圖像編輯和生成。簡易的操作方式降低了使用門檻,讓更多使用者能夠體驗 AI 圖像生成的樂趣,這也是其在社群上廣受歡迎的重要原因之一。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容