Gemini 3 Pro Image相較於上一代,在專業素材生成上有哪些顯著的進步?
Answer
Gemini 3 Pro Image 在專業素材生成上的顯著進步
Google 近期推出的 Gemini 3 Pro Image(Nano Banana Pro)影像生成模型,相較於上一代 Gemini 2.5 Flash Image,在專業素材生成能力上有了顯著提升。主要體現在支援更高解析度輸出(1K/2K/4K),並且在處理資訊圖表、標誌、菜單和行銷素材等專業內容時,對繁體中文文字的呈現具有更高的準確度。此外,Gemini 3 Pro Image 支援透過文字、圖片或圖文組合進行提示,並支援多輪對話式修飾,讓使用者在生成、編輯、微調的迭代過程中維持一致的風格與構圖。
多重素材混合與風格轉換
Gemini 3 Pro Image 支援最多 14 張參考圖片混用,包括最多 6 張高保真物件和最多 5 張人物,以維持角色一致性。這使得使用者能夠以多素材合成新場景、進行風格轉換或局部重繪,僅修改指定元素,而保持其餘構圖不變。這種功能在生成複雜場景和需要精確控制風格的專業素材時非常有用。
官方提示詞與應用範例
Google 官方在 Gemini API 的教學文件中釋出了多種「生圖 Prompt」,涵蓋擬真場景、風格化貼圖、LOGO 設計以及商業攝影素材等。例如,生成真實感十足的圖片時,建議在提示中使用攝影術語,提及攝影機角度、鏡頭類型、照明等細節,以引導模型生成逼真的結果。在 LOGO 設計方面,則需要清楚說明文字、字型樣式和整體設計,以生成接近專業水準的商業素材。官方還提供了多個拆解範例,幫助使用者理解如何構建有效的提示詞,以便更好地利用 Gemini 3 Pro Image 的功能。