Google 推出的 Nano Banana Pro 模型,是基於 Gemini 3 Pro 的進階版本,特別強調透過結合更深入的推理能力和真實世界知識,來提升圖像生成與編輯的準確性及實用性。這項改進直接體現在繁體中文的生成上,有效解決了舊模型中常見的字形模糊不清,甚至出現「鬼畫符」的問題,使得生成的圖像中文字更加清晰易讀。
Nano Banana Pro 在繁體字形生成方面,展現出更強的辨識能力和更精準的呈現效果。它能夠更準確地辨識和呈現繁體字,包括在海報、樣張或分鏡草圖中生成更細緻的字型、材質和書法風格。測試結果顯示,Pro 版本在處理繁簡辨識、字形結構和筆畫還原度方面都有顯著提升。雖然在處理部分異體字時,例如「祕」的部首,以及標點符號可能出現全形與半形混用的情況,仍然存在一些挑戰,但整體而言,文字的可讀性已大幅提升。此外,該模型也能夠生成注音、註記,並且掌握注音或拼音等文字符號的精細程度。
Nano Banana Pro 的另一項重要改進是支援一次生成多張圖像,並確保這些圖像在風格和版面設計上保持一致性。這對於需要製作一系列風格統一的社群媒體海報等應用場景非常有用。在漫畫分鏡故事板的生成方面,Pro 版本也能夠維持角色姓名和店名在多格漫畫中的一致性,確保故事的連貫性。此外,模型還能夠理解粗略筆記的意涵,並將步驟拆解並視覺化成教學圖示,例如咖啡沖煮攻略,顯示了其在教育、廣告、設計等多個領域的廣泛應用潛力。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容