這款模型延續去年爆紅的Nano Banana,以及後續推出的Nano Banana Pro,強調將「高階世界知識」與「即時生成能力」整合,讓圖像創作從靈感發想到成品輸出,幾乎可以即時完成。Google表示,Nano Banana 2已陸續整合進多項自家服務,包括Gemini App、Search、AI Studio、Google Cloud、Flow與Google Ads等產品線。
在技術面上,Nano Banana 2最大亮點在於將Gemini Flash的高速推理能力導入視覺生成。模型能結合即時網路搜尋資訊,強化對真實世界知識的理解,進而更精準描繪特定主題。這意味著,用戶不僅能生成圖像,還能製作資訊圖表、將筆記轉為結構化圖解,甚至生成資料視覺化內容。
在文字處理方面,Nano Banana 2強調精準文字生成與翻譯能力。無論是製作行銷模擬圖、賀卡,或需要多語版本圖片內容,都能直接在圖中呈現清晰、可閱讀的文字,減少後製修圖時間。
相較初代版本,新模型也在創作控制力上大幅升級。它能在單一流程中維持最多五名角色的一致外觀,以及多達14個物件的準確性,適合用於分鏡腳本與故事敘事場景。指令理解能力也更精細,對複雜需求的服從度提升,降低「生成出來但不完全符合需求」的情況。
此外,Nano Banana 2支援從512px到4K解析度、多種長寬比例輸出,可對應社群貼文、橫幅廣告或大尺寸展示背景。Google強調,在Flash級別速度下仍維持鮮明光影、豐富材質與細節銳利度,縮短創作迭代時間。
在產品佈局上,Nano Banana 2將取代Gemini App內原本的Nano Banana Pro,成為Fast、Thinking與Pro模式的預設影像模型。不過Google AI Pro與Ultra訂閱用戶,仍可透過選單重新生成圖片以使用Nano Banana Pro,因應高精度、事實正確性要求更高的場景。
點擊閱讀下一則新聞