這款模型延續去年爆紅的Nano Banana,以及後續推出的Nano Banana Pro,強調將「高階世界知識」與「即時生成能力」整合,讓圖像創作從靈感發想到成品輸出,幾乎可以即時完成。Google表示,Nano Banana 2已陸續整合進多項自家服務,包括Gemini App、Search、AI Studio、Google Cloud、Flow與Google Ads等產品線。

在技術面上,Nano Banana 2最大亮點在於將Gemini Flash的高速推理能力導入視覺生成。模型能結合即時網路搜尋資訊,強化對真實世界知識的理解,進而更精準描繪特定主題。這意味著,用戶不僅能生成圖像,還能製作資訊圖表、將筆記轉為結構化圖解,甚至生成資料視覺化內容。

在文字處理方面,Nano Banana 2強調精準文字生成與翻譯能力。無論是製作行銷模擬圖、賀卡,或需要多語版本圖片內容,都能直接在圖中呈現清晰、可閱讀的文字,減少後製修圖時間。

相較初代版本,新模型也在創作控制力上大幅升級。它能在單一流程中維持最多五名角色的一致外觀,以及多達14個物件的準確性,適合用於分鏡腳本與故事敘事場景。指令理解能力也更精細,對複雜需求的服從度提升,降低「生成出來但不完全符合需求」的情況。

此外,Nano Banana 2支援從512px到4K解析度多種長寬比例輸出,可對應社群貼文、橫幅廣告或大尺寸展示背景。Google強調,在Flash級別速度下仍維持鮮明光影、豐富材質與細節銳利度,縮短創作迭代時間。

在產品佈局上,Nano Banana 2將取代Gemini App內原本的Nano Banana Pro,成為Fast、Thinking與Pro模式的預設影像模型。不過Google AI Pro與Ultra訂閱用戶,仍可透過選單重新生成圖片以使用Nano Banana Pro,因應高精度、事實正確性要求更高的場景。

Nano Banana 2示範畫面可同時整合多張輸入圖片(左側)後,在單一場景中維持多角色與物件外觀一致性,呈現高細節、敘事感強的農場場景,展現角色保留與視覺穩定度提升。Google官網
Nano Banana 2示範畫面可同時整合多張輸入圖片(左側)後,在單一場景中維持多角色與物件外觀一致性,呈現高細節、敘事感強的農場場景,展現角色保留與視覺穩定度提升。Google官網

點擊閱讀下一則新聞 點擊閱讀下一則新聞
發票中獎詐騙新手法 誤填卡號慘被盜刷18萬