操作方式相當直覺。使用者可以透過「文字轉歌曲」,描述想要的曲風、情緒、回憶或內梗,例如「來一首懷舊Afrobeat,寫給媽媽的童年回憶」,Gemini就會自動生成包含歌詞與編曲的完整30秒音軌;也能透過「照片或影片轉歌曲」,上傳旅遊照、寵物影片,讓AI根據畫面氛圍創作對應旋律與歌詞。歌詞部分也能請Gemini列出,便會發現歌詞還會對應到提供的照片或影片畫面。
如果真的沒有想法,也能在「新的對話」中選擇「創作音樂」,Gemini便會提供「90年代饒舌」、「拉丁流行樂」、「節奏藍調情歌」、「韓國流行樂」、「電影氛圍」...等16種曲風。連封面圖也不用煩惱,系統會由Nano Banana自動產生專屬Cover Art,生成後可直接下載或分享連結。
根據Google說明,這項功能的目標並非打造下一首葛萊美等級神曲,而是提供一種更有趣、個人化的創作與表達方式。Lyria 3相較前代模型強化三大能力:不需自行撰寫歌詞、可更細緻控制曲風與節奏、並生成更具真實感與音樂層次的作品。
為了強化AI內容辨識與版權保護,所有透過Gemini生成的音樂都嵌入SynthID隱形數位浮水印,可用於識別Google AI產出內容。Gemini App也同步擴充音訊驗證能力,用戶可上傳檔案詢問是否為Google AI生成,系統將透過SynthID與模型判斷回傳結果。
在版權議題上,Google強調Lyria 3的設計初衷是「原創表達」,而非模仿既有歌手風格。若使用者在指令中點名特定藝人,Gemini僅會視為風格靈感,產出風格或氛圍相近的作品,而非複製特定創作。系統也設有內容比對過濾機制,避免與現有作品過度雷同;若用戶認為內容侵犯權益,也可透過檢舉機制回報。
目前音樂生成功能已在桌面版Gemini上線,行動裝置版本將於未來幾天內陸續開放。Google表示,未來將持續提升語言支援與音質表現,讓AI不只是寫報告、畫圖,還能幫你把生活配上專屬BGM。
點擊閱讀下一則新聞