智慧科技
分享心發現

Google Gemini 正式支援「修圖」功能!出一張嘴就能讓 AI 幫你換衣服

2025/08/30

Gemini 現在可以在維持照片主角的同時,進行完美修圖(圖片來源:科技人)

 

在過去,修圖這件事,往往是專業人士的專屬領域。許多人一聽到「修圖」,腦中浮現的便是 Adobe Photoshop 複雜的介面、繁多的工具與圖層,若沒有經過一番學習,很難產出理想的作品。然而,隨著生成式 AI 技術的飛速發展,這一切正在被徹底改變。

 

Google Gemini 現在已經推出由旗下頂尖 AI 研究機構 Google DeepMind 打造的全新圖片生成與編輯模型,讓創意修圖變得前所未有的簡單直覺。修圖?現在只需要出一張嘴!

 

本文目錄

Gemini 的圖片編輯功能大進化(圖片來源:Google)

 

告別「有點像又不太一樣」的 AI 修圖尷尬

這次 Gemini 的更新,由 Google DeepMind Gemini 影像產品主管 Nicole Brichtova 與 Gemini 應用程式多模態生成部門主管 David Sharon 共同推動,其核心目標非常明確:解決 AI 修圖時最令人詬病的「人臉失真」問題。

 

許多用戶在體驗過各家的 AI 換裝或變換場景功能後,常會有一種「像,但又不太一樣」的感覺。照片中的人臉孔雖然保留了,但神韻、特徵卻出現了微小的扭曲,讓人覺得不對勁。Google 顯然意識到了這個痛點,因此新模型特別著重於在進行大幅度修改的同時,能夠精準保留人物或寵物「原本的樣貌與神韻」。

 

根據 Google 官方說明,無論是想讓自己換上一頭 60 年代的復古蜂窩頭,還是為家裡的吉娃娃穿上可愛的芭蕾舞裙,Gemini 都能確保主角看起來仍然是他們自己,而非一個貌合神離的數位分身。

 

幫吉娃娃穿上芭蕾舞裙變成很簡單的事(圖片來源:Unsplash / Gemini 修圖)

 

四大核心功能,釋放你的想像力

 

使用者只需要上傳一張照片,並用文字描述想要進行的修改,Gemini 就能完成指令,且支援中文。整合後的進階編輯功能主要涵蓋了以下幾個層面:

 

變換服裝或場景: 這項功能讓使用者可以輕鬆地為照片中的人物替換不同風格的服裝或職業裝扮,甚至能穿越時空,看看自己在不同年代的造型,同時完整保留個人的臉部特徵。

使用 Gemini 可以輕易幫照片變換服裝或場景(圖片來源:Google)

 

融合多張照片: 使用者現在可以上傳多張圖片,並將它們自然地融合成一個全新的場景。例如,將自己的照片和愛犬的照片結合,就能創造出一張你們一起在籃球場上的完美合照。

想要生成一張抱著狗狗的照片?簡單!(圖片來源:Google)

 

多輪對話式編輯: AI 修圖不再是一次性的指令。使用者可以像與設計師對話一樣,對生成後的圖片進行持續修改。例如,從一張空房間的照片開始,你可以先指令 AI 為牆壁上色,接著要求加上書櫃,再擺上一張咖啡桌。Gemini 會在整個過程中與你協作,逐步完善圖像。

 

你可以一步一步的讓 Google 幫你修圖,像真人溝通那樣(圖片來源:Google)

 

混合不同設計風格: 這項功能極具創意,允許使用者將一張圖片的「風格」應用到另一張圖片的「物體」上。例如,擷取花瓣的顏色與紋理,並將其應用到一雙雨靴上;或是利用蝴蝶翅膀的斑斕圖案,來設計一件獨一無二的洋裝。

蝴蝶跟裙子組合起來,會變成什麼樣子?(圖片來源:Google)

 

以我家逗逗為例,我將在森林中拍攝的狗狗照片上傳到 Gemini 上,跟他說:

「幫我的狗狗穿上一件棒球衣!球衣指定為洛杉磯道奇隊 LA Dodger,17 號」

 

幫狗狗穿上道奇隊球衣是如此簡單的事(圖片來源:科技人)

 

於是,Gemini 就幫我生成左邊這張穿著大谷翔平球衣的狗狗照了,儘管背景一堆樹葉、樹枝相當複雜,但依舊成功了!是不是修得非常自然呢?

 

 

用 AI 修改的照片都會加上數位浮水印

從需要手動操作圖層、筆刷的「手工業時代」,到如今僅靠自然語言描述就能完成創作的「對話式時代」,AI 正在徹底顛覆圖像創作的門檻。這意味著,人人都能更輕易地將腦中的創意轉化為現實。

 

當然,隨著 AI 生成內容的普及,其所衍生的倫理與真實性問題也備受關注。對此,Google 也明確表示,所有在 Gemini 應用程式中建立或編輯的圖片,都會包含可見的浮水印,以及用於標示 AI 生成內容的 SynthID 數位浮水印,以確保內容的透明度與可追溯性。

 

以下圖為例,我上傳一張微波爐的照片,想要在裡面塞進一顆地球,用來暗示「全球暖化」現象。透過 AI,我只需要寫幾句話就能實現,而右下角預設會有 Gemini 的 Logo。

 

使用 AI 生成的圖片,右下角都會出現 LOGO(圖片來源:Unsplash / Gemini 修圖)

 

這項強大的圖片編輯功能從今天開始正式在 Gemini 應用程式中向全球使用者開放,支援用中文直接下指令,相信這可以為影像創作帶來更多的可能性。

 

心發現延伸閱讀: