Google Veo 3 進駐 Gemini App，推出「照片轉影片」功能

Google Veo 3 進駐 Gemini App，推出「照片轉影片」功能

· 精選解讀

InfoAI全球AI新聞精選與解讀｜Gemini App 推出「照片轉影片」功能，AI 影片生成競爭白熱化。

Google 正式宣布，其最新一代 AI 影片生成模型 Veo 3 已經全面整合進旗下的 Gemini App，並帶來一項引人注目的功能更新：支援「照片轉影片」（photo-to-video）生成功能。這項新功能可讓你僅憑一張圖片，就能快速生成長達 8 秒的動態影片，還能模擬專業運鏡效果，為內容製作流程大幅減負。

01｜你用一張照片，就能生成 8 秒動態影片

想像一下，你手上有一張風景照，或是一張產品照片，以前頂多能加點特效或做成幻燈片。但現在，Google 推出的 Veo 3 模型讓你能直接「生成一段 8 秒鐘的動態影片」，還能模擬專業的運鏡效果，比如從左到右平移、慢慢推進、甚至縮放特寫。

對於經營社群的人、做產品行銷的人，這就是個省時又省錢的夢幻工具。只要在手機裡打開 Gemini App，訂閱 Gemini Advanced，選擇照片上傳，AI 就能快速產出影片片段，無須專業攝影、剪接軟體或大量後製時間。

這背後的技術並不簡單。Google 在 Veo 3 裡內建了影像深度估計、三維場景重建與鏡頭路徑模擬等 AI 模型，讓單張靜態圖像能「猜出」景深和空間感，進一步生成出移動鏡頭的連續畫面。換句話說，它試著模擬「如果攝影機在這個場景中移動，會拍到什麼」。

對多數使用者來說，操作流程非常簡單：

打開 Gemini App
上傳一張照片
輸入運鏡指令（例如「從右到左平移」）
等待幾秒就可取得 1080p 的短影片

這也代表，未來很多社群小編、個人創作者，甚至中小企業的行銷人員，可以少請一次攝影師，就做出看起來更專業的動態素材。

02｜Google 的 Gemini App，成為一站式 AI 內容工具

Google 不只是把 Veo 3 單獨推出，而是直接內建到自家的 Gemini App 裡。Gemini 是 Google 旗下一個跨平台的 AI 助理服務，原本就整合了聊天問答、文字生成、圖片生成（Imagen）、程式碼輔助（Code Assist）等功能。

現在，影片生成也被納入 Gemini 的能力清單裡。Google 的策略非常明確：要把所有生成式 AI 的能力都包成「一個入口」，讓你在同一個 App 裡完成所有內容需求。

想想看，對一個創作者或行銷人員來說，以前要用好幾個工具：

ChatGPT、Gemini 生成文案
Canva、Photoshop 編輯圖片
Premiere、CapCut 剪影片

未來的 Google 版本想像是：

全部在 Gemini App 內搞定

特別是 Veo 3 的整合後，用戶只要有手機，就能做影片生成。你在等公車、在會議室、在咖啡店都可以開手機做內容草稿。對 Google 來說，這是一個降低進入門檻、強化黏著度的商業策略。

03｜Veo 模型的進化：從文字到影片到照片生成影片

Google 在 2024 I/O 開發者大會上，首度曝光了 Veo 影片生成模型的願景。它的定位是多模態影片生成，支援以下主要輸入型態：

文字 → 影片（Text-to-Video）
影片 → 影片（Video-to-Video，例如風格轉換或續拍）
圖片 → 影片（Photo-to-Video）

Veo 2 在 2025 年初就已經進入測試，具備 1080p 高畫質輸出、文字提示控制、風格控制、多版本生成等功能。而 Veo 3 在這次更新裡，重點在以下幾點：

照片到影片：支援單張圖轉 8 秒短片
運鏡控制：模擬專業攝影機動作
多版本生成：輸出多段影片供你選擇最滿意的版本
端上生成：整合到 Gemini App，手機就能用

也就是說，Google 不只想讓你「產出影片」，還要讓你「用得順手」。從選擇風格、構圖、運鏡路徑，到最後的影片輸出格式，都希望能盡量模擬專業影像工作流程。

04｜競爭對手的動態：OpenAI、Runway、Pika 不斷加壓

Google 的這次更新，被業界解讀成是對 OpenAI、Runway、Pika 的直接回擊。

OpenAI 今年初展示的 Sora，就一口氣把生成影片的水準推到新高度，支援超過 1 分鐘的連續分鏡、真實感極高的動態場景。這顯示生成式 AI 不再只是「幾秒鐘短片」的噱頭，而是朝著長敘事影片、故事版甚至商業級廣告製作進軍。

Runway 也不遑多讓，Gen-3 已經能在 1080p 解析度下生成短片，並主打版本管理、風格化生成，讓專業用戶能把 AI 生成的內容融入既有的製片流程。

Pika Labs 則採用另一種策略，主打完全雲端、免程式碼、介面友善，吸引了大量中小型創作者與社群經營者。用 Pika 生成影片只需要在瀏覽器打字，能在短時間內產出多段影片供分享。

在這個背景下，Google 的 Veo 3 不得不加快步伐。把生成影片能力從雲端模型搬進 Gemini App，等於是對用戶說：「不需要專業工作站，也不必跑 Python，打開手機就能做。」

05｜消費者應用：短影音、行銷素材、社群經營

對一般人來說，最直接的應用就是社群經營。以往經營 TikTok、IG Reels、YouTube Shorts 的創作者，都需要花時間想腳本、拍攝、剪輯。即便只是想把一張漂亮照片做成動態影片，也需要會剪輯軟體。

Veo 3 的照片轉影片功能，就解決了「沒素材」或「沒專業技術」的痛點。

例如：

觀光旅遊業者上傳風景照，快速做出推廣影片
電商上傳產品照，自動生成動態廣告短片
自媒體創作者用插畫或照片製作動態故事

Google 還特別強調運鏡控制，可以避免產出死板的「幻燈片」式動畫。因為 AI 會模擬攝影機移動、調焦距、改變視角，讓影片更像真的拍攝片段。

這對台灣的小型工作室、自媒體接案者、在地行銷公司來說，是非常有吸引力的工具。

06｜企業應用：廣告、教育、內訓、品牌溝通

除了個人創作者，中小企業和大型品牌也是 Google 瞄準的對象。影片製作常是行銷預算裡昂貴又耗時的項目，特別是需要大量製作在地化、客製化內容的品牌。

Veo 3 的生成影片功能，可望在以下場景發揮價值：

產品影片：不同顏色、角度、使用情境的版本快速生成
內部教育訓練：示範操作、情境演練的動畫影片
客戶簡報：動態展示解決方案、設計理念
社群廣告：針對特定市場快速產製本地化內容

Google 在官方說法裡也暗示，未來會針對這些商業應用，開發更多版本控制、風格模板、以及企業級授權管理功能。

08｜生成式影片的技術挑戰：不只是畫質，還有故事性

 生成圖片的技術已經成熟，但影片更難。除了畫質清晰之外，影片需要連續性、物理合理性、故事邏輯。

例如：

人物走路的動作要連貫
鏡頭切換要自然
燈光與陰影一致
物件不能莫名變形或消失

Veo 3 雖然在「短片段生成」已經有顯著進步，但面對 OpenAI Sora 那種「多分鏡敘事影片」還有明顯差距。Google 官方也承認，目前 Veo 3 仍以 8 秒左右的短片為主，主要解決的是社群行銷、短影音的需求。

但長期來看，AI 影片生成的願景是什麼？就是讓任何人都能指令生成完整的影片，甚至包括分鏡、腳本、配樂、旁白。這是一個需要長期研究和迭代的挑戰。

08｜訂閱商業模式與未來計畫

目前，Veo 3 的影片生成能力屬於 Gemini Advanced 的付費功能，意味著 Google 正在複製類似 ChatGPT Plus / Enterprise 的分層商業模式。

Gemini Advanced 訂閱用戶可以：

存取最新的 Gemini 1.5 模型
使用更長上下文視窗
優先解鎖 Veo 3 等多模態生成能力

Google 沒有明講未來是否會提供免費版 Veo 影片生成功能，但從競爭態勢看，短期內應該會鎖在付費層級，因為影片生成計算資源消耗大，也是最有商業價值的差異化功能。

官方也承諾未來將持續：

擴大支援更多語言
開放更多地區市場
改善生成品質和控制細節

09｜AI 影片生成的倫理與挑戰

最後，不可避免要談到生成式 AI 的風險。影片生成可能被用來製作假新聞、造假證據、色情深偽內容，這些問題也讓各國政府關注。

Google 表示，Veo 3 的生成系統內建多層過濾與安全檢查，禁止生成暴力、色情、仇恨內容。Gemini App 也會標示生成影片屬於 AI 產出，提醒觀眾內容非真實拍攝。

對台灣市場而言，這些挑戰同樣真實：

社群平台需要管控假訊息影片擴散
廣告業者要注意版權與授權合約
教育單位需要教導學生判讀 AI 生成內容

10｜AI 影片生成的下一步，機會與責任並存

Google Veo 3 進駐 Gemini App，標誌著 AI 影片生成技術的進一步普及化。從文字生成、圖片生成，到現在「一張照片就能變影片」，AI 正在快速降低內容製作的門檻。

對創作者來說，這是加快內容產出、降低製作成本的機會。對品牌和企業而言，意味著能更靈活地產出在地化行銷素材。但同時，也伴隨著倫理風險與品質管控的挑戰。

未來的內容生產流程，將越來越像「與 AI 合作」：人類決定故事、品牌訊息與核心概念，AI 幫助生成素材、測試版本、加快產出速度。

如何善用這項工具，同時維護專業與責任感，將會是台灣內容產業、行銷業、教育界、甚至法規制定者必須共同面對的課題。

參考資料：https://arstechnica.com/ai/2025/07/google-adds-photo-to-video-generation-with-veo-3-to-the-gemini-app/

如果你也對AI趨勢感興趣，歡迎訂閱我們的AI新聞電子報、加入Line社群，一起即時掌握全球AI最新動態與應用案例！

InfoAI Line社群動態更新｜點此加入

InfoAI電子報｜點此訂閱

閱讀更多最新的「全球 AI 新聞摘要解讀」

OpenAI將Sora整合ChatGPT，AI影片製作迎來新革命
Moonvalley 推出 AI 影片生成器，合法授權訓練數據開創 AI 影像新時代
OpenAI推Sora Turbo並整合至ChatGPT，影像影片一鍵生成
用 AI 快速製作高品質影片：11款 AI 影片生成工具推薦與選擇指南
生成式 AI 進入三合一時代：從文字、影像到音樂，只需一個想法，打造一人製作影片與配樂流程
Instagram Threads 將導入影片廣告 開啟商業化新篇章
OpenAI推出語音影片互動功能　ChatGPT進化為AI助理
Midjourney推出首款AI影片生成模型V1　以影像進軍下一波創作浪潮
Perplexity結合Pika Labs，開啟AI搜尋生成影片時代
Runway推出AI生成影片平台革新遊戲美術流程

全球的 AI 新聞

每天有上百條，值得關注的有哪些？

InfoAI 為您：

01｜精選出最值得關注的新聞

02｜解讀新聞洞察趨勢與啟發

03｜從市場商機進行深度探索

提案成功研究院

助力創業成功，募資成功，提案成功。

Content Power

｛ AI 世代的出版商 ｝

運用AI與知識庫

聰明創作好內容