Google Veo 3 進駐 Gemini App,推出「照片轉影片」功能

· 精選解讀

InfoAI 全球AI新聞摘要與解讀

InfoAI全球AI新聞精選與解讀|Gemini App 推出「照片轉影片」功能,AI 影片生成競爭白熱化。

Google 正式宣布,其最新一代 AI 影片生成模型 Veo 3 已經全面整合進旗下的 Gemini App,並帶來一項引人注目的功能更新:支援「照片轉影片」(photo-to-video)生成功能。這項新功能可讓你僅憑一張圖片,就能快速生成長達 8 秒的動態影片,還能模擬專業運鏡效果,為內容製作流程大幅減負。

01|你用一張照片,就能生成 8 秒動態影片

想像一下,你手上有一張風景照,或是一張產品照片,以前頂多能加點特效或做成幻燈片。但現在,Google 推出的 Veo 3 模型讓你能直接「生成一段 8 秒鐘的動態影片」,還能模擬專業的運鏡效果,比如從左到右平移、慢慢推進、甚至縮放特寫。

對於經營社群的人、做產品行銷的人,這就是個省時又省錢的夢幻工具。只要在手機裡打開 Gemini App,訂閱 Gemini Advanced,選擇照片上傳,AI 就能快速產出影片片段,無須專業攝影、剪接軟體或大量後製時間。

這背後的技術並不簡單。Google 在 Veo 3 裡內建了影像深度估計、三維場景重建與鏡頭路徑模擬等 AI 模型,讓單張靜態圖像能「猜出」景深和空間感,進一步生成出移動鏡頭的連續畫面。換句話說,它試著模擬「如果攝影機在這個場景中移動,會拍到什麼」。

對多數使用者來說,操作流程非常簡單:

  1. 打開 Gemini App

  2. 上傳一張照片

  3. 輸入運鏡指令(例如「從右到左平移」)

  4. 等待幾秒就可取得 1080p 的短影片

這也代表,未來很多社群小編、個人創作者,甚至中小企業的行銷人員,可以少請一次攝影師,就做出看起來更專業的動態素材。

02|Google 的 Gemini App,成為一站式 AI 內容工具

Google 不只是把 Veo 3 單獨推出,而是直接內建到自家的 Gemini App 裡。Gemini 是 Google 旗下一個跨平台的 AI 助理服務,原本就整合了聊天問答、文字生成、圖片生成(Imagen)、程式碼輔助(Code Assist)等功能。

現在,影片生成也被納入 Gemini 的能力清單裡。Google 的策略非常明確:要把所有生成式 AI 的能力都包成「一個入口」,讓你在同一個 App 裡完成所有內容需求。

想想看,對一個創作者或行銷人員來說,以前要用好幾個工具:

  • ChatGPT、Gemini 生成文案

  • Canva、Photoshop 編輯圖片

  • Premiere、CapCut 剪影片

未來的 Google 版本想像是:

  • 全部在 Gemini App 內搞定

特別是 Veo 3 的整合後,用戶只要有手機,就能做影片生成。你在等公車、在會議室、在咖啡店都可以開手機做內容草稿。對 Google 來說,這是一個降低進入門檻、強化黏著度的商業策略。

03|Veo 模型的進化:從文字到影片到照片生成影片

Google 在 2024 I/O 開發者大會上,首度曝光了 Veo 影片生成模型的願景。它的定位是多模態影片生成,支援以下主要輸入型態:

  • 文字 → 影片(Text-to-Video)

  • 影片 → 影片(Video-to-Video,例如風格轉換或續拍)

  • 圖片 → 影片(Photo-to-Video)

Veo 2 在 2025 年初就已經進入測試,具備 1080p 高畫質輸出、文字提示控制、風格控制、多版本生成等功能。而 Veo 3 在這次更新裡,重點在以下幾點:

  • 照片到影片:支援單張圖轉 8 秒短片

  • 運鏡控制:模擬專業攝影機動作

  • 多版本生成:輸出多段影片供你選擇最滿意的版本

  • 端上生成:整合到 Gemini App,手機就能用

也就是說,Google 不只想讓你「產出影片」,還要讓你「用得順手」。從選擇風格、構圖、運鏡路徑,到最後的影片輸出格式,都希望能盡量模擬專業影像工作流程。

04|競爭對手的動態:OpenAI、Runway、Pika 不斷加壓

Google 的這次更新,被業界解讀成是對 OpenAI、Runway、Pika 的直接回擊。

OpenAI 今年初展示的 Sora,就一口氣把生成影片的水準推到新高度,支援超過 1 分鐘的連續分鏡、真實感極高的動態場景。這顯示生成式 AI 不再只是「幾秒鐘短片」的噱頭,而是朝著長敘事影片、故事版甚至商業級廣告製作進軍。

Runway 也不遑多讓,Gen-3 已經能在 1080p 解析度下生成短片,並主打版本管理、風格化生成,讓專業用戶能把 AI 生成的內容融入既有的製片流程。

Pika Labs 則採用另一種策略,主打完全雲端、免程式碼、介面友善,吸引了大量中小型創作者與社群經營者。用 Pika 生成影片只需要在瀏覽器打字,能在短時間內產出多段影片供分享。

在這個背景下,Google 的 Veo 3 不得不加快步伐。把生成影片能力從雲端模型搬進 Gemini App,等於是對用戶說:「不需要專業工作站,也不必跑 Python,打開手機就能做。」

05|消費者應用:短影音、行銷素材、社群經營

對一般人來說,最直接的應用就是社群經營。以往經營 TikTok、IG Reels、YouTube Shorts 的創作者,都需要花時間想腳本、拍攝、剪輯。即便只是想把一張漂亮照片做成動態影片,也需要會剪輯軟體。

Veo 3 的照片轉影片功能,就解決了「沒素材」或「沒專業技術」的痛點。

例如:

  • 觀光旅遊業者上傳風景照,快速做出推廣影片

  • 電商上傳產品照,自動生成動態廣告短片

  • 自媒體創作者用插畫或照片製作動態故事

Google 還特別強調運鏡控制,可以避免產出死板的「幻燈片」式動畫。因為 AI 會模擬攝影機移動、調焦距、改變視角,讓影片更像真的拍攝片段。

這對台灣的小型工作室、自媒體接案者、在地行銷公司來說,是非常有吸引力的工具。

06|企業應用:廣告、教育、內訓、品牌溝通

除了個人創作者,中小企業和大型品牌也是 Google 瞄準的對象。影片製作常是行銷預算裡昂貴又耗時的項目,特別是需要大量製作在地化、客製化內容的品牌。

Veo 3 的生成影片功能,可望在以下場景發揮價值:

  • 產品影片:不同顏色、角度、使用情境的版本快速生成

  • 內部教育訓練:示範操作、情境演練的動畫影片

  • 客戶簡報:動態展示解決方案、設計理念

  • 社群廣告:針對特定市場快速產製本地化內容

Google 在官方說法裡也暗示,未來會針對這些商業應用,開發更多版本控制、風格模板、以及企業級授權管理功能。

08|生成式影片的技術挑戰:不只是畫質,還有故事性

生成圖片的技術已經成熟,但影片更難。除了畫質清晰之外,影片需要連續性、物理合理性、故事邏輯。

例如:

  • 人物走路的動作要連貫

  • 鏡頭切換要自然

  • 燈光與陰影一致

  • 物件不能莫名變形或消失

Veo 3 雖然在「短片段生成」已經有顯著進步,但面對 OpenAI Sora 那種「多分鏡敘事影片」還有明顯差距。Google 官方也承認,目前 Veo 3 仍以 8 秒左右的短片為主,主要解決的是社群行銷、短影音的需求。

但長期來看,AI 影片生成的願景是什麼?就是讓任何人都能指令生成完整的影片,甚至包括分鏡、腳本、配樂、旁白。這是一個需要長期研究和迭代的挑戰。

08|訂閱商業模式與未來計畫

目前,Veo 3 的影片生成能力屬於 Gemini Advanced 的付費功能,意味著 Google 正在複製類似 ChatGPT Plus / Enterprise 的分層商業模式。

Gemini Advanced 訂閱用戶可以:

  • 存取最新的 Gemini 1.5 模型

  • 使用更長上下文視窗

  • 優先解鎖 Veo 3 等多模態生成能力

Google 沒有明講未來是否會提供免費版 Veo 影片生成功能,但從競爭態勢看,短期內應該會鎖在付費層級,因為影片生成計算資源消耗大,也是最有商業價值的差異化功能。

官方也承諾未來將持續:

  • 擴大支援更多語言

  • 開放更多地區市場

  • 改善生成品質和控制細節

09|AI 影片生成的倫理與挑戰

最後,不可避免要談到生成式 AI 的風險。影片生成可能被用來製作假新聞、造假證據、色情深偽內容,這些問題也讓各國政府關注。

Google 表示,Veo 3 的生成系統內建多層過濾與安全檢查,禁止生成暴力、色情、仇恨內容。Gemini App 也會標示生成影片屬於 AI 產出,提醒觀眾內容非真實拍攝。

對台灣市場而言,這些挑戰同樣真實:

  • 社群平台需要管控假訊息影片擴散

  • 廣告業者要注意版權與授權合約

  • 教育單位需要教導學生判讀 AI 生成內容

10|AI 影片生成的下一步,機會與責任並存

Google Veo 3 進駐 Gemini App,標誌著 AI 影片生成技術的進一步普及化。從文字生成、圖片生成,到現在「一張照片就能變影片」,AI 正在快速降低內容製作的門檻。

對創作者來說,這是加快內容產出、降低製作成本的機會。對品牌和企業而言,意味著能更靈活地產出在地化行銷素材。但同時,也伴隨著倫理風險與品質管控的挑戰。

未來的內容生產流程,將越來越像「與 AI 合作」:人類決定故事、品牌訊息與核心概念,AI 幫助生成素材、測試版本、加快產出速度。

如何善用這項工具,同時維護專業與責任感,將會是台灣內容產業、行銷業、教育界、甚至法規制定者必須共同面對的課題。

參考資料:https://arstechnica.com/ai/2025/07/google-adds-photo-to-video-generation-with-veo-3-to-the-gemini-app/

如果你也對AI趨勢感興趣,歡迎訂閱我們的AI新聞電子報、加入Line社群,一起即時掌握全球AI最新動態與應用案例!

broken image

全球的 AI 新聞

每天有上百條,值得關注的有哪些?

InfoAI 為您:

01|精選出最值得關注的新聞

02|解讀新聞洞察趨勢與啟發

03|從市場商機進行深度探索

broken image

提案成功研究院

助力創業成功,募資成功,提案成功。

broken image

Content Power

{ AI 世代的出版商 }

運用AI與知識庫

聰明創作好內容