全球AI新聞精選解讀
全球AI新聞精選解讀
email聯絡
  • 首頁
  • 關於InfoAI
  • 訂閱電子報
  • 加入 Line 群
  • 最新文章
  • 新聞速讀
  • 精選解讀
  • 深度報導
  • 落地應用
  • AI 知識
  • 提示詞
  • AI 工具
  • InfoAI Salon
  • …  
    • 首頁
    • 關於InfoAI
    • 訂閱電子報
    • 加入 Line 群
    • 最新文章
    • 新聞速讀
    • 精選解讀
    • 深度報導
    • 落地應用
    • AI 知識
    • 提示詞
    • AI 工具
    • InfoAI Salon
全球AI新聞精選解讀
全球AI新聞精選解讀
  • 首頁
  • 關於InfoAI
  • 訂閱電子報
  • 加入 Line 群
  • 最新文章
  • 新聞速讀
  • 精選解讀
  • 深度報導
  • 落地應用
  • AI 知識
  • 提示詞
  • AI 工具
  • InfoAI Salon
  • …  
    • 首頁
    • 關於InfoAI
    • 訂閱電子報
    • 加入 Line 群
    • 最新文章
    • 新聞速讀
    • 精選解讀
    • 深度報導
    • 落地應用
    • AI 知識
    • 提示詞
    • AI 工具
    • InfoAI Salon
email聯絡
全球AI新聞精選解讀

Google Veo 2 再進化:讓 AI 影片創作「懂運鏡」,行銷與創意產業將迎來新拐點

· 精選解讀

InfoAI 全球AI新聞摘要與解讀

InfoAI全球AI新聞精選與解讀|
Google Veo 2 加入 AI 攝影指令影片自動生成升級

你想像過只靠文字就能生成運鏡專業的影片嗎?Google 最新 AI 工具 Veo 2 不僅理解攝影指令,還能修補、擴展畫面,甚至做影像插補,讓品牌影片製作時間從 8 週縮短為 8 小時。

Google 正在重新定義 AI 生成影片的邊界。其最新一代 AI 影片生成模型 Veo 2,正式加入了攝影鏡頭指令、畫面修補擴展、以及數位浮水印等進階功能,讓原本只靠文字描述生成影片的方式,如今進化為更貼近專業導演語言的創作工具。

在 Veo 2 的幫助下,用戶不僅能以文字創作影片劇情,也能指定鏡頭語法,例如「空拍開場、左搖鏡轉進主角」、「延時攝影捕捉城市日落」,讓 AI 理解攝影語言並生成相對應的視覺畫面。這項更新對於內容創作者、行銷團隊、媒體機構而言,不只是工作流程的加速,更是影像表達層次的質變。

從文字描述到鏡頭語法:Veo 2 的 AI「導演力」啟動

Veo 是 Google DeepMind 團隊所研發的多模態生成模型,與文字生成工具如 Gemini 不同,它專注於處理與理解影片語意,並將語言輸入轉化為連貫的動態畫面。

在 Veo 的初代版本中,使用者可以輸入像「一隻狐狸奔跑在雪地裡」這樣的指令,Veo 會根據自然語言輸出一段短片。但這樣的輸出,更多是視覺概念的模擬,缺乏專業影片中應有的運鏡、構圖、光影轉場與節奏感。

而 Veo 2 則突破這個瓶頸。它導入所謂的「camera control prompt」,使用者可以像導演一樣下達拍攝指令,系統將根據這些指令改變鏡頭移動方式、觀看角度與動態時間處理(例如慢動作、延時攝影等),這代表使用者第一次可以用自然語言控制虛擬攝影機的拍攝方式。

這不只是一項技術炫技,更是內容製作語彙的革新。Google 表示,Veo 2 透過訓練大規模影片數據,學習實際拍攝手法與電影語法,並建立語言與視覺之間的轉換橋梁,成為真正具備「導演感知」的生成式模型。

Inpainting 與 Outpainting:把影片當 Photoshop 處理

除了拍攝風格上的突破,Veo 2 還加入了「inpainting」與「outpainting」功能。

  • Inpainting(修補):讓使用者可以指定影片中的特定區塊進行內容移除與替換。例如將背景中的雜物、人物、品牌 logo 等消除,並以周邊畫面自然補足。

  • Outpainting(擴展):讓原本的影片畫面延伸,例如將 4:3 畫面擴大為 16:9 或超寬比例,並自動以 AI 生成合理的左右延伸畫面。

這樣的功能,類似 Adobe Firefly 中圖像生成的「Generative Expand」機制,只不過 Veo 是應用在影片連續畫面中。對許多製作預算有限的中小品牌來說,這可以大幅節省重拍與後製成本。

影像插補與 AI 過場:兩張圖之間也能變影片

Google 也在 Veo 2 中測試新的功能,讓 AI 能根據兩張靜態圖之間,自動補足過場畫面。舉例來說,若有一張開場畫面與一張結尾畫面,Veo 能夠透過學習合理的物理與視覺邏輯,自動生成中間的變化動畫,使兩張圖之間的過渡更自然。

這種「影像補間」技術過去多應用於動畫製作中,而現在 AI 開始能用在影片生成流程,代表未來只要有一系列分鏡草圖,就能讓 AI 自動轉成完整動畫,甚至有潛力用於故事板快速影片化。

數位浮水印與版權追溯:內容透明的關鍵機制

隨著 AI 生成影片進入商業應用,如何標記、追溯其來源成為重要課題。Google 宣布,所有 Veo 所生成的影片將內嵌自家研發的「SynthID」浮水印技術,這是一種人眼不可見、但可機器識別的資料標籤,可用於未來驗證影片來源,防止偽造與誤用。

類似的標準也正由 Adobe、Sony、Nikon 等公司共同推動,試圖為生成式內容建立「可信編碼」機制,未來將成為數位出版、行銷平台與新聞媒體的重要辨識工具。

行銷應用全面啟動:從 8 週到 8 小時的轉變

Google 指出,目前已經有部分品牌透過 Veo 2 在 Vertex AI 平台進行預覽試用。包括 L'Oréal 與 Kraft Heinz 等企業,已開始嘗試以 Veo 生成社群影片、行銷短片、品牌故事等內容。

Kraft Heinz 更表示,原本需時 8 週製作的內容,透過 Veo 僅需 8 小時便可完成初版,大幅降低溝通與修改成本。而這也代表未來數位內容製作的結構將出現明顯改變,從「專業影片製作團隊」為核心,轉為「AI 編輯器 + 行銷策略師」的雙核心模式。

參考資料:https://www.theverge.com/news/645906/you-can-now-give-googles-ai-video-model-camera-directions​


點擊 訂閱InfoAI電子報
閱讀更多最新的「 全球 AI 新聞摘要解讀」
  • 用 AI 快速製作高品質影片:11款 AI 影片生成工具推薦與選擇指南

  • OpenAI推Sora Turbo並整合至ChatGPT,影像影片一鍵生成

  • Moonvalley 推出 AI 影片生成器,合法授權訓練數據開創 AI 影像新時代

  • OpenAI將Sora整合ChatGPT,AI影片製作迎來新革命

  • YouTube 推出 AI 音樂助理,協助創作者生成免版權背景音樂

  • Google整合Gemini與Veo模型,邁向全能AI助理平台

  • Google Cloud攜六家AI新創,擴張多模態雲端生態圈

  • Google Gemini推出AI播客功能,讓內容「開口說話」

InfoAI|分享AI知識,賦能工作。

Section image

提案成功|助力提案成功,創業成功。

有個好創意想說給投資人聽?來做一份投資人聽了會有興趣的募資簡報如何?

募資|創業|提案

Section image

上一篇
ChatGPT 掀起 AI 芭比人偶風潮,LinkedIn 用戶瘋傳虛擬形象圖,開啟社群自我敘事新戰場
下一篇
Gemini 將 Google Docs 變 AI 播客,工作流程再進化
 返回網站
Cookie的使用
我們使用cookie來改善瀏覽體驗、保證安全性和資料收集。一旦點擊接受,就表示你接受這些用於廣告和分析的cookie。你可以隨時更改你的cookie設定。 了解更多
全部接受
設定
全部拒絕
Cookie 設定
必要的Cookies
這些cookies支援安全性、網路管理和可訪問性等核心功能。這些cookies無法關閉。
分析性Cookies
這些cookies幫助我們更了解訪客與我們網站的互動情況,並幫助我們發現錯誤。
偏好的Cookies
這些cookies允許網站記住你的選擇,以提升功能性與個人化。
儲存