人物觀點｜李飛飛押注空間智慧：AI 下一步不能只靠更會說話

Business Review

email聯絡

Business Review

email聯絡

人物觀點｜李飛飛押注空間智慧：AI 下一步不能只靠更會說話

李飛飛（Fei-Fei Li）提出的「空間智慧」觀點，提醒我們重新理解 AI 的下一個能力邊界：真正困難的，不只是讓模型生成更多文字，而是讓 AI 能理解、生成並操作三維世界。

· AI 模型,人物觀點

InfoAI | 李飛飛提出「空間智慧」觀點，提醒企業重新理解 AI 的下一個能力邊界：AI 不只要會處理文字，更要能理解三維世界、支援模擬、設計、機器人與現場流程。

李飛飛的空間智慧觀點，為何是企業 AI 策略的下一個提醒？

過去兩年，許多企業理解 AI 的方式，幾乎都是從大型語言模型（LLM）開始：能不能寫報告、整理資料、生成簡報、回答客服問題、協助寫程式碼。這些能力確實重要，也已經改變知識工作的日常。

但是，當 AI 不再只停留在文字、文件與對話界面，而開始進入製造、設計、模擬、機器人與現場流程時，企業應該怎麼重新理解 AI 能力？

這正是李飛飛在 2025 年底明確提出的「空間智慧」（spatial intelligence）議題。空間智慧指的是 AI 對三維世界的感知、生成、推理與互動能力。她在《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》中指出，大型語言模型已改變人類處理抽象知識的方式，但仍缺乏與世界互動的經驗；她認為，空間智慧會改變人類創作、機器人、科學發現，以及我們與真實或虛擬世界互動的方式。

對企業來說，這不是一個遙遠的研究課題，而是 AI 是否會進一步進入製造、設計、模擬與現場流程的早期訊號。

如果 AI 要走進工廠、倉儲、醫療訓練、建築設計、機器人、遊戲世界與科學模擬，只會處理文字是不夠的。它必須知道一個空間怎麼形成，一張照片背後的深度與尺度是什麼，物體之間的距離如何影響動作，人在房間裡如何移動，機器手臂碰到物件時可能發生什麼。

關鍵解讀：

李飛飛提出的不是一個新產品賣點，而是一條與主流 LLM 熱潮不同的 AI 發展路線。她關心的不是模型能否說得更漂亮，而是 AI 能否從文字世界走向可被感知、模擬、探索與操作的世界。
李飛飛認為，AI 的下一個前線是空間智慧，也就是讓 AI 能理解、生成並與三維世界互動，而不只是處理文字與平面影像。
這個觀點回應了大型語言模型的核心限制：會說明世界，不等於真的理解空間、物理、動作與場景，也不代表能穩定進入機器人、模擬、設計與實體工作流程。
企業不應把空間智慧直接視為成熟商業能力，而應把它當成一個早期但重要的訊號，檢查自己的 AI 策略是否仍停留在文件生成，還是已開始思考 3D、模擬與現場流程。

李飛飛為什麼此時談「空間智慧」？

李飛飛不是從生成式 AI 熱潮才開始談「看見世界」。她長期研究電腦視覺、機器學習與人本 AI。史丹佛官方資料顯示，她是史丹佛電腦科學教授，也是 Stanford HAI 共同創辦人之一，過去曾擔任 Stanford AI Lab 主任。

當許多 AI 公司用更長上下文、更強推理、更高自動化能力來定義下一代模型時，李飛飛切入的是另一個問題：如果 AI 只在文字世界裡進步，它是否真的能走向更完整的智慧？

她在文章中把自己的研究脈絡連回 ImageNet、視覺學習、機器人學習與 World Labs 的創立。也就是說，這不是突然冒出的創業口號，而是她多年研究路線往前推進後，自然抵達的一個判斷。

但李飛飛現在同時是 World Labs 共同創辦人兼執行長，而 World Labs 正是以空間智慧與世界模型作為核心方向的公司。因此，她的觀點有研究價值，也帶有商業立場；我們可以重視她的判斷，但不能直接認為是整個產業已經形成的共識，更不能把 World Labs 的產品進度視為市場已經成熟。

01｜大型語言模型很強，但它仍主要活在「文字世界」

大型語言模型擅長處理抽象知識。它可以整理法律文件、生成報告、寫程式碼、回答問題，也可以把複雜內容轉成更容易理解的文字。對知識工作者來說，這已經帶來很大的改變。

但李飛飛提醒我們，這種能力仍有一個根本限制：語言不是世界本身。

一個模型可以描述一張廚房照片，卻不一定真正理解廚房裡的空間比例；可以說明機器手臂如何抓取杯子，卻不代表它知道杯子的材質、重量、滑動風險與碰撞後果；可以寫出一段室內設計提案，卻不一定能生成一個可走入、可測量、可修改、可模擬的三維空間。

這就是「會說」與「懂世界」的差別。

李飛飛在文章裡指出，當代生成式 AI 已能生成文字、程式碼、照片級影像與短影片，但許多更深層的能力仍未實現。例如日常可用的自主機器人、加速疾病研究、新材料發現、粒子物理探索，以及真正幫助人類創作者理解複雜空間的工具。

她不是否定 LLM，而是提醒我們：LLM 只是 AI 能力的一個面向。企業如果把 AI 等同於聊天機器人、文件助理或客服問答，很可能會錯過下一階段更接近現場、更接近產品，也更接近物理世界的競爭。

02｜空間智慧不是 3D 生圖，而是讓 AI 建立「世界感」

但如果只是把空間智慧理解成「AI 生成 3D 場景」，又會把這個概念看得太窄。

World Labs 在 2026 年 1 月發佈 World API 時，官方說明指出，這是一個公開 API，可讓開發者從文字、圖片、全景照片、多視角輸入與影片，生成可探索的 3D 世界。這些世界可以在網頁中呈現，也可以匯出到下游工具，或整合到互動系統與模擬流程裡。

這項產品動作顯示，World Labs 想做的不是單張圖像生成，而是把「世界生成」變成一種可被程式呼叫、可被工作流程使用的能力。官方文章也把應用場景指向遊戲與沉浸式媒體、機器人與模擬等方向。

這裡需要補上一個關鍵定義：世界模型可以理解為一種讓 AI 學會模擬環境狀態與變化的模型路線。重點不只是生成畫面，而是建立可被探索、推演或互動的場景。

不過，從 World API 目前公開的說法來看，它更像是讓開發者能更容易生成、探索，並把 3D 世界接進既有工具與應用流程；這並不代表 AI 已經能在真實世界裡穩定行動。

生成一個可探索的環境，和讓機器人在現場安全完成任務，中間還隔著感測器、控制系統、資料品質、錯誤處理與安全驗證等現實條件。

所以，空間智慧比較準確的理解，不是「AI 會畫 3D 圖」，而是 AI 開始具備把視覺、深度、空間結構、場景關係與互動可能性連在一起的能力。

這會讓 AI 從「產生內容」，逐步走向「理解世界、建立世界感」。

03｜World Labs 的 10 億美元募資，代表資本市場也在追問同一件事

如果只有李飛飛一篇文章，這個題目比較像是一個思想觀點；但 World Labs 後續的募資動作，讓它變成一個值得追蹤的產業訊號。

路透社（Reuters）在 2026 年 2 月報導，World Labs 完成 10 億美元募資，投資人包括 AMD、輝達（NVIDIA）、Autodesk、Emerson Collective、Fidelity Management & Research Company 與 Sea 等。報導也指出，Autodesk 投資 2 億美元，並將擔任 World Labs 的顧問。這份投資人名單值得拆解。

如果 World Labs 只是一家一般生成式內容工具公司，Autodesk 的角色不會那麼有象徵性。Autodesk 本身與設計、工程與製造軟體市場高度相關，因此它的投入，不只是財務上的支持，也透露出空間智慧可能進入設計、工程、模擬與工業工作流程的想像。

路透社也將空間智慧定義為一種讓 AI 推理三維世界如何運作的路線，而不是只依賴文字或平面影像。報導指出，World Labs 的基礎模型目標，是讓 AI 能感知、生成並與 3D 世界互動。

換句話說，這筆募資透露的重點，不只是「3D 生成工具開始受到關注」，而是資本市場正在尋找 LLM 之後的下一個高價值基礎能力。如果這條路線成立，它牽動的將不只是內容產業，也可能延伸到設計、機器人、模擬訓練、工業軟體與算力需求。

但這仍然只是早期訊號。募資規模與大公司投資，只能說明市場正在押注，不能證明技術已經成熟，也不能證明 World Labs 已找到可大規模商業化的路徑。

點此訂閱電子報

04｜空間智慧可能很重要，但它未必會比 LLM 更快落地

支持李飛飛的人會說，空間智慧是 AI 從文字走向世界的必要一步。這個說法有道理。

但反方也有成立之處。

第一，企業真正願意付費的能力，往往不是最前線的研究能力，而是能快速改善流程、降低成本、提高產出品質的工具。LLM 之所以快速普及，是因為它幾乎不需要企業改造現場設備，就能先進入文件、客服、行銷、法務、研究、程式開發與內部知識管理。

空間智慧不同。它往往需要更複雜的資料、更高的算力、更專業的工具鏈，也更容易碰到場景差異。建築設計、遊戲製作、機器人模擬、工廠自動化，各自需要的資料格式、品質標準與責任邊界都不同。

第二，生成「看起來合理」的 3D 世界，與生成「可工程驗證」的 3D 世界，是兩件不同的事。遊戲場景可以容忍某些不精準；工廠模擬、醫療訓練、建築施工與機器人控制，不能只靠視覺合理，還必須符合尺度、物理、材料、碰撞、安全與流程要求。

第三，世界模型如果要走向機器人與實體 AI，還要面對真實世界最難處理的變數：光線、噪音、遮擋、磨損、突發情況、人類行為、責任歸屬與安全風險。這些不是單靠模型能力提升就能自動解決。

換成企業的場景來看，室內設計公司可以先用 3D 生成工具做提案草案，快速讓客戶看見空間感；但半導體廠如果要用它模擬產線動線，就必須面對精度、安全、系統整合與現場責任問題。前者可以先試，後者不能只看展示效果。

因此，較穩健的判斷不是「空間智慧一定取代 LLM」，而是：它可能成為 LLM 之外的另一條重要路線，但落地速度、商業模式與可靠性，仍需要時間驗證。

05｜這不是科技新聞，而是產業準備度問題

對讀者來說，李飛飛的觀點最有用之處，不是去追逐一個新名詞，而是重新檢查自己理解 AI 的方式是否太窄。

如果你是企業主管，過去一年可能已經開始要求同仁使用 ChatGPT、Copilot、Gemini 或 Claude，也可能已經導入客服機器人、會議摘要、內部知識庫與行銷文案工具。這些是必要的第一步，但不是 AI 的全部。

空間智慧提醒我們，下一階段的 AI 應用可能進入幾個更接近產業結構的場景。

製造業與自動化

製造業如果要把 AI 放進現場，不能只靠文字助理。真正困難的地方在於，AI 需要理解設備所在的位置、各作業站之間的動線、物料如何移動、機器手臂如何操作，以及現場發生異常時可能牽動哪些安全與流程問題。

建築、室內設計與工程

如果 AI 能從照片、平面圖、影片或文字生成可探索的 3D 場景，設計討論、客戶溝通、施工前模擬與教育訓練，都可能被重新安排。

這裡真正重要的，不只是 AI 能不能做出漂亮的渲染圖，而是它能不能更快產生一個可討論、可修改，也能進一步檢查與驗證的空間草案。

遊戲、XR 與數位內容

內容產業經常受到人力與製作成本限制。如果世界模型能降低 3D 場景的建立門檻，小型團隊就有機會用較低成本，先做出更完整的場景原型。

不過，能做出原型，不代表已經能直接商業化。最後能不能變成可發佈、可營運、可收費的內容，仍取決於美術品質、互動邏輯、版權風險，以及能否和既有製作工具順利整合

半導體與算力供應鏈

空間智慧、世界模型與模擬訓練如果逐漸形成新需求，也可能帶動圖形處理器、AI 晶片、邊緣運算、感測器與資料中心的長期需求。不過，這仍是根據投資人組成與應用方向延伸出的產業推論，還不能視為已經被驗證的新一波需求週期。

對供應鏈來說，這件事不只是模型公司的故事，也可能成為觀察下一波算力與硬體需求的重要線索。

行動框架｜企業判斷空間智慧的五問檢查法

企業現在不需要急著追每一個 world model 新產品，但可以先用五個問題，判斷這類技術和自己的工作流程到底有沒有關係。

1. 我們的工作流程是否真的需要「空間理解」？

如果 AI 應用主要集中在文件、文字、客服、研究與程式碼，大型語言模型（LLM）可能已經足夠。

但如果流程涉及場地、動線、設備、物體位置、模擬訓練或視覺檢查，就應該開始追蹤空間智慧的發展。因為這類任務需要的不只是回答問題，而是理解空間、物件與動作之間的關係。

2. 我們需要的是展示圖，還是可驗證的工作場景？

行銷展示、遊戲概念、室內設計草案，可以容忍較高的創作彈性。這些場景中，3D 生成工具可以先用來加快發想與溝通。

但工廠、醫療、建築與機器人應用不能只看畫面是否漂亮。這些場景需要尺度、物理、碰撞、安全與可追溯性，因為一個空間判斷錯誤，可能影響的不只是設計修改，而是現場安全與責任問題。

3. 這項工具能否接進既有流程？

如果生成的 3D 世界不能匯出、不能修改，也不能進入 Unity、Unreal、CAD、BIM、模擬系統或企業既有工具，它就比較像創作玩具，而不是企業流程工具。

真正有價值的空間智慧工具，不只是產生一個場景，還能讓團隊把這個場景拿去討論、修改、測試，並接進原本的設計、訓練、開發或模擬流程。

4. 錯誤成本在哪裡？

空間模型如果把尺度看錯、物體位置判斷錯、動線推估錯，後果是多修一次設計圖，還是造成現場安全風險？

錯誤成本越高，企業越不能只看生成效果。對低風險場景來說，錯誤可能只是多花一點修改時間；但在製造、醫療、建築與機器人場景裡，錯誤可能牽動安全、責任與營運中斷。

5. 這是現在採購，還是先做技術觀察？

對多數企業來說，現在較適合採取「小規模原型測試」，而不是大規模導入。

可以先選一個低風險場景，例如展示空間、訓練教材、設計草案或數位內容原型，觀察工具是否真的縮短流程、降低溝通成本、提升原型品質，而不是只增加一個看起來新奇的新玩具。

總結｜AI 下一步不只在語言，而在能否進入世界

李飛飛這個觀點真正有價值的地方，是把 AI 討論從「模型會不會回答」，推向「模型是否理解世界」。

大型語言模型已經讓 AI 進入知識工作，但空間智慧指向的是另一種能力：讓 AI 能理解場景、生成環境、支援模擬，甚至在未來進入機器人與實體工作流程。

這個觀點不該被過度解讀成「3D 世界生成已經成熟」，也不代表「機器人很快就會全面落地」。World Labs 的 World API 與 10 億美元募資，代表這條路線已被產品與資本市場重視，但它仍處在早期階段。從可探索的 3D 世界，到能可靠部署的實體 AI，中間還有工程、資料、安全與商業驗證要完成。

接下來值得觀察的，不是單一展示影片有多驚豔，而是這類 world models 能否真正進入工作流程：能否被設計師修改、被工程師驗證、被機器人模擬系統使用，或被企業納入低風險訓練場景。

對企業來說，現在可以帶回組織內部問一個問題：我們的 AI 策略是否仍停在文字生產，還是已經開始準備面對 3D、模擬與現場流程的下一階段？

文/ 睿客

點此訂閱電子報

點此加入Line 群

FAQ:

Q1｜李飛飛所說的「空間智慧」是什麼？

空間智慧是指 AI 對三維世界的感知、生成、推理與互動能力，不只是看懂圖片或生成 3D 畫面。
依據：李飛飛在〈From Words to Worlds〉中把空間智慧視為 AI 下一個前線，路透社也將其說明為讓 AI 推理三維世界如何運作的能力。
限制／邊界：目前空間智慧仍在早期產品化階段，不能等同於機器人已能在真實世界穩定工作。
意義／行動：企業可先檢查自己的 AI 應用是否涉及場地、動線、設備、模擬與視覺檢查，而不是只把 AI 當文字工具。

Q2｜空間智慧和大型語言模型有什麼不同？

大型語言模型主要處理文字與抽象知識，空間智慧則關注 AI 是否能理解三維環境、物體關係、場景變化與互動可能性。
依據：李飛飛認為 LLM 已改變抽象知識工作，但仍缺乏與世界互動的基礎；World Labs 的 World API 則聚焦從文字、圖片與影片生成可探索的 3D 世界。
限制／邊界：這不是 LLM 與空間智慧二選一，未來更可能是文字、視覺、3D、動作與模擬能力的整合。
意義／行動：企業不必否定現有 LLM 投資，但應開始辨識哪些流程需要從文字 AI 延伸到視覺、3D 與現場資料。

Q3｜World Labs 的 World API 代表空間智慧已經成熟了嗎？

World API 代表空間智慧開始進入可被開發者使用的產品階段，但不代表這項能力已全面成熟。
依據：World Labs 官方說明，World API 可從文字、圖片、全景照片、多視角輸入與影片生成可探索的 3D 世界，並可用於互動系統與模擬流程。
限制／邊界：從生成可探索場景到支援工程驗證、工廠部署或機器人控制，中間仍有資料、精度、安全與系統整合問題。
意義／行動：企業可先用低風險場景試做，例如展示空間、訓練教材、設計草案或遊戲原型，不宜直接放入高風險現場。

Q4｜為什麼 World Labs 的 10 億美元募資重要？

這筆募資顯示資本市場開始把空間智慧與世界模型視為 LLM 之外的重要 AI 路線。
依據：路透社報導指出，World Labs 完成 10 億美元募資，投資人包括 AMD、輝達、Autodesk、Emerson Collective、Fidelity Management & Research Company 與 Sea。
限制／邊界：募資規模只能說明市場押注，不能證明技術成熟，也不能證明商業模式已被大規模驗證。
意義／行動：企業與供應鏈可把它視為長線觀察訊號，追蹤設計軟體、機器人模擬、3D 內容與算力需求是否形成新市場。

Q5｜空間智慧對製造業有什麼意義？

空間智慧對製造業的意義，在於 AI 可能從文件與客服，進一步走向設備空間、工站動線、機器手臂、視覺檢查與模擬訓練。
依據：World Labs 官方把 World API 的應用方向連到機器人與模擬，路透社也指出空間智慧可與機器人、AR／VR 等場景相關。
限制／邊界：製造業場景要求高可靠性與安全性，不能只看 3D 生成效果，還要看精度、感測、控制、資料治理與責任分工。
意義／行動：製造業可以先從低風險模擬、教育訓練與流程溝通開始測試，而不是直接把空間模型用於產線控制。

Q6｜企業現在該不該採購空間智慧工具？

多數企業現在較適合先做技術觀察與小規模原型測試，而不是急著大規模採購。
依據：World API 已展示可程式化生成 3D 世界的方向，但公開資料仍主要支持早期產品化與應用探索，尚不足以證明其可適用於所有企業工作流程。
限制／邊界：內容創作、設計草案與教育訓練可較早試用；醫療、工廠、建築施工與機器人控制等高風險場景，必須更謹慎。
意義／行動：企業可以用「是否需要空間理解、是否可驗證、是否能接進既有流程、錯誤成本多高」四個問題決定是否導入。

參考資料：

From Words to Worlds: Spatial Intelligence is AI's Next Frontier
Announcing the World API
AI pioneer Fei-Fei Li's World Labs raises $1 billion in funding
Fei-Fei Li - Stanford Profiles
About - Dr. Fei-Fei Li
World Labs

閱讀推薦： 

精選解讀｜零售 AI 正從雲端功能走向門市終端設備
精選解讀｜代理型 AI 進入零售：亞太市場為何可能成為全球第一個「AI 代購」戰場
精選解讀｜零售業把 AI 從儀表板推到對話界面後，真正改寫的是決策節點
精選解讀｜Tesco 與 Mistral AI 簽三年生成式 AI 合作：共建 AI 實驗室，直攻零售顧客體驗與營運效率
新聞速讀｜Zara 導入 AI 重整影像製作流程，讓零售日常運作悄然變形
精選解讀｜日本大和證券攜手 Sakana AI 打造零售客戶專屬工具，金融＋生成式 AI 實驗啟動
精選解讀｜AI Agents 重塑消費產業：零售、旅遊、餐飲的數位競爭新賽局
AI 新聞速報｜AI 造型師 Ella 上線，Vivrelle、Revolve、FWRD 正重塑零售導購新典範
Agentic AI 重塑零售顧客體驗：從動線模擬到智慧購物車
洞察觀點｜AI 引爆零售業的下一步轉型：零售經營者該如何制定務實的 AI 策略
零售業者全面導入 Agentic AI, 打造智慧銷售與顧客體驗雙贏

閱讀更多的「全球 AI 新聞摘要解讀」