人物觀點|李飛飛押注空間智慧:AI 下一步不能只靠更會說話
人物觀點|李飛飛押注空間智慧:AI 下一步不能只靠更會說話
李飛飛(Fei-Fei Li)提出的「空間智慧」觀點,提醒我們重新理解 AI 的下一個能力邊界:真正困難的,不只是讓模型生成更多文字,而是讓 AI 能理解、生成並操作三維世界。
李飛飛的空間智慧觀點,為何是企業 AI 策略的下一個提醒?
過去兩年,許多企業理解 AI 的方式,幾乎都是從大型語言模型(LLM)開始:能不能寫報告、整理資料、生成簡報、回答客服問題、協助寫程式碼。這些能力確實重要,也已經改變知識工作的日常。
但是,當 AI 不再只停留在文字、文件與對話界面,而開始進入製造、設計、模擬、機器人與現場流程時,企業應該怎麼重新理解 AI 能力?
這正是李飛飛在 2025 年底明確提出的「空間智慧」(spatial intelligence)議題。空間智慧指的是 AI 對三維世界的感知、生成、推理與互動能力。她在《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》中指出,大型語言模型已改變人類處理抽象知識的方式,但仍缺乏與世界互動的經驗;她認為,空間智慧會改變人類創作、機器人、科學發現,以及我們與真實或虛擬世界互動的方式。
對企業來說,這不是一個遙遠的研究課題,而是 AI 是否會進一步進入製造、設計、模擬與現場流程的早期訊號。
如果 AI 要走進工廠、倉儲、醫療訓練、建築設計、機器人、遊戲世界與科學模擬,只會處理文字是不夠的。它必須知道一個空間怎麼形成,一張照片背後的深度與尺度是什麼,物體之間的距離如何影響動作,人在房間裡如何移動,機器手臂碰到物件時可能發生什麼。
關鍵解讀:
李飛飛提出的不是一個新產品賣點,而是一條與主流 LLM 熱潮不同的 AI 發展路線。她關心的不是模型能否說得更漂亮,而是 AI 能否從文字世界走向可被感知、模擬、探索與操作的世界。
李飛飛認為,AI 的下一個前線是空間智慧,也就是讓 AI 能理解、生成並與三維世界互動,而不只是處理文字與平面影像。
這個觀點回應了大型語言模型的核心限制:會說明世界,不等於真的理解空間、物理、動作與場景,也不代表能穩定進入機器人、模擬、設計與實體工作流程。
企業不應把空間智慧直接視為成熟商業能力,而應把它當成一個早期但重要的訊號,檢查自己的 AI 策略是否仍停留在文件生成,還是已開始思考 3D、模擬與現場流程。
李飛飛提出的不是一個新產品賣點,而是一條與主流 LLM 熱潮不同的 AI 發展路線。她關心的不是模型能否說得更漂亮,而是 AI 能否從文字世界走向可被感知、模擬、探索與操作的世界。
李飛飛認為,AI 的下一個前線是空間智慧,也就是讓 AI 能理解、生成並與三維世界互動,而不只是處理文字與平面影像。
這個觀點回應了大型語言模型的核心限制:會說明世界,不等於真的理解空間、物理、動作與場景,也不代表能穩定進入機器人、模擬、設計與實體工作流程。
企業不應把空間智慧直接視為成熟商業能力,而應把它當成一個早期但重要的訊號,檢查自己的 AI 策略是否仍停留在文件生成,還是已開始思考 3D、模擬與現場流程。
李飛飛為什麼此時談「空間智慧」?
李飛飛不是從生成式 AI 熱潮才開始談「看見世界」。她長期研究電腦視覺、機器學習與人本 AI。史丹佛官方資料顯示,她是史丹佛電腦科學教授,也是 Stanford HAI 共同創辦人之一,過去曾擔任 Stanford AI Lab 主任。
當許多 AI 公司用更長上下文、更強推理、更高自動化能力來定義下一代模型時,李飛飛切入的是另一個問題:如果 AI 只在文字世界裡進步,它是否真的能走向更完整的智慧?
她在文章中把自己的研究脈絡連回 ImageNet、視覺學習、機器人學習與 World Labs 的創立。也就是說,這不是突然冒出的創業口號,而是她多年研究路線往前推進後,自然抵達的一個判斷。
但李飛飛現在同時是 World Labs 共同創辦人兼執行長,而 World Labs 正是以空間智慧與世界模型作為核心方向的公司。因此,她的觀點有研究價值,也帶有商業立場;我們可以重視她的判斷,但不能直接認為是整個產業已經形成的共識,更不能把 World Labs 的產品進度視為市場已經成熟。
01|大型語言模型很強,但它仍主要活在「文字世界」
大型語言模型擅長處理抽象知識。它可以整理法律文件、生成報告、寫程式碼、回答問題,也可以把複雜內容轉成更容易理解的文字。對知識工作者來說,這已經帶來很大的改變。
但李飛飛提醒我們,這種能力仍有一個根本限制:語言不是世界本身。
一個模型可以描述一張廚房照片,卻不一定真正理解廚房裡的空間比例;可以說明機器手臂如何抓取杯子,卻不代表它知道杯子的材質、重量、滑動風險與碰撞後果;可以寫出一段室內設計提案,卻不一定能生成一個可走入、可測量、可修改、可模擬的三維空間。
這就是「會說」與「懂世界」的差別。
李飛飛在文章裡指出,當代生成式 AI 已能生成文字、程式碼、照片級影像與短影片,但許多更深層的能力仍未實現。例如日常可用的自主機器人、加速疾病研究、新材料發現、粒子物理探索,以及真正幫助人類創作者理解複雜空間的工具。
她不是否定 LLM,而是提醒我們:LLM 只是 AI 能力的一個面向。企業如果把 AI 等同於聊天機器人、文件助理或客服問答,很可能會錯過下一階段更接近現場、更接近產品,也更接近物理世界的競爭。
02|空間智慧不是 3D 生圖,而是讓 AI 建立「世界感」
但如果只是把空間智慧理解成「AI 生成 3D 場景」,又會把這個概念看得太窄。
World Labs 在 2026 年 1 月發佈 World API 時,官方說明指出,這是一個公開 API,可讓開發者從文字、圖片、全景照片、多視角輸入與影片,生成可探索的 3D 世界。這些世界可以在網頁中呈現,也可以匯出到下游工具,或整合到互動系統與模擬流程裡。
這項產品動作顯示,World Labs 想做的不是單張圖像生成,而是把「世界生成」變成一種可被程式呼叫、可被工作流程使用的能力。官方文章也把應用場景指向遊戲與沉浸式媒體、機器人與模擬等方向。
這裡需要補上一個關鍵定義:世界模型可以理解為一種讓 AI 學會模擬環境狀態與變化的模型路線。重點不只是生成畫面,而是建立可被探索、推演或互動的場景。
不過,從 World API 目前公開的說法來看,它更像是讓開發者能更容易生成、探索,並把 3D 世界接進既有工具與應用流程;這並不代表 AI 已經能在真實世界裡穩定行動。
生成一個可探索的環境,和讓機器人在現場安全完成任務,中間還隔著感測器、控制系統、資料品質、錯誤處理與安全驗證等現實條件。
所以,空間智慧比較準確的理解,不是「AI 會畫 3D 圖」,而是 AI 開始具備把視覺、深度、空間結構、場景關係與互動可能性連在一起的能力。
這會讓 AI 從「產生內容」,逐步走向「理解世界、建立世界感」。
03|World Labs 的 10 億美元募資,代表資本市場也在追問同一件事
如果只有李飛飛一篇文章,這個題目比較像是一個思想觀點;但 World Labs 後續的募資動作,讓它變成一個值得追蹤的產業訊號。
路透社(Reuters)在 2026 年 2 月報導,World Labs 完成 10 億美元募資,投資人包括 AMD、輝達(NVIDIA)、Autodesk、Emerson Collective、Fidelity Management & Research Company 與 Sea 等。報導也指出,Autodesk 投資 2 億美元,並將擔任 World Labs 的顧問。這份投資人名單值得拆解。
如果 World Labs 只是一家一般生成式內容工具公司,Autodesk 的角色不會那麼有象徵性。Autodesk 本身與設計、工程與製造軟體市場高度相關,因此它的投入,不只是財務上的支持,也透露出空間智慧可能進入設計、工程、模擬與工業工作流程的想像。
路透社也將空間智慧定義為一種讓 AI 推理三維世界如何運作的路線,而不是只依賴文字或平面影像。報導指出,World Labs 的基礎模型目標,是讓 AI 能感知、生成並與 3D 世界互動。
換句話說,這筆募資透露的重點,不只是「3D 生成工具開始受到關注」,而是資本市場正在尋找 LLM 之後的下一個高價值基礎能力。如果這條路線成立,它牽動的將不只是內容產業,也可能延伸到設計、機器人、模擬訓練、工業軟體與算力需求。
但這仍然只是早期訊號。募資規模與大公司投資,只能說明市場正在押注,不能證明技術已經成熟,也不能證明 World Labs 已找到可大規模商業化的路徑。
04|空間智慧可能很重要,但它未必會比 LLM 更快落地
支持李飛飛的人會說,空間智慧是 AI 從文字走向世界的必要一步。這個說法有道理。
但反方也有成立之處。
第一,企業真正願意付費的能力,往往不是最前線的研究能力,而是能快速改善流程、降低成本、提高產出品質的工具。LLM 之所以快速普及,是因為它幾乎不需要企業改造現場設備,就能先進入文件、客服、行銷、法務、研究、程式開發與內部知識管理。
空間智慧不同。它往往需要更複雜的資料、更高的算力、更專業的工具鏈,也更容易碰到場景差異。建築設計、遊戲製作、機器人模擬、工廠自動化,各自需要的資料格式、品質標準與責任邊界都不同。
第二,生成「看起來合理」的 3D 世界,與生成「可工程驗證」的 3D 世界,是兩件不同的事。遊戲場景可以容忍某些不精準;工廠模擬、醫療訓練、建築施工與機器人控制,不能只靠視覺合理,還必須符合尺度、物理、材料、碰撞、安全與流程要求。
第三,世界模型如果要走向機器人與實體 AI,還要面對真實世界最難處理的變數:光線、噪音、遮擋、磨損、突發情況、人類行為、責任歸屬與安全風險。這些不是單靠模型能力提升就能自動解決。
換成企業的場景來看,室內設計公司可以先用 3D 生成工具做提案草案,快速讓客戶看見空間感;但半導體廠如果要用它模擬產線動線,就必須面對精度、安全、系統整合與現場責任問題。前者可以先試,後者不能只看展示效果。
因此,較穩健的判斷不是「空間智慧一定取代 LLM」,而是:它可能成為 LLM 之外的另一條重要路線,但落地速度、商業模式與可靠性,仍需要時間驗證。
05|這不是科技新聞,而是產業準備度問題
對讀者來說,李飛飛的觀點最有用之處,不是去追逐一個新名詞,而是重新檢查自己理解 AI 的方式是否太窄。
如果你是企業主管,過去一年可能已經開始要求同仁使用 ChatGPT、Copilot、Gemini 或 Claude,也可能已經導入客服機器人、會議摘要、內部知識庫與行銷文案工具。這些是必要的第一步,但不是 AI 的全部。
空間智慧提醒我們,下一階段的 AI 應用可能進入幾個更接近產業結構的場景。
製造業與自動化
製造業如果要把 AI 放進現場,不能只靠文字助理。真正困難的地方在於,AI 需要理解設備所在的位置、各作業站之間的動線、物料如何移動、機器手臂如何操作,以及現場發生異常時可能牽動哪些安全與流程問題。
建築、室內設計與工程
如果 AI 能從照片、平面圖、影片或文字生成可探索的 3D 場景,設計討論、客戶溝通、施工前模擬與教育訓練,都可能被重新安排。
這裡真正重要的,不只是 AI 能不能做出漂亮的渲染圖,而是它能不能更快產生一個可討論、可修改,也能進一步檢查與驗證的空間草案。
遊戲、XR 與數位內容
內容產業經常受到人力與製作成本限制。如果世界模型能降低 3D 場景的建立門檻,小型團隊就有機會用較低成本,先做出更完整的場景原型。
不過,能做出原型,不代表已經能直接商業化。最後能不能變成可發佈、可營運、可收費的內容,仍取決於美術品質、互動邏輯、版權風險,以及能否和既有製作工具順利整合
半導體與算力供應鏈
空間智慧、世界模型與模擬訓練如果逐漸形成新需求,也可能帶動圖形處理器、AI 晶片、邊緣運算、感測器與資料中心的長期需求。不過,這仍是根據投資人組成與應用方向延伸出的產業推論,還不能視為已經被驗證的新一波需求週期。
對供應鏈來說,這件事不只是模型公司的故事,也可能成為觀察下一波算力與硬體需求的重要線索。
行動框架|企業判斷空間智慧的五問檢查法
企業現在不需要急著追每一個 world model 新產品,但可以先用五個問題,判斷這類技術和自己的工作流程到底有沒有關係。
1. 我們的工作流程是否真的需要「空間理解」?
如果 AI 應用主要集中在文件、文字、客服、研究與程式碼,大型語言模型(LLM)可能已經足夠。
但如果流程涉及場地、動線、設備、物體位置、模擬訓練或視覺檢查,就應該開始追蹤空間智慧的發展。因為這類任務需要的不只是回答問題,而是理解空間、物件與動作之間的關係。
2. 我們需要的是展示圖,還是可驗證的工作場景?
行銷展示、遊戲概念、室內設計草案,可以容忍較高的創作彈性。這些場景中,3D 生成工具可以先用來加快發想與溝通。
但工廠、醫療、建築與機器人應用不能只看畫面是否漂亮。這些場景需要尺度、物理、碰撞、安全與可追溯性,因為一個空間判斷錯誤,可能影響的不只是設計修改,而是現場安全與責任問題。
3. 這項工具能否接進既有流程?
如果生成的 3D 世界不能匯出、不能修改,也不能進入 Unity、Unreal、CAD、BIM、模擬系統或企業既有工具,它就比較像創作玩具,而不是企業流程工具。
真正有價值的空間智慧工具,不只是產生一個場景,還能讓團隊把這個場景拿去討論、修改、測試,並接進原本的設計、訓練、開發或模擬流程。
4. 錯誤成本在哪裡?
空間模型如果把尺度看錯、物體位置判斷錯、動線推估錯,後果是多修一次設計圖,還是造成現場安全風險?
錯誤成本越高,企業越不能只看生成效果。對低風險場景來說,錯誤可能只是多花一點修改時間;但在製造、醫療、建築與機器人場景裡,錯誤可能牽動安全、責任與營運中斷。
5. 這是現在採購,還是先做技術觀察?
對多數企業來說,現在較適合採取「小規模原型測試」,而不是大規模導入。
可以先選一個低風險場景,例如展示空間、訓練教材、設計草案或數位內容原型,觀察工具是否真的縮短流程、降低溝通成本、提升原型品質,而不是只增加一個看起來新奇的新玩具。
總結|AI 下一步不只在語言,而在能否進入世界
李飛飛這個觀點真正有價值的地方,是把 AI 討論從「模型會不會回答」,推向「模型是否理解世界」。
大型語言模型已經讓 AI 進入知識工作,但空間智慧指向的是另一種能力:讓 AI 能理解場景、生成環境、支援模擬,甚至在未來進入機器人與實體工作流程。
這個觀點不該被過度解讀成「3D 世界生成已經成熟」,也不代表「機器人很快就會全面落地」。World Labs 的 World API 與 10 億美元募資,代表這條路線已被產品與資本市場重視,但它仍處在早期階段。從可探索的 3D 世界,到能可靠部署的實體 AI,中間還有工程、資料、安全與商業驗證要完成。
接下來值得觀察的,不是單一展示影片有多驚豔,而是這類 world models 能否真正進入工作流程:能否被設計師修改、被工程師驗證、被機器人模擬系統使用,或被企業納入低風險訓練場景。
對企業來說,現在可以帶回組織內部問一個問題:我們的 AI 策略是否仍停在文字生產,還是已經開始準備面對 3D、模擬與現場流程的下一階段?
文/ 睿客
FAQ:
Q1|李飛飛所說的「空間智慧」是什麼?
空間智慧是指 AI 對三維世界的感知、生成、推理與互動能力,不只是看懂圖片或生成 3D 畫面。
依據:李飛飛在〈From Words to Worlds〉中把空間智慧視為 AI 下一個前線,路透社也將其說明為讓 AI 推理三維世界如何運作的能力。
限制/邊界:目前空間智慧仍在早期產品化階段,不能等同於機器人已能在真實世界穩定工作。
意義/行動:企業可先檢查自己的 AI 應用是否涉及場地、動線、設備、模擬與視覺檢查,而不是只把 AI 當文字工具。
Q2|空間智慧和大型語言模型有什麼不同?
大型語言模型主要處理文字與抽象知識,空間智慧則關注 AI 是否能理解三維環境、物體關係、場景變化與互動可能性。
依據:李飛飛認為 LLM 已改變抽象知識工作,但仍缺乏與世界互動的基礎;World Labs 的 World API 則聚焦從文字、圖片與影片生成可探索的 3D 世界。
限制/邊界:這不是 LLM 與空間智慧二選一,未來更可能是文字、視覺、3D、動作與模擬能力的整合。
意義/行動:企業不必否定現有 LLM 投資,但應開始辨識哪些流程需要從文字 AI 延伸到視覺、3D 與現場資料。
Q3|World Labs 的 World API 代表空間智慧已經成熟了嗎?
World API 代表空間智慧開始進入可被開發者使用的產品階段,但不代表這項能力已全面成熟。
依據:World Labs 官方說明,World API 可從文字、圖片、全景照片、多視角輸入與影片生成可探索的 3D 世界,並可用於互動系統與模擬流程。
限制/邊界:從生成可探索場景到支援工程驗證、工廠部署或機器人控制,中間仍有資料、精度、安全與系統整合問題。
意義/行動:企業可先用低風險場景試做,例如展示空間、訓練教材、設計草案或遊戲原型,不宜直接放入高風險現場。
Q4|為什麼 World Labs 的 10 億美元募資重要?
這筆募資顯示資本市場開始把空間智慧與世界模型視為 LLM 之外的重要 AI 路線。
依據:路透社報導指出,World Labs 完成 10 億美元募資,投資人包括 AMD、輝達、Autodesk、Emerson Collective、Fidelity Management & Research Company 與 Sea。
限制/邊界:募資規模只能說明市場押注,不能證明技術成熟,也不能證明商業模式已被大規模驗證。
意義/行動:企業與供應鏈可把它視為長線觀察訊號,追蹤設計軟體、機器人模擬、3D 內容與算力需求是否形成新市場。
Q5|空間智慧對製造業有什麼意義?
空間智慧對製造業的意義,在於 AI 可能從文件與客服,進一步走向設備空間、工站動線、機器手臂、視覺檢查與模擬訓練。
依據:World Labs 官方把 World API 的應用方向連到機器人與模擬,路透社也指出空間智慧可與機器人、AR/VR 等場景相關。
限制/邊界:製造業場景要求高可靠性與安全性,不能只看 3D 生成效果,還要看精度、感測、控制、資料治理與責任分工。
意義/行動:製造業可以先從低風險模擬、教育訓練與流程溝通開始測試,而不是直接把空間模型用於產線控制。
Q6|企業現在該不該採購空間智慧工具?
多數企業現在較適合先做技術觀察與小規模原型測試,而不是急著大規模採購。
依據:World API 已展示可程式化生成 3D 世界的方向,但公開資料仍主要支持早期產品化與應用探索,尚不足以證明其可適用於所有企業工作流程。
限制/邊界:內容創作、設計草案與教育訓練可較早試用;醫療、工廠、建築施工與機器人控制等高風險場景,必須更謹慎。
意義/行動:企業可以用「是否需要空間理解、是否可驗證、是否能接進既有流程、錯誤成本多高」四個問題決定是否導入。
參考資料:
閱讀推薦:
精選解讀|零售 AI 正從雲端功能走向門市終端設備
精選解讀|代理型 AI 進入零售:亞太市場為何可能成為全球第一個「AI 代購」戰場
精選解讀|零售業把 AI 從儀表板推到對話界面後,真正改寫的是決策節點
精選解讀|Tesco 與 Mistral AI 簽三年生成式 AI 合作:共建 AI 實驗室,直攻零售顧客體驗與營運效率
新聞速讀|Zara 導入 AI 重整影像製作流程,讓零售日常運作悄然變形
精選解讀|日本大和證券攜手 Sakana AI 打造零售客戶專屬工具,金融+生成式 AI 實驗啟動
精選解讀|AI Agents 重塑消費產業:零售、旅遊、餐飲的數位競爭新賽局
AI 新聞速報|AI 造型師 Ella 上線,Vivrelle、Revolve、FWRD 正重塑零售導購新典範
Agentic AI 重塑零售顧客體驗:從動線模擬到智慧購物車
洞察觀點|AI 引爆零售業的下一步轉型:零售經營者該如何制定務實的 AI 策略
零售業者全面導入 Agentic AI, 打造智慧銷售與顧客體驗雙贏
版權聲明與授權須知
本內容由 InfoAI 擁有著作權。如有引用、轉載或任何商業用途的需求,請來信聯絡: contentpower688@gmail.com。
如果你覺得這篇解讀對你有幫助,歡迎訂閱 InfoAI 電子報,我們將持續為你精選 全球 AI 新聞與趨勢洞察,幫助你看懂新聞背後的真正意義。也別忘了加入透過[按鈕]加入 Line 社群 ,隨時掌握值得關注的 AI 發展與專業觀點。
AI 協作聲明:
本篇文章由 InfoAI 團隊策劃,並透過人工智慧工具協助資料整理與內容撰寫,最終內容由編輯進行人工審閱與優化。
JUDGEMENT
We help you make better judgement about AI.
不是更快知道 AI 新聞,而是更早做出你能承擔後果的判斷。
InfoAI 存在的目的
是把 AI 的變化,轉換成可被理解、可被評估、可被行動的判斷框架。


