LegoGPT免費開放!AI用文字幫你設計樂高

· 新聞摘要解讀

InfoAI 全球AI新聞摘要與解讀

InfoAI全球AI新聞精選與解讀|
LegoGPT 讓 AI 幫你設計樂高模型!卡內基美隆大學推出免費生成工具

來自美國卡內基美隆大學(Carnegie Mellon University, CMU)的研究團隊,近期公開了一款結合語言模型與3D幾何邏輯的創新工具——LegoGPT。這項技術能根據使用者輸入的自然語言描述,自動產出穩定且可實際搭建的樂高積木設計圖,並已於 GitHub 平台免費開放給公眾使用。

LegoGPT 的推出,象徵生成式 AI 正式跨入「實體建構」的應用領域,不再侷限於圖像、文字或語音等數位內容的生成,而是開始與實體物件、結構邏輯結合,為教育、娛樂、創客領域帶來嶄新可能。

用文字創造樂高世界:AI 模型背後的訓練邏輯

LegoGPT 是一種自回歸大型語言模型(autoregressive LLM),研究團隊從超過 47,000 組樂高結構資料中提取超過 28,000 個獨特的 3D 建築樣本,涵蓋日常家具、交通工具、樂器與場景等設計,做為訓練基礎。這些資料進一步被轉換為語言模型可以理解的序列格式,以便模型進行「下一塊積木預測」。

當使用者輸入像是「一艘海盜船」、「兩人座沙發」、「空間感十足的閱讀角落」這類語意描述,LegoGPT 會根據語義內容,自動轉譯成一個由下而上的積木構造提案,過程中會檢查每一塊積木的位置是否有效、是否與現有結構重疊、是否具備物理穩定性等條件。若設計結構不穩,系統還會自動回退至上一個穩定狀態重新生成。

最終產出的設計,不僅能讓人類用實體積木組裝,也可輸出給機器人進行自動化搭建。

結合圖像辨識與積木庫資源,自動搭配個人化建構方案

LegoGPT 不僅接受文字指令,還能與電腦視覺(CV)模型整合。研究團隊提出一個應用場景:使用者可拍攝家中現有的樂高積木,AI 透過影像辨識了解可用資源,再自動提出「量身打造」的建築提案,充分運用現有材料資源。

這樣的應用讓人聯想到「智慧積木助理」,未來甚至有可能被整合進樂高官方套件、3D 列印應用或創客教育平台中。

穩定性與設計品質的背後:資料處理與結構驗證

為使設計成果具備「實際可搭建」的品質,CMU 團隊開發了名為 StableText2Lego 的資料流程技術:

  1. 使用者輸入的文字會先轉換為 ShapeNetCore 資料庫中的 3D 模型網格

  2. 接著再放入 20×20×20 的體素網格(voxel grid)中決定初始積木布局

  3. 對模型進行變形與變異設計,但保留整體形狀

  4. 最後再排除不穩定的版本,只保留結構完整者,並使用 GPT-4o 生成多角度文字描述,完成整套設計資料。

此外,這些成果會搭配 24 種不同角度的渲染圖像與設計說明,提供人類或機器讀取與執行。

開放原始碼,社群應用潛力無限

目前 LegoGPT 的原始碼、訓練資料與模型已開放於 GitHub 上。研究團隊鼓勵開發者與創客社群擴充應用,未來可能出現具備互動功能的網頁應用、可自訂積木庫的手機 App、甚至開發出適合兒童操作的教育版本。

這種開放式創新的精神,不僅有助於科技教育的普及,也可能為樂高生態系注入新動能。

業界觀察:LegoGPT 預示的未來設計新范式

LegoGPT 的亮相,代表生成式 AI 正在朝「具備物理規則與結構邏輯」的應用演進,這對以下幾個領域可能產生深遠影響:

  • 教育科技(EdTech):可用於推動創造力與空間邏輯訓練,適合 K12 與創客教學。

  • 設計輔助工具(Design Assistant):讓建築、工業、產品設計師更快速生成初步提案或做概念探索。

  • 遊戲與互動內容產業:未來若結合 AR/VR,可創建沉浸式積木建構體驗,提升遊戲深度與個人化。

  • DIY 與 Maker 生態:結合 3D 列印或自造機器人,讓虛擬設計變為實體作品。

隨著 OpenAI、Meta 等大廠不斷探索 AI 與創意設計的結合,LegoGPT 提供了一個絕佳的範例,讓設計不再只是專業領域的專利,而是透過 AI 的介面,人人都能參與創造。

參考資料:https://www.tomshardware.com/tech-industry/artificial-intelligence/legogpt-creates-stable-lego-designs-using-ai-and-text-inputs-tool-now-available-to-the-public

broken image

提案成功:創業|募資|提案

www.Pitch.com.tw