Sakana AI 推出模仿人腦思考的新架構「連續思維機器」 開創AI推理能力新方向

· 精選解讀

InfoAI 全球AI新聞摘要與解讀

InfoAI全球AI新聞精選與解讀|
Sakana AI推CTM架構 打造模仿人腦思考的AI推理模型

日本人工智慧新創公司 Sakana AI 近日發表了一項名為「連續思維機器(Continuous Thought Machine,CTM)」的全新 AI 架構,目標是在模仿人類大腦的思考過程,提升 AI 模型的推理能力與可解釋性。

日本新創公司 Sakana AI 日前正式發表一項全新 AI 架構:「連續思維機器」(Continuous Thought Machine, 簡稱 CTM),目標是模仿人類大腦中「持續且有方向性的思考模式」,讓人工智慧模型能在更少的明確指示下,自主做出更合邏輯、更具目標感的推理判斷。

這套新架構由兩位在 AI 領域極具影響力的人物聯手主導——Transformer 架構共同作者 Llion Jones,以及前 Google Brain 團隊成員 David Ha。兩人共同於東京創立 Sakana AI,致力於以「自然啟發式設計」打造新一代更接近人類智能的 AI 系統。

CTM 的推出,不只是模型結構上的一次創新突破,更挑戰目前主流 AI 系統過度仰賴大量參數與資料訓練的限制,改以「少指導、多理解」為核心,邁向更貼近人類邏輯運作的思維方式。

CTM 架構核心:讓 AI 不只是輸入輸出,而是「持續思考」

傳統的 AI 模型(如 Transformer)運作方式大多屬於「靜態推論」——即模型僅根據輸入,在單一前向傳遞過程中產生輸出,缺乏長時間的「目標導向記憶」。而 CTM 所提出的創新點在於:

  1. 引入動態時間維度(Temporal Computation):模型內部可根據任務複雜度,決定推理要「花幾秒鐘想清楚」,而非固定層數。

  2. 神經元間的同步互動機制(Neural Coordination):模仿人腦中神經元協同激發的特性,不同單元可就同一目標動態調整計算策略。

  3. 循環與記憶模組(Iterative Reasoning):允許模型不斷根據回饋優化思考路徑,例如走迷宮或設計計畫時,具備「修正與調整」能力。

這樣的架構,讓模型在面對模糊、非結構化、甚至無明確指示的任務時,仍能維持高效邏輯與靈活回應,這正是目前大型語言模型(LLM)最難突破的障礙之一。

技術示範:迷宮導航、圖像注意力與抽象推理能力

在官方釋出的測試範例中,CTM 展現出多項人類式的推理行為:

  • 在迷宮任務中,CTM 可像人類一樣記住走過的路,並在錯誤時主動修正路徑,而非僅僅憑藉一次性運算。

  • 在圖像辨識任務中,模型模仿人眼的視覺聚焦策略,將注意力移動至重要區域,再綜合判斷內容,而非一次性掃描。

  • 在文字推理中,CTM 能針對含糊不清的任務指令,自主拆解子目標並逐步完成,例如:「規劃一個符合預算的環保旅遊方案」。

這些表現說明:CTM 不再只是對「資料」做出反應,而是在對「情境與目標」進行綜合理解與持續思考。

團隊背景:從 Transformer 創始者到自然智慧倡議者

Sakana AI 的團隊組成引起業界高度關注。兩位創辦人均來自 DeepMind、Google Brain 等頂尖 AI 實驗室,其中 Llion Jones 為 2017 年《Attention Is All You Need》論文的共同作者,正是 Transformer 架構的起點之一。

而 David Ha 則是將 AI 技術結合藝術與生物啟發模型的知名開拓者。其作品包含可生成藝術畫作的 AI 網絡、模擬生物學演化的神經系統模型等。他們共同的研究理念是:「向自然學習,而非單純疊加資料與計算量。

這種以「靈感來自生物系統」為核心的技術哲學,也體現在「Sakana」這個公司名稱上。Sakana 在日文中意指「魚」,象徵著群體協作、靈活適應、以及持續運動的特質——正是 CTM 想賦予 AI 系統的能力。

產業潛力與挑戰:CTM 的下一步將走向何方?

應用潛力:

  • 醫療診斷與影像分析:需多步驟推理與整合性判斷的任務,可望受惠 CTM 的持續邏輯特性。

  • 金融風險建模:面對非線性、多變因素的市場行為,CTM 有助於建構更精準的預測模型。

  • 自主機器人導航與策略調整:CTM 能即時修正決策,在變動環境中具備更高的適應力。

面臨挑戰:

  • 商業部署可行性:與現行大規模訓練的 Transformer 相比,CTM 尚缺乏產業端的標準化與工具鏈支持。

  • 硬體適配性:CTM 對計算動態性與記憶管理需求高,可能需新型 AI 硬體架構配合。

  • 模型訓練穩定性與成本:動態深度計算可能提高開發與維護門檻。

從理解語言到理解「思考本身」的AI躍進

CTM 的出現代表 AI 發展進入新階段——從模擬語言輸出走向模仿思考歷程。這不只是一次技術突破,更是對「人工智慧該怎麼學習」這一核心命題的重新詮釋。

在 ChatGPT、Gemini 等巨型語言模型主導市場的當下,CTM 提供了另一種路徑:讓 AI 不再只是「學會回答」,而是學會「如何持續思考」。

未來,若能克服運算與工程挑戰,CTM 或將成為下一波具備「可解釋性」、「任務自主性」與「生物智慧啟發」的新一代 AI 系統關鍵引擎。

參考資料:https://venturebeat.com/ai/sakana-introduces-new-ai-architecture-continuous-thought-machines-to-make-models-reason-with-less-guidance-like-human-brains/

broken image

提案成功:創業|募資|提案

www.Pitch.com.tw