全球AI新聞精選解讀
全球AI新聞精選解讀
email聯絡
  • 首頁
  • 關於InfoAI
  • 訂閱電子報
  • 加入 Line 群
  • 最新文章
  • 新聞速讀
  • 精選解讀
  • 深度報導
  • 落地應用
  • AI 知識
  • 提示詞
  • AI 工具
  • InfoAI Salon
  • …  
    • 首頁
    • 關於InfoAI
    • 訂閱電子報
    • 加入 Line 群
    • 最新文章
    • 新聞速讀
    • 精選解讀
    • 深度報導
    • 落地應用
    • AI 知識
    • 提示詞
    • AI 工具
    • InfoAI Salon
全球AI新聞精選解讀
全球AI新聞精選解讀
  • 首頁
  • 關於InfoAI
  • 訂閱電子報
  • 加入 Line 群
  • 最新文章
  • 新聞速讀
  • 精選解讀
  • 深度報導
  • 落地應用
  • AI 知識
  • 提示詞
  • AI 工具
  • InfoAI Salon
  • …  
    • 首頁
    • 關於InfoAI
    • 訂閱電子報
    • 加入 Line 群
    • 最新文章
    • 新聞速讀
    • 精選解讀
    • 深度報導
    • 落地應用
    • AI 知識
    • 提示詞
    • AI 工具
    • InfoAI Salon
email聯絡
全球AI新聞精選解讀

突破界限:Infini-attention機制讓語言模型擁抱無限長度的文本

 

 

InfoAI智能情報 { 新聞 }  

 

據外媒報導,Google最近對於Transformer做出一項重大改進,這能讓AI擁有近乎無限的記憶力和處理無窮無盡輸入的能力。這項研究的成果發表在一篇題為《Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention 》的論文中。

 

Section image

在這項研究中,Google引入了一種名為“Infini-attention(無限注意力)”的新技術。它讓基於Transformer的大型語言模型能夠高效處理任何長度的輸入,同時只需要有限的記憶體和算力資源。這種技術的核心在於對Transformer的注意力層進行了細微但關鍵的改進,使得現有的大型語言模型能夠自然地擴展,以處理無限長的上下文。

 

具體來說,Google的Infini-attention技術會保留標準注意力計算中的所有關鍵點、值和查詢狀態,並將過去的關鍵點和值狀態存儲在一個壓縮的記憶體中。這樣,當處理後續的序列時,可以使用注意力查詢狀態從記憶體中提取出所需的信息,再將長期記憶中提取的信息和局部上下文結合起來,計算最終的輸出。

 

這項技術的主要貢獻有:

  • Infini-attention讓現有語言模型能夠適應超長的上下文,只需簡單的持續預訓練和微調。

  • 模型在長上下文的語言建模任務中表現卓越,且記憶體使用率大幅減少。

  • Google使用1B參數的模型完成了長達100萬單詞的輸入任務,展示了強大的泛化能力。

  • 在一項500K長度的書籍摘要任務中,8B參數的模型取得了前所未有的性能。

 

此外,Google還採用了穩定的訓練技術,通過線性注意力機制來更新和檢索壓縮記憶體,並進一步提高了模型處理複雜語言建模任務的能力。

 

這項研究不僅提升了模型對長文本的理解和處理能力,也為未來的語言模型研究開闢了新的道路。

 

Infini-attention 機制讓 Transformer 語言模型能夠高效且強大地處理非常長的文本,而且不會讓記憶體或計算量過度增加。這種方法在處理特別長的文本時表現出了新的能力,也很適合用來調整現有的模型,使其能夠處理長輸入。實驗證明,和過去的方法相比,這種方法在效能、資料壓縮和適應不同長度輸入的能力方面都有顯著的優勢。總的來說,這項工作在提升處理長文本的語言模型的擴展性和有效性方面做出了重要的貢獻。

 

InfoAI,給你駕馭AI的知識和技能,成為AI時代的專家與達人。

 

Section image

InfoAI智能情報:AI知識新聞網站

www.InfoAI.com.tw 

 

 

上一篇
創新突破:BCG DEEP AI,為客戶管理設定新標準
下一篇
Apple的OpenELM計劃,顛覆我們對蘋果在AI發展上的認知。
 返回網站
Cookie的使用
我們使用cookie來改善瀏覽體驗、保證安全性和資料收集。一旦點擊接受,就表示你接受這些用於廣告和分析的cookie。你可以隨時更改你的cookie設定。 了解更多
全部接受
設定
全部拒絕
Cookie 設定
必要的Cookies
這些cookies支援安全性、網路管理和可訪問性等核心功能。這些cookies無法關閉。
分析性Cookies
這些cookies幫助我們更了解訪客與我們網站的互動情況,並幫助我們發現錯誤。
偏好的Cookies
這些cookies允許網站記住你的選擇,以提升功能性與個人化。
儲存