新聞速讀|GPT-5.2 引入 9 大產業 44 職類評測 強化職場交付

GDPval 直指真實成果物 企業驗收更有尺

· 新聞速讀,AI轉型
InfoAI 全球AI新聞摘要與解讀

InfoAI 編輯部

當 AI 的成績單改用「職場交付物」來評分,模型競爭就從會不會答題,變成能不能把工作做完。

GPT-5.2 把「可交付成果」拉進評測主軸,等於把 AI 的價值戰場直接搬到企業驗收現場。

01|理解事件

OpenAI 推出 GPT-5.2,並在 ChatGPT 端提供 Instant、Thinking、Pro 三種模式,主打在 試算表、簡報、寫程式、長文件理解、視覺圖表與軟體介面判讀、工具呼叫與多步驟專案等「知識工作」任務的效率與可靠度提升;此更新將先對付費方案逐步推送,且 GPT-5.1會在 ChatGPT 付費用戶的「舊版模型」保留約三個月後停止提供。

OpenAI 同步強調一個新評量:GDPval。它是以 9 大產業、44 種職類的真實工作任務來衡量模型表現,完整版本包含 1,320 項專業任務,交付物形式包含文件、投影片、圖表、試算表等;在公開成績中,OpenAI 表示 GPT-5.2 Thinking 在 GDPval「勝出或打平」達 70.9%,並宣稱在這些任務上可做到超過 11 倍速度、成本不到 1%(以過往指標估算)。

值得注意的是,GDPval 把「哪些工作型態最先被量化」直接點名(以下為 OpenAI 公開列出的 44 種職類,依產業分組):

不動產與租賃
禮賓服務人員、物業/不動產及社區管理經理、不動產銷售經紀人、不動產仲介、櫃檯與租賃事務人員。

政府
休閒活動指導員、合規性官員、警察與偵探第一線主管、行政服務經理、兒童/家庭及學校社工。

製造
機械工程師、工業工程師、採購與採購專員、貨運/收貨及庫存管理員、生產與作業人員第一線主管。

專業/科學及技術服務
軟體開發者、律師、會計師與稽核師、電腦與資訊系統經理、專案管理專家。

醫療保健與社會援助
註冊護理師、執業護理師、醫療與健康服務經理、辦公室與行政支援人員第一線主管、醫療祕書與行政助理。

金融與保險
客戶服務代表、金融與投資分析師、財務經理、個人財務顧問、證券/商品及金融服務銷售代理。

零售貿易
藥師、零售銷售人員第一線主管、總經理與營運經理、私人偵探與調查員。

批發貿易:銷售經理、訂單處理員、非零售銷售人員第一線主管、批發與製造銷售代表(不含科技產品)、批發與製造銷售代表(科技產品)。

資訊
音訊與視訊技術人員、製作人與導演、新聞分析師/記者及新聞從業人員、電影與影片剪輯師、編輯者。

在外部競爭與合作面,外媒指出 OpenAI 內部曾以「code red」加速推出以因應 Google 的 Gemini 3壓力;同日華特迪士尼宣布投資 10 億美元並允許 OpenAI 在 Sora 影片工具使用《星際大戰》、皮克斯、漫威等角色。

02|解讀新聞

這則新聞帶給我們的第一個意義是「驗收標準轉向」。GDPval 把 AI 拉回職場現場:不是比考試分數,而是比你能不能交出可用的簡報、試算表、流程文件,並讓人類接手能順利改到上線。當評量本身就長得像工作,企業導入就會更在乎「可交付」而不是「看起來很聰明」。

第二個意義是「算力分層變成產品語言」。Instant/Thinking/Pro 等於把速度、成本與推理深度直接商品化:簡單查詢用快的,多步驟交付用深的。對企業來說,下一步不是「要不要用 AI」,而是「哪些任務該用哪一層」,否則不是品質不穩,就是成本失控。

第三個意義是「內容與生態系在同步卡位」。一邊是與 Gemini 3 的節奏競爭,一邊是用迪士尼的投資與 IP 授權,讓生成式內容更容易走向可商用、可控管的路線;這類合作也會倒逼更明確的使用規則與防濫用設計。

03|延伸思考

我們可以從這篇新聞看到,AI 的核心運作邏輯正在從「生成一段答案」變成「完成一個流程」。一旦評測改以交付物為中心(像 GDPval 這種把 44 種職類攤開的做法),就等於在告訴市場:真正的門檻不只在模型多強,而在你能不能把工作拆成可委派、可審核、可回溯的步驟,並把人類的審核點嵌進流程裡。

更務實地說,讀者要判斷「升級是否有用」,可以抓三個檢核點:

第一,你的交付物格式是否固定(欄位、圖表、版型、審核規則),越固定越能吃到效益。

第二,你是否有能力把任務分流到不同模式,讓貴的推理用在最關鍵的段落。

第三,你是否能建立抽查與版本控管,避免把錯誤直接寫進正式文件。

對讀者來說,這代表:駕馭 AI 能力的分水嶺,不在提示詞,而在你是否具備設計與驗證工作流程的能力

04|重點提煉

  • GPT-5.2 於 2025 年 12 月 11 日推出,ChatGPT 提供 Instant/Thinking/Pro 三模式,先推送付費方案;GPT-5.1在 ChatGPT 端保留約三個月後停止提供。

  • GDPval 以 9 大產業、44 種職類衡量真實職場交付物,完整版本含 1,320 項專業任務,交付物涵蓋文件、投影片、圖表與試算表。

  • OpenAI 公開成績指出 GPT-5.2 Thinking 在 GDPval「勝出或打平」為 70.9%,並宣稱在任務輸出速度與成本上出現大幅差距。

  • 這次更新被放進競爭與合作脈絡:路透社提到內部加速因應 Gemini 3,華特迪士尼同日宣布 10 億美元投資並授權 Sora 使用多個知名角色。

05|後續觀察

接下來有兩件事值得我們觀察。

首先,企業端是否開始用類似 GDPval 的方式,把 AI 導入從「體感好用」改成「交付可驗收」,例如試算表建模、簡報產出、專案文件的抽查通過率與返工率。

其次,內容合作與防濫用規則會不會更明確:像迪士尼這類 IP 授權若形成範例,生成式內容可能更快走向「可商用但更受規範」的常態。

參考資料:

  • OpenAI says its new GPT 5.2 set a 'new state-of-the-art score' for professional knowledge work

  • OpenAI 官網: GPT-5.2 登場

  • OpenAI 官網:衡量模型在執行現實世界任務時的表現

  • OpenAI launches GPT-5.2 after 'code red' push to counter Google's Gemini 3

  • Disney to invest $1 billion in OpenAI, license characters for Sora video tool

AI 時代的思考力革命|AI 素養,不是學技術,而是拿回主導權的能力升級。與 AI 一起思考,成為能定義方向的人

版權聲明與授權須知

本內容由 InfoAI 擁有著作權。如有引用、轉載或任何商業用途的需求,請來信聯絡: contentpower688@gmail.com

用內容建立信任
用洞察塑造品牌

在 AI 時代,真正有力量的行銷不是廣告聲量,而是持續輸出的深度思考。InfoAI 把全球 AI 趨勢與報告,轉譯成清楚、精準、有觀點的內容,讓企業不只是跟上變化,而是成為洞察的提供者,讓品牌變成被信任的決策夥伴。如果你不想只是「談 AI」,而是想「透過 AI 影響市場與客戶」,那就從內容開始。歡迎來信: contentpower688@gmail.com

如果你覺得這篇解讀對你有幫助,歡迎訂閱 InfoAI 電子報,我們將持續為你精選 全球 AI 新聞與趨勢洞察,幫助你看懂新聞背後的真正意義。也別忘了加入透過[QRCode]/[按鈕]加入 Line 社群 ,隨時掌握值得關注的 AI 發展與專業觀點。

Section image

AI 協作聲明

本篇文章由 InfoAI 團隊策劃,並透過人工智慧工具協助資料整理與內容撰寫,最終內容由編輯進行人工審閱與優化。

Section image

InfoAI|讀懂 AI 如何改變世界

在 AI 改變世界之前
助你先讀懂 AI 世界

每日精選全球 AI 新聞
AI 趨勢 + 新聞 + 深度解讀

Section image

Content Power |賦能你在 AI 時代的專業能力
專注於「AI × 專業 × 工作方法」的知識平台
透過框架、流程與方法
協助你在 AI 時代重建專業能力