ChatGPT 點過CAPTCHA 「我不是機器人」 驗證引發關注

· 精選解讀
InfoAI 全球AI新聞摘要與解讀

InfoAI全球AI新聞精選與解讀|OpenAI 測試揭示 AI 正跨入人類操作領域新邊界

當 OpenAI 正在測試一項尚未對外開放的瀏覽器代理功能時,一個令人驚訝的畫面被資安研究人員捕捉到了——ChatGPT 模型在無需外部提示或破解技巧的情況下,自行點擊並通過了「我不是機器人」的 reCAPTCHA 驗證。

網路安全研究員 Johann Rehberger 最近在 X(原 Twitter)上分享了一段影片,顯示 OpenAI 測試中的 ChatGPT 代理人(agent)如何在一個公開的 GitHub 測試頁面上,自行操作瀏覽器點擊「我不是機器人」的核取方框(reCAPTCHA checkbox),順利通過驗證後繼續完成搜尋任務。

影片顯示,AI 在無需額外指令或外掛的狀況下,能夠定位該元素並正確點擊,過程宛如一般使用者操作,並未顯現出任何機器行為的特徵。由於 CAPTCHA 的設計初衷就是為了阻止自動化工具執行任務,因此這段畫面格外引人矚目。

值得注意的是,ChatGPT 在這裡所使用的並非破解驗證碼的技術,而是透過一套內建的瀏覽器代理 API,以「觀察並模擬人類操作流程」的方式執行。這個原本是設計來阻擋機器人的安全機制,如今竟被 AI 模擬人類操作的方式輕鬆通過。這個事件不只是技術上的突破,更是一次對人類與 AI 操作界線的挑戰。

01|什麼是 OpenAI 的「Browser Agent」?它與你想像的 ChatGPT 不一樣

許多使用者熟悉的 ChatGPT,是一個聊天型文字助手,它擅長回答問題、撰寫文章、解釋概念。但 OpenAI 內部正在測試的「瀏覽器代理人」(browser agent),則是一種強調「行動力」的 AI。它不僅能理解任務,還能像人一樣操作使用者介面。

這個功能其實已於 2024 年底開始在部分 ChatGPT Enterprise 帳戶中針對開發人員開放測試。它的運作邏輯如下:

  • 模擬使用者視角觀察網站內容

  • 使用「目標導向」的任務規劃能力(Task Planning)

  • 透過瀏覽器 API 執行具體操作:點擊、填表、送出、下載

OpenAI 提供的是一個 sandbox(沙盒)瀏覽環境,因此這些代理操作只在受控範圍內進行,不會直接影響使用者的瀏覽器。但未來若結合 API 串接或本機代理整合,將可能具備真實世界應用能力。

這類「agentic AI」不再只是被動等待使用者提問,而是能主動執行任務並持續反饋。

02|CAPTCHA 與機器人的對抗史:從辨識紅綠燈到行為分析

CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)自 2003 年由 CMU 團隊推出以來,已成為全球網站最普遍的防機器人手段。最早的版本要求使用者辨識扭曲文字,後來演進為圖像選擇題,例如選出圖中所有包含紅綠燈或巴士的格子。

Google 的 reCAPTCHA v2/v3 更進一步加入行為學習模型,例如:

  • 滑鼠移動軌跡

  • 點擊時間間隔

  • 頁面停留時間

然而,這些行為模式本質上是可以模仿的。OpenAI 的代理人若具備「觀察 → 預測 → 模擬」能力,便能做出與真人相仿的操作。

這次的事件並非首次 AI 通過 CAPTCHA。早在 2023 年,Anthropic 的 Claude 就曾在模擬實驗中「請求真人協助通過 CAPTCHA」。但那仍是文字誘導,ChatGPT 則是真正自己動手。

03|產業影響:這不只是安全問題,而是自動化的新篇章

ChatGPT 成功操作 CAPTCHA,不只是對驗證技術的挑戰,更預示著 AI 工具正在朝向更廣泛的實體任務介面邁進。以下是幾個可能的產業影響層面:

資安防線需要重構

當 AI 能模擬人類互動時,傳統以「人機區分」為核心的驗證手段可能失效。Web 平台、論壇、API 登入機制都必須重新設計。

RPA 與 Agent 工具會全面升級

傳統 RPA(如 UiPath、Power Automate)雖能執行自動化操作,但不具備理解能力。OpenAI 這類代理 AI 將成為「有理解、有操作能力的執行單位」,效率與靈活度大幅提升。

使用者習慣將再一次轉變

過去我們靠 ChatGPT「寫東西」,未來將要求它「幫我做事情」。如:

「幫我比價這三個網站的房價」
我查哪裡還有 X 演唱會票」
我登記補助,附上我上週傳的個資」

這類複合指令一旦結合瀏覽器代理與記憶體模組,便能真正「解放雙手」。

04AI 是否會濫用這項能力?風險邊界與規範討論迫在眉睫

當 AI 可以自動操控網頁,一些潛在風險也浮出水面:

  • 帳號註冊泛濫:虛假帳號數量可能飆升,社群信任機制瓦解。

  • 廣告點擊詐欺:廣告詐騙程式可自動操作畫面,提高點擊數。

  • 線上投票干擾:輿論場域與民調系統容易遭操控。

  • 隱私外:若操作過程中輸入個資或密碼,將造成資料風險。

目前 OpenAI 採取的預防措施包含:

  • 限制瀏覽器代理功能僅供測試用戶使用

  • 執行環境完全沙盒化,無法操作用戶本機系統

  • 嚴格記錄每次操作歷程,供審計與回溯分析

  • 但若未來這類工具由第三方改裝或模仿,風險將難以管控。

05|台灣開發者與企業的關聯性分析

這項技術對於業界可能產生以下關鍵影響:

  1. AI 導入企業工作流程的門檻大幅下降
    中小企業無需布建複雜的 API,只要提供明確任務說明,AI 就能透過瀏覽器執行。例如會計部門可自動登入各大銀行網銀下載報表,或人資登入健保局網站查詢投保紀錄。

  2. 國內金融與電商平台需重新設計驗證流程
    目前許多台灣網站仍仰賴傳統 CAPTCHA 作為登入與註冊防線。這些流程若未強化行為模型驗證與設備識別,恐難防範 AI 操作。

  3. 生成式 AI 開發者可考慮整合 agent 模型
    從 LINE Bot、網站助理到企業內部知識管理工具,若能結合瀏覽器控制權限,應用層次將全面升級。例如:透過指令讓助理自動比對招標網站資料、填寫申請表格、或查詢某法規條文。

06|我正站在「AI 可執行任務」的門檻前

過去幾年,生成式 AI 讓「會說話的機器人」成為日常,但這些模型還是被困在線上語言對話框裡。如今,ChatGPT 開始跨出那個框,試圖用「行動」來理解世界。

從文字生成到瀏覽器操作,是一個從「輸出語言」邁向「觸控世界」的飛躍。OpenAI 這項瀏覽器代理功能,可能是下一波商業應用爆發的關鍵樞紐。

07|接下的三個觀察指標

OpenAI 是否將這項代理功能商品化?
目前僅供企
開發測試,但未來是否開放 API 供平台接入、是否會成為 ChatGPT Pro 的功能之一,是關鍵觀察點。

Google、Anthropic、Mistral 等是否跟進?
誰能提供最
用的 AI Agent,將在 SaaS 生態中搶占優勢。未來「讓 AI 幫你執行網頁任務」將如同自動填表、代購、快遞查詢一樣日常。

CAPTCHA 生態系是否會走向滅亡?
若主流網站
開始放棄使用 CAPTCHA,或引入生物辨識、設備憑證等方式,意味著一個網路時代的終結與另一個時代的開始。

08|結語:AI 理不再只是對話,而是開始「幫你點、幫你找、幫你做」

ChatGPT 點過「我不是機器人」這個事件,乍看之下像是一則趣聞。但更深層的意涵是:AI 正從「語言智慧」走向「行動智慧」,它不只聽得懂人話,更逐步能模擬人的手腳,在虛擬世界中完成具體任務。

接下來的幾年,我們將見證 AI 從文書助手、客服機器人,演化為真正能「幫你上網做事」的數位夥伴。

你準備好把你的日常任務,交給一個「會點 CAPTCHA」的 AI 嗎?

參考資料:

https://arstechnica.com/information-technology/2025/07/openais-chatgpt-agent-casually-clicks-through-i-am-not-a-robot-verification-test

如果你也對全球最新的AI現況與趨勢有興趣,歡迎點擊[ 按鈕]訂閱InfoAI電子報,或是掃描[QRCode ]/點擊[ 按鈕]加入Line社群,隨時隨地獲得值得閱讀的全球AI新聞精選與解讀

broken image

broken image

AI素養的起點,是擁有世界的視野。
InfoAI為您打開一扇窗,每日博覽全球AI動態,將最新的資訊與洞見盡收眼底。
我們不只讓您『知道』,更讓您『看懂』,從廣博的見識中,淬鍊出屬於您的獨到眼光。

InfoAI 為您:

01|精選出最值得關注的新聞

02|解讀新聞洞察趨勢與啟發

03|從市場商機進行深度探索

broken image

提案成功研究院

助力創業成功,募資成功,提案成功。

broken image

Content Power

{ AI 世代的出版商 }

運用AI與知識庫

聰明創作好內容