ChatGPT 點過CAPTCHA 「我不是機器人」 驗證引發關注
ChatGPT 點過CAPTCHA 「我不是機器人」 驗證引發關注

InfoAI全球AI新聞精選與解讀|OpenAI 測試揭示 AI 正跨入人類操作領域新邊界
當 OpenAI 正在測試一項尚未對外開放的瀏覽器代理功能時,一個令人驚訝的畫面被資安研究人員捕捉到了——ChatGPT 模型在無需外部提示或破解技巧的情況下,自行點擊並通過了「我不是機器人」的 reCAPTCHA 驗證。
網路安全研究員 Johann Rehberger 最近在 X(原 Twitter)上分享了一段影片,顯示 OpenAI 測試中的 ChatGPT 代理人(agent)如何在一個公開的 GitHub 測試頁面上,自行操作瀏覽器點擊「我不是機器人」的核取方框(reCAPTCHA checkbox),順利通過驗證後繼續完成搜尋任務。
影片顯示,AI 在無需額外指令或外掛的狀況下,能夠定位該元素並正確點擊,過程宛如一般使用者操作,並未顯現出任何機器行為的特徵。由於 CAPTCHA 的設計初衷就是為了阻止自動化工具執行任務,因此這段畫面格外引人矚目。
值得注意的是,ChatGPT 在這裡所使用的並非破解驗證碼的技術,而是透過一套內建的瀏覽器代理 API,以「觀察並模擬人類操作流程」的方式執行。這個原本是設計來阻擋機器人的安全機制,如今竟被 AI 模擬人類操作的方式輕鬆通過。這個事件不只是技術上的突破,更是一次對人類與 AI 操作界線的挑戰。
01|什麼是 OpenAI 的「Browser Agent」?它與你想像的 ChatGPT 不一樣
許多使用者熟悉的 ChatGPT,是一個聊天型文字助手,它擅長回答問題、撰寫文章、解釋概念。但 OpenAI 內部正在測試的「瀏覽器代理人」(browser agent),則是一種強調「行動力」的 AI。它不僅能理解任務,還能像人一樣操作使用者介面。
這個功能其實已於 2024 年底開始在部分 ChatGPT Enterprise 帳戶中針對開發人員開放測試。它的運作邏輯如下:
模擬使用者視角觀察網站內容
使用「目標導向」的任務規劃能力(Task Planning)
透過瀏覽器 API 執行具體操作:點擊、填表、送出、下載
OpenAI 提供的是一個 sandbox(沙盒)瀏覽環境,因此這些代理操作只在受控範圍內進行,不會直接影響使用者的瀏覽器。但未來若結合 API 串接或本機代理整合,將可能具備真實世界應用能力。
這類「agentic AI」不再只是被動等待使用者提問,而是能主動執行任務並持續反饋。
02|CAPTCHA 與機器人的對抗史:從辨識紅綠燈到行為分析
CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)自 2003 年由 CMU 團隊推出以來,已成為全球網站最普遍的防機器人手段。最早的版本要求使用者辨識扭曲文字,後來演進為圖像選擇題,例如選出圖中所有包含紅綠燈或巴士的格子。
Google 的 reCAPTCHA v2/v3 更進一步加入行為學習模型,例如:
滑鼠移動軌跡
點擊時間間隔
頁面停留時間
然而,這些行為模式本質上是可以模仿的。OpenAI 的代理人若具備「觀察 → 預測 → 模擬」能力,便能做出與真人相仿的操作。
這次的事件並非首次 AI 通過 CAPTCHA。早在 2023 年,Anthropic 的 Claude 就曾在模擬實驗中「請求真人協助通過 CAPTCHA」。但那仍是文字誘導,ChatGPT 則是真正自己動手。
03|產業影響:這不只是安全問題,而是自動化的新篇章
ChatGPT 成功操作 CAPTCHA,不只是對驗證技術的挑戰,更預示著 AI 工具正在朝向更廣泛的實體任務介面邁進。以下是幾個可能的產業影響層面:
資安防線需要重構
當 AI 能模擬人類互動時,傳統以「人機區分」為核心的驗證手段可能失效。Web 平台、論壇、API 登入機制都必須重新設計。
RPA 與 Agent 工具會全面升級
傳統 RPA(如 UiPath、Power Automate)雖能執行自動化操作,但不具備理解能力。OpenAI 這類代理 AI 將成為「有理解、有操作能力的執行單位」,效率與靈活度大幅提升。
使用者習慣將再一次轉變
過去我們靠 ChatGPT「寫東西」,未來將要求它「幫我做事情」。如:
「幫我比價這三個網站的房價」
「幫我查哪裡還有 X 演唱會票」
「幫我登記補助,附上我上週傳的個資」
這類複合指令一旦結合瀏覽器代理與記憶體模組,便能真正「解放雙手」。
04|AI 是否會濫用這項能力?風險邊界與規範討論迫在眉睫
當 AI 可以自動操控網頁,一些潛在風險也浮出水面:
帳號註冊泛濫:虛假帳號數量可能飆升,社群信任機制瓦解。
廣告點擊詐欺:廣告詐騙程式可自動操作畫面,提高點擊數。
線上投票干擾:輿論場域與民調系統容易遭操控。
隱私外洩:若操作過程中輸入個資或密碼,將造成資料風險。
目前 OpenAI 採取的預防措施包含:
限制瀏覽器代理功能僅供測試用戶使用
執行環境完全沙盒化,無法操作用戶本機系統
嚴格記錄每次操作歷程,供審計與回溯分析
但若未來這類工具由第三方改裝或模仿,風險將難以管控。
05|與台灣開發者與企業的關聯性分析
這項技術對於業界可能產生以下關鍵影響:
AI 導入企業工作流程的門檻大幅下降
中小企業無需布建複雜的 API,只要提供明確任務說明,AI 就能透過瀏覽器執行。例如會計部門可自動登入各大銀行網銀下載報表,或人資登入健保局網站查詢投保紀錄。國內金融與電商平台需重新設計驗證流程
目前許多台灣網站仍仰賴傳統 CAPTCHA 作為登入與註冊防線。這些流程若未強化行為模型驗證與設備識別,恐難防範 AI 操作。生成式 AI 開發者可考慮整合 agent 模型
從 LINE Bot、網站助理到企業內部知識管理工具,若能結合瀏覽器控制權限,應用層次將全面升級。例如:透過指令讓助理自動比對招標網站資料、填寫申請表格、或查詢某法規條文。
06|我們正站在「AI 可執行任務」的門檻前
過去幾年,生成式 AI 讓「會說話的機器人」成為日常,但這些模型還是被困在線上語言對話框裡。如今,ChatGPT 開始跨出那個框,試圖用「行動」來理解世界。
從文字生成到瀏覽器操作,是一個從「輸出語言」邁向「觸控世界」的飛躍。OpenAI 這項瀏覽器代理功能,可能是下一波商業應用爆發的關鍵樞紐。
07|接下來的三個觀察指標
OpenAI 是否將這項代理功能商品化?
目前僅供企業開發測試,但未來是否開放 API 供平台接入、是否會成為 ChatGPT Pro 的功能之一,是關鍵觀察點。
Google、Anthropic、Mistral 等是否跟進?
誰能提供最好用的 AI Agent,將在 SaaS 生態中搶占優勢。未來「讓 AI 幫你執行網頁任務」將如同自動填表、代購、快遞查詢一樣日常。
CAPTCHA 生態系是否會走向滅亡?
若主流網站都開始放棄使用 CAPTCHA,或引入生物辨識、設備憑證等方式,意味著一個網路時代的終結與另一個時代的開始。
08|結語:AI 助理不再只是對話,而是開始「幫你點、幫你找、幫你做」
ChatGPT 點過「我不是機器人」這個事件,乍看之下像是一則趣聞。但更深層的意涵是:AI 正從「語言智慧」走向「行動智慧」,它不只聽得懂人話,更逐步能模擬人的手腳,在虛擬世界中完成具體任務。
接下來的幾年,我們將見證 AI 從文書助手、客服機器人,演化為真正能「幫你上網做事」的數位夥伴。
你準備好把你的日常任務,交給一個「會點 CAPTCHA」的 AI 嗎?
參考資料:
https://arstechnica.com/information-technology/2025/07/openais-chatgpt-agent-casually-clicks-through-i-am-not-a-robot-verification-test
如果你也對全球最新的AI現況與趨勢有興趣,歡迎點擊[ 按鈕]訂閱InfoAI電子報,或是掃描[QRCode ]/點擊[ 按鈕]加入Line社群,隨時隨地獲得值得閱讀的全球AI新聞精選與解讀。

GPT‑5 推出進入倒數,推理與寫程式能力大幅躍進,Sam Altman 一句話揭開序幕
Tesla 首間超充餐廳正式開幕,24 小時營運、結合電影院與機器人服務,打造未來感用餐體驗
AI 重新打造《綠野仙蹤》:Google 與 Sphere 攜手推出沉浸式經典重現,揭示生成式技術的未來場景
從「工地用的 GPT」開始說起,建築現場迎來 AI 革命:Trunk Tools 獲 4000 萬美元投資,打造智慧工程代理人平台
洞察觀點|GPT-5 從對話工具進化為任務執行者,接下來你會用 AI 幫你完成什麼?
AI 新手必看:GPT、Claude 和 Gemini 模型選擇指南
提升生產力的秘訣,用 GPT 排序你的每日任務
如何用 AI 提升內容創作效率,讓你脫穎而出
OpenAI 推出 ChatGPT 多功能智慧代理:AI 開始幫你「做事」的時代來了
OpenAI AI瀏覽器計畫,挑戰Google Chrome的野心
你未來的工作方式,可能會被這場變革徹底改寫:OpenAI 正準備讓 ChatGPT 變成下一代的 Google Docs + Slack
Mattel × OpenAI:當 Barbie 有了 AI 大腦,你的玩具櫃迎來世代交
OpenAI推ChatGPT超級助理 挑戰Siri與Google Assistant
OpenAI推出語音影片互動功能 ChatGPT進化為AI助理
OpenAI升級Operator代理人,開啟AI進軍企業自動化新時代
OpenAI推ChatGPT-4o語音AI助理 挑戰Siri引爆智慧助理競賽
OpenAI 推出 ChatGPT PDF 匯出功能 強化企業應用場景與專業使用體驗
讓 ChatGPT 更懂你,OpenAI 記憶功能使用指南
AI素養的起點,是擁有世界的視野。
InfoAI為您打開一扇窗,每日博覽全球AI動態,將最新的資訊與洞見盡收眼底。
我們不只讓您『知道』,更讓您『看懂』,從廣博的見識中,淬鍊出屬於您的獨到眼光。
InfoAI 為您:
01|精選出最值得關注的新聞
02|解讀新聞洞察趨勢與啟發
03|從市場商機進行深度探索
提案成功研究院
助力創業成功,募資成功,提案成功。
Content Power
{ AI 世代的出版商 }
運用AI與知識庫
聰明創作好內容