OpenAI 近日承認,包括 ChatGPT Atlas 在內的現代 AI 瀏覽器工具仍易遭受通過隱藏惡意指令發起的攻擊。這一問題被稱為 「提示注入」,被業界視為 AI 代理系統在根本上難以克服的安全挑戰。攻擊者可將惡意指令嵌入電子郵件、文檔或網頁等看似正常的內容中,一旦 AI 代理在處理此類材料時將其納入任務流程,便可能在無意中執行攻擊者預設的操作。

專家普遍認為,要從技術上完全消除這類威脅幾乎不可行。AI 代理的設計允許其在瀏覽器中代表用戶執行操作,這一機制本身已極大擴展了潛在的攻擊界面。
為應對相關風險,OpenAI 已為 ChatGPT Atlas 瀏覽器發布更新,通過進一步優化模型訓練與增強安全機制,旨在提升代理對第三方隱藏指令的「免疫力」,使其更嚴格地遵循用戶明確下達的指令。

安全專家同時建議用戶採取以下措施,以降低使用 AI 代理時的潛在風險:
儘可能限制代理對重要賬戶的訪問權限,若非必要,建議在無需身份驗證的模式下運行任務;
在執行涉及財務交易或敏感數據操作前,仔細覆核代理請求並予以人工確認;
向代理髮出指令時應儘量具體,避免使用如「處理我的所有郵件」這類模糊表述,明確、有限的任務範圍更為安全。

應對提示注入被視為一場長期攻防,其過程類似於持續對抗網路欺詐。OpenAI 與行業其他參與者的策略立足於構建多層防禦體系、開展持續測試與快速疊代更新。其目標並非徹底「解決」問題,而是通過不斷提高攻擊者的實施成本與難度,從而將現實威脅控制在可接受的最低水平。






