2025 年上半年,WhatsApp 移除了 680 萬個與 AI 驅動詐騙相關的帳號。這個數字聽起來像是一場勝利——直到你看到同一時期全球金融詐騙損失估計達 4,420 億美元。移除速度永遠追不上生成速度,這就是 AI Agent 時代的防詐困境。

從 FraudGPT 到龍蝦武器化:犯罪 AI 三部曲

犯罪者利用 AI 的方式正在經歷三個階段的躍遷:

第一階段:灰產 GPT(2023-2024)。 FraudGPT 和 WormGPT 在 Telegram 地下頻道以月費 200 至 1,700 美元販售,可自動生成釣魚郵件和社交工程話術。門檻低,但功能侷限於文本生成,攻擊者仍需人工完成後續步驟。

第二階段:開源化擴散(2025)。 WormGPT 4 以租賃模式吸引超過 500 名訂閱者,KawaiiGPT 直接在 GitHub 上免費開源,5 分鐘即可部署。犯罪工具從「訂閱制商品」走向「開源化武器」,SpamGPT 等整合型釣魚工具包以約 5,000 美元在暗網流通。

第三階段:Agent 武器化(2026)。 OpenClaw 的出現改變了遊戲規則。這隻 2025 年 11 月問世的開源 AI Agent(全球約 19.4 萬名活躍使用者),不同於灰產 GPT 只能生成文字——它能直接操控電腦、存取檔案系統、發送網路請求,24 小時自主運行。犯罪者在它爆紅後 72 小時內就開始利用暴露的實例,將數萬個控制面板改造為殭屍網路、帳號接管工具和支付詐騙節點,影響橫跨 82 國。

0.0% 偵測率:為什麼傳統防禦全面失效

犯罪 AI 的進化速度已經超越了防禦端。幾組數據足以說明這場失衡:

Rutgers 大學的 ScamAgent 框架展示了 AI 如何完全自主執行詐騙——將惡意目標拆解為看似無害的子步驟,成功繞過 GPT-4 和 Claude 的安全護欄。現有的單輪式內容審核機制對這種漸進式、多輪對話的攻擊模式完全無效。

Ben Gurion 大學與墨爾本大學等機構的研究團隊(USENIX Security 2026)進行了一項為期一週的盲測實驗,結果令人不安:LLM 誘導受害者安裝 App 的順從率達 46%(人類操作員僅 18%),受試者將 70-80% 的訊息主動發給了 AI,形容它「體貼且容易交談」。同一研究還測試了 Google Perspective API、OpenAI Moderation API 和 Meta Llama Guard 3 這三大通用內容審核工具,發現它們對感情詐騙對話的真實偵測率為 0.0%——因為這類對話表面上只是友善的日常互動,完全不觸發現有的毒性與暴力內容過濾規則。換言之,通用內容審核已無法應對新型 AI 詐騙,偵測必須從「內容層」進化到理解長期對話脈絡與意圖的「語意層」。

Interpol 的報告進一步指出,Agentic AI 可自主完成從偵察到勒索的完整詐騙流程,一個犯罪者可同時運營 20+ 個行動。87% 的詐騙勞動是可自動化的重複對話——犯罪者只需將話術劇本交給 Agent,就能工業化地接觸受害者、分析數位足跡、經營長達 90 天以上的假關係。搭配僅需 10 秒語音即可生成的克隆語音和即時 Deepfake 視訊通話,整套殺豬盤流程幾乎不需要人工介入。

防禦方的窗口期正在關閉

Deloitte 預測 AI 驅動的詐騙將把美國詐騙損失從 2023 年的 120 億美元推升至 2027 年的 400 億美元。Experian 將「情感智能機器人」列為 2026 年首要威脅——不需要人類介入就能執行感情詐騙和親人求助詐騙,以精準的情緒操控建立信任。

傳統的規則式偵測和靜態簽章比對已經失效。資安機構正在推動新一代防禦策略:

  • 語意層檢測:理解 Agent 行為的「意圖」,而非只分析資料格式
  • 即時行為分析:區分授權操作與異常代理活動,在攻擊完成前攔截
  • 零信任 Agent 架構:預設不信任任何技能或擴展模組,逐一驗證
  • 供應鏈簽章驗證:為所有第三方技能建立可追溯的信任鏈

Microsoft 威脅情報團隊指出,犯罪者對 Agentic AI 的利用仍處於「實驗階段」,尚未達到規模化部署。這是防禦方最後的窗口期——在犯罪者完全掌握 AI Agent 的攻擊潛力之前,建立起新世代的語意安全防線。

詐騙集團不需要發明新技術,只需讓 AI 更有效率地執行早已存在的騙術——而通用審核工具至今仍對此無能為力。


資料來源:Interpol Global Financial Fraud Threat Assessment 2026、Deloitte Digital Fraud Report、Experian 2026 Future of Fraud Forecast、Rutgers University ScamAgent Research (2025)、"Love, Lies, and Language Models" Romance-Baiting Study (arXiv:2512.16280)、Security Boulevard OpenClaw Botnet Analysis、Microsoft Threat Intelligence AI Tradecraft Report 2026、AP News / BBC WhatsApp Account Removal Report、iThome WormGPT 4 與 KawaiiGPT 報導