生成式 AI 赋能下大规模网络钓鱼攻击与防御技术研究
摘要本文以 2026 年谷歌起诉 Outsider Enterprise 网络犯罪团伙滥用 Gemini AI 实施大规模钓鱼攻击事件为核心研究样本结合该团伙搭建钓鱼即服务PhaaS平台、批量生成仿冒网站、推送海量诈骗短信等行为数据剖析生成式 AI 被黑灰产武器化后网络钓鱼攻击在生产效率、仿真程度、传播规模、产业化运营等维度的全新特征。梳理当前终端防护、流量检测、内容审计、短信风控等传统安全体系面对 AI 驱动钓鱼攻击的技术短板结合攻击链路设计基于流量特征、页面代码识别、文本语义分析、批量短信风控的多模块检测方案配套完整 Python 代码实现核心检测逻辑。反网络钓鱼技术专家芦笛强调生成式 AI 大幅降低了网络钓鱼的技术门槛与运营成本传统单点式防御已无法应对规模化 AI 钓鱼攻击必须构建 “技术检测 渠道管控 法律规制 用户宣教” 的全域闭环防御体系。本文结合该案件暴露的攻击模式区分移动端、PC 端、通信运营商、企业网络四大场景制定分层防御策略分析技术对抗、行业监管、跨境治理的实施路径相关研究成果可为防范 AI 赋能网络钓鱼、完善网络安全防护体系、推进网络黑灰产治理提供实证依据与技术参考。1引言生成式人工智能技术的快速普及重塑了网络应用生态在赋能产业数字化转型的同时也被网络犯罪团伙利用成为实施网络诈骗、信息窃取的新型工具。网络钓鱼作为历史悠久、危害面极广的网络威胁依托生成式 AI 完成了从人工制作、小规模散发到自动化生产、产业化运营、全域化传播的全面升级攻击的隐蔽性、欺骗性与爆发规模达到全新高度。2026 年 6 月谷歌正式向美国纽约联邦法院提起诉讼起诉名为 Outsider Enterprise 的网络犯罪团伙滥用谷歌 Gemini 大模型搭建规模化钓鱼体系这也是谷歌首次针对自有 AI 模型被恶意用于网络钓鱼犯罪发起专项法律诉讼该案件完整呈现了当前 AI 赋能钓鱼攻击的典型运作模式、组织架构与危害规模具备极强的行业研究价值。根据案件披露数据Outsider Enterprise 依托 Telegram 社群运营钓鱼即服务平台对外售卖标准化钓鱼工具包收费标准为每周 88 美元、每月 200 美元无编程基础的使用者也可借助平台指引调用 Gemini AI 快速生成仿冒网站代码、诈骗文案与短信模板。该团伙累计搭建超 9000 个虚假网站、生成逾 100 万个恶意 URL在截至 2026 年 6 月 1 日的两周时间内向安卓用户推送 250 万条附带钓鱼链接的诈骗短信同期安卓用户标记的可疑短信数量达到 5.5 万条平均每分钟产生两条以上举报记录。美国联邦调查局FBI调查数据显示自 2023 年 7 月起该犯罪集团已在全球数十个国家窃取 387 万条信用卡信息造成的直接经济损失高达 19 亿美元受害群体覆盖普通网民、金融用户、跨境电商从业者等各类网络使用者。从攻击形式来看该团伙的诈骗内容主要伪装成未缴通行费、快递延误、积分过期、账户异常等生活化场景虚假网站仿冒谷歌、YouTube、美国邮政局、交通收费系统等公信力较强的品牌与机构借助 Gemini AI 生成网页代码、文案内容页面视觉效果、文本逻辑与正规站点高度趋同依靠人工肉眼识别的难度显著提升。攻击渠道也形成了 “短信引流 虚假网站窃取数据” 的固定链路移动通信网络、互联网网页形成联动单一维度的安全防护手段难以形成有效拦截。当前全球网络安全行业对于 AI 驱动的网络钓鱼攻击仍处于被动应对阶段。传统反钓鱼技术依赖静态特征库、关键词匹配、域名黑名单开展检测面对 AI 自动迭代的网页代码、随机化诈骗文案、批量新生恶意域名漏检率持续攀升移动通信运营商的短信风控系统难以区分 AI 生成的正常文本与诈骗文本终端安全软件缺乏针对 AI 仿冒页面的专项识别能力。与此同时AI 工具的公开化、易用化使得钓鱼攻击不再依赖专业黑客技术黑灰产产业化分工愈发明确攻击成本持续下降威胁呈现常态化、全球化扩散态势。基于上述背景本文以谷歌诉 Outsider Enterprise AI 钓鱼案为核心切入点系统拆解 AI 赋能大规模网络钓鱼攻击的运作流程、技术手段与产业化模式量化分析攻击造成的安全危害。结合攻击全链路梳理传统防护技术的缺陷设计多维度、可落地的检测技术方案并完成代码实现搭建适配 AI 钓鱼攻击的全域防御体系同时探讨技术对抗、行业监管、跨境执法、法律完善等多元治理路径。全文以案件实证数据为基础客观分析攻防现状不夸大威胁也不弱化防御难点研究内容聚焦技术、运营、治理三大维度形成完整论证闭环旨在为全球网络安全从业者应对生成式 AI 滥用、打击 AI 驱动网络钓鱼犯罪提供实践参考。2AI 赋能大规模网络钓鱼攻击的运作模式与态势分析本节结合谷歌诉讼材料、FBI 调查数据以及第三方安全机构披露的信息从犯罪组织架构、Gemini AI 的具体应用场景、攻击链路、传播规模、危害特征五个方面全面解析 Outsider Enterprise 团伙的运作模式总结生成式 AI 驱动下网络钓鱼攻击的共性趋势。2.1犯罪组织架构与 PhaaS 平台运营模式Outsider Enterprise 属于典型的产业化网络犯罪团伙核心运营阵地为 Telegram 社交平台采用平台运营 会员订阅 技术赋能的钓鱼即服务PhaaS商业模式完成了钓鱼攻击的标准化、产品化运营这也是 AI 能够实现攻击规模化扩张的组织基础。该团伙内部分工清晰分为核心运维组、技术适配组、客服组、渠道分销组四大模块。核心运维组负责搭建整体平台架构、维护服务器、管理域名池与 URL 资源技术适配组专门研究 Gemini AI 的调用方式编写提示词模板优化 AI 生成网页、文案的效果同时更新近 300 套钓鱼模板覆盖主流品牌、政府机构、金融服务等仿冒场景客服组在 Telegram 社群内解答订阅用户的操作问题提供使用教程降低使用门槛渠道分销组负责面向全球黑灰产推广钓鱼工具包拓展付费会员。在商业运营层面平台采用分级订阅制度用户支付对应费用后即可获得全套钓鱼资源与使用权限。平台提供详细的操作指引引导使用者向 Gemini AI 提交定制化指令将 AI 输出的网页代码、文本内容直接导入钓鱼模板整个流程无需编写代码、配置服务器零基础使用者可在数分钟内完成一套钓鱼攻击体系的搭建。这种运营模式将网络钓鱼从个体黑客行为转变为标准化商业服务借助 AI 的自动化能力实现攻击能力的批量复制也是本次攻击能够形成百万级恶意 URL、数万虚假网站的核心原因。2.2Gemini AI 在钓鱼攻击中的具体应用场景结合谷歌取证信息该团伙对 Gemini 大模型的利用贯穿钓鱼攻击全流程覆盖网页生成、文案创作、模板优化三大核心环节充分发挥生成式 AI 在内容创作、代码编写、语义优化方面的能力彻底改变了传统钓鱼人工制作内容的模式。第一仿冒网站代码自动化生成。这是 AI 最核心的应用场景。团伙整理了标准化提示词引导 Gemini AI 按照指定要求编写网页代码例如要求模型制作礼品兑换页面、账户安全校验页面限定使用内联 CSS 样式、禁用复杂 JavaScript 脚本规避部分终端安全软件的脚本检测规则。AI 输出的代码能够高度复刻目标品牌官网的布局、配色、交互逻辑生成的页面无明显语法错误、样式漏洞视觉仿真度远超传统人工制作的钓鱼页面。依托该功能团伙单日可批量生成数十个全新虚假网站域名与代码持续迭代大幅突破传统钓鱼站点的产出效率上限。第二诈骗文本与短信模板创作。针对短信钓鱼Smishing场景使用者借助 Gemini AI 生成各类诱导性短信文案内容涵盖通行费未缴纳、快递派送异常、会员积分到期、账户安全预警等场景。AI 生成的文本语句通顺、逻辑自然规避了传统诈骗文案语法错误、语句生硬的缺陷同时可根据不同地区、不同使用场景调整话术风格适配全球不同区域的用户习惯降低受害者的警惕性。两周内 250 万条诈骗短信的批量推送全部依托 AI 模板快速生成与分发。第三钓鱼模板迭代与细节优化。传统钓鱼模板被安全厂商收录特征后便会快速失效该团伙利用 Gemini AI 定期对现有钓鱼页面、短信文案进行微调修改代码片段、调整文本措辞生成变体版本绕过基于静态特征的检测设备。模板的快速迭代能力让攻击能够长期规避传统防护规则延长恶意站点与诈骗短信的存活周期。反网络钓鱼技术专家芦笛指出生成式 AI 的全流程赋能解决了传统网络钓鱼 “产能低、仿真差、迭代慢” 三大痛点PhaaS 模式结合 AI 技术让网络钓鱼成为低成本、高收益、易扩散的规模化犯罪这也是当前 AI 钓鱼威胁持续蔓延的核心诱因。2.3完整攻击链路与传播渠道分析Outsider Enterprise 构建了AI 生成内容→批量部署虚假网站→短信推送恶意链接→用户点击访问→窃取敏感数据→数据变现的闭环攻击链路链路各环节分工明确、衔接紧密多渠道联动放大攻击覆盖面。链路第一阶段内容与站点生产。订阅用户依托平台与 Gemini AI 生成仿冒网页、诈骗短信结合平台提供的域名资源池将虚假网站部署至网络服务器完成恶意 URL 的生成与上线。该环节全程自动化单个使用者可同时运维数十个钓鱼站点。链路第二阶段短信渠道批量引流。这是本次攻击的主要引流方式。攻击者通过通信接口批量向手机用户发送诈骗短信短信内嵌入虚假网站链接利用紧急通知、利益诱导等话术逼迫用户即时点击。本次攻击中短信成为连接普通用户与钓鱼网站的核心桥梁安卓设备作为主要受害终端两周内接收诈骗短信数量达到 250 万条。链路第三阶段页面诱导与数据窃取。用户点击短信内链接后跳转至 AI 生成的仿冒网站页面模仿正规平台的登录、信息核验流程诱导用户输入账号、密码、银行卡号、信用卡验证码等敏感金融信息。后台程序自动抓取用户提交的数据并回传至犯罪团伙服务器。链路第四阶段数据变现与二次传播。团伙将窃取的信用卡信息、账号数据在黑灰产平台售卖获取非法收益同时根据防护规则变化利用 AI 持续更新模板启用新域名与新 URL开展新一轮攻击形成循环攻击模式。从传播渠道来看本次攻击以移动通信短信为核心引流渠道网页为数据窃取载体二者深度绑定。相较于传统邮件钓鱼短信触达率更高、用户点击意愿更强尤其针对移动端用户防护盲区更多这也让短信 网页的组合成为当前 AI 钓鱼攻击的主流链路。2.4攻击规模与安全危害量化分析结合谷歌、FBI 披露的权威数据可从站点数量、传播量级、受害范围、经济损失四个维度量化本次攻击的危害规模直观体现 AI 赋能后钓鱼攻击的破坏力。在恶意载体数量方面截至 2026 年 6 月该团伙累计搭建9000 余个虚假钓鱼网站生成恶意 URL 总量超 100 万个2025 年 11 月至 2026 年 4 月期间恶意 URL 新增数量达到 159 万个域名与站点的批量产出能力极强。海量的恶意域名与 URL 使得传统域名黑名单、URL 过滤体系完全失效安全厂商无法实现全覆盖收录。在信息传播层面攻击集中爆发的两周内向安卓用户推送诈骗短信 250 万条安卓用户主动标记的可疑短信达 5.5 万条举报频次平均每分钟 2 条以上可见诈骗短信的覆盖范围极广用户触达效率极高。在受害群体与数据泄露方面自 2023 年 7 月至案发攻击波及全球数十个国家累计窃取 387 万条信用卡数据海量金融数据泄露不仅直接侵害个人财产安全还会引发后续盗刷、精准诈骗等次生犯罪。在经济损失层面FBI 统计的直接经济损失达到 19 亿美元损失主体包括普通个人、金融机构、电商平台等。除直接财产损失外大规模钓鱼攻击还会破坏网络空间信任体系影响用户对正规互联网品牌、通信服务、政务平台的信任产生长期的隐性危害。2.5AI 驱动网络钓鱼攻击的共性趋势总结结合本次案件与全球同类安全事件可总结出当前生成式 AI 赋能网络钓鱼的四大共性趋势也是后续防御工作需要重点应对的方向。第一攻击产业化、服务化成为主流。PhaaS 平台结合 AI 工具实现 “一站式钓鱼服务”犯罪门槛持续下沉攻击者群体从专业黑客转向无技术基础的普通黑灰产人员。第二内容高仿真、无固定特征。AI 生成的代码、文本不存在统一关键词、固定代码片段传统静态特征匹配检测规则失效。第三传播渠道向移动端倾斜。短信、即时通讯软件成为主要引流渠道移动端防护短板凸显。第四攻击迭代速度大幅提升。AI 可快速生成内容变体恶意站点、诈骗文本持续更新防御方始终处于被动追赶状态。3传统防护体系面对 AI 钓鱼攻击的技术短板针对 Outsider Enterprise 团伙的攻击链路本节按照短信风控、域名与 URL 过滤、网页内容检测、终端安全防护、法律与监管五个维度逐一分析现有防护技术、管理机制的工作原理与固有缺陷解释传统体系难以抵御 AI 赋能大规模钓鱼攻击的底层原因。3.1移动通信短信风控技术短板手机短信是本次攻击的核心引流渠道国内及全球主流运营商普遍采用关键词过滤、号码黑名单、发送频次限制三大技术开展短信风控。关键词过滤是最常用的手段通过设置 “账户冻结”“积分过期”“银行卡异常” 等敏感词汇库拦截包含对应关键词的短信。但 AI 生成的诈骗文本具备语义随机化、措辞多样化的特点攻击者可借助 AI 不断替换词汇、改写句式规避关键词匹配。同一类诈骗场景AI 可生成上百种不同表述的文本关键词库无法做到实时全覆盖更新。号码黑名单机制针对高频发送诈骗短信的号码进行封禁但本次攻击中攻击者采用动态号段、虚拟号码、境外中继号码批量发送短信号码池规模庞大且持续轮换封禁单个号码无法遏制整体攻击。同时部分攻击者利用正规企业短信通道发送诈骗信息号码本身具备合法资质号码黑名单完全失效。发送频次限制主要针对单号码短时间内海量发短信的行为进行管控而该团伙采用分布式多号码集群发送将 250 万条短信拆分至数万号码中单号码发送量处于风控阈值以内频次限制规则被轻松绕过。综合来看传统短信风控体系对 AI 生成的多样化诈骗文本、分布式群发攻击抵御能力薄弱。3.2域名与 URL 过滤技术短板域名黑名单、URL 静态过滤是互联网行业应用数十年的反钓鱼基础技术核心逻辑为安全厂商收集已知恶意域名、恶意 URL 并录入数据库终端、网关设备访问链接时进行字符串匹配拦截。结合本次案件数据该团伙生成超百万个恶意 URL、9000 余个虚假网站且持续批量注册新域名、生成新 URL。安全厂商对恶意域名的抓取、核验、入库存在明显时间差新生恶意链接在数天甚至数周内不会被收录形成长期防护真空。同时攻击者利用 AI 微调页面内容后对原有 URL 进行简单改造生成变体链接进一步扩大恶意链接规模。域名与 URL 过滤属于典型的 “事后防御”只能拦截已曝光的存量攻击面对 AI 批量生成的增量恶意链接完全力不从心。此外攻击者还会使用形近字域名、多级子域名仿冒正规品牌传统字符串匹配无法识别此类变体域名。3.3网页内容静态检测技术短板主流终端安全软件、浏览器防护插件采用页面关键词、静态代码特征、脚本检测方式识别钓鱼页面该技术在传统人工钓鱼场景下具备一定效果但面对 Gemini AI 生成的网页全面失效。其一代码特征失效。AI 生成的网页代码会根据提示词动态调整结构、标签顺序、样式参数不存在固定的代码片段传统代码特征库无法完成匹配。同时攻击者按照要求禁用复杂脚本规避脚本查杀规则进一步降低被检测概率。其二文本关键词失效。AI 生成的页面提示文本、登录引导文本措辞灵活多变不局限于固定敏感词汇页面内容关键词检测难以区分正规页面与钓鱼页面。其三视觉特征识别难度提升。AI 复刻的页面布局、样式与正规站点高度一致基于简单截图比对的视觉检测工具误检、漏检率大幅上升。整体而言依托静态内容特征的网页检测技术无法适配 AI 动态生成的高仿真钓鱼页面。3.4终端安全防护技术短板PC 端、移动端终端安全软件是面向用户的最后一道防线现有终端防护主要包含网页防护、下载防护、本地病毒查杀三大模块针对本次 AI 钓鱼攻击存在多重短板。移动端终端安全软件权限受限无法深度拦截系统级短信仅能做到事后提醒无法在短信送达用户前完成拦截针对网页访问移动端浏览器防护插件轻量化设计仅搭载基础域名黑名单缺乏复杂的行为分析能力。PC 端安全软件虽然功能完善但多数用户不会开启全量网页检测功能且对于 AI 高仿真页面的识别能力不足。同时本次攻击全程依托网页完成数据窃取无病毒、木马等恶意程序参与终端杀毒软件的病毒查杀模块完全没有检测目标。此外传统终端防护以单点防护为主设备之间无法共享威胁数据一台终端识别的恶意 URL、诈骗号码无法同步至同一网络内的其他设备面对批量扩散的攻击威胁联动处置能力缺失。3.5行业监管与跨境法律治理短板除技术层面外监管与法律体系的短板也是 AI 钓鱼攻击能够全球化蔓延的重要原因。第一AI 模型使用规范缺失。当前多数生成式 AI 平台的使用规则难以全面管控用户行为无法实时识别使用者调用 AI 制作钓鱼页面、诈骗文案的恶意诉求AI 滥用的事前管控不足。第二跨境网络犯罪执法难度大。本次攻击受害群体分布在数十个国家犯罪团伙运营、服务器部署、数据存储分属不同地区不同国家网络安全法律、执法标准存在差异跨境溯源、证据调取、嫌犯抓捕流程复杂犯罪成本偏低。第三PhaaS 平台监管缺位。Telegram 等境外社交平台成为黑灰产运营阵地平台缺乏有效的内容审核与违规群组封禁机制钓鱼服务得以公开售卖。反网络钓鱼技术专家芦笛强调AI 驱动的大规模网络钓鱼是技术、产业、法律多重因素叠加形成的复合型威胁仅依靠单一安全技术无法实现有效防控必须同步优化技术防御、行业监管、法律规制三大体系。4面向 AI 钓鱼攻击的多维度检测技术与代码实现针对传统防护体系的短板本节结合本次攻击的全链路特征设计短信文本语义检测、域名多维研判、AI 仿冒网页识别、批量访问行为分析四大检测模块基于 Python 语言编写完整可运行代码所有代码聚焦 AI 钓鱼的核心特征不依赖静态特征库采用语义分析、行为研判、相似度计算等动态检测逻辑适配 AI 内容动态迭代的特点可部署于运营商风控平台、网络网关、终端安全软件等不同场景。4.1整体检测架构设计结合 “短信引流 网页窃取” 的攻击链路搭建链路化分层检测架构按照攻击传播顺序分为四层模块逐层拦截恶意行为各模块数据互通形成检测闭环。第一层短信文本语义检测模块。部署于运营商短信风控节点识别 AI 生成的诈骗文本在短信送达用户前完成拦截第二层域名与 URL 多维研判模块。部署于网络出口网关检测批量新生域名、仿冒品牌域名拦截恶意 URL 访问第三层AI 仿冒网页检测模块。部署于浏览器、终端安全软件分析页面代码结构、文本语义、表单行为识别 AI 制作的钓鱼页面第四层批量行为分析模块。部署于云端威胁平台监测短时间内同一 URL、同一站点被海量 IP 访问的异常行为识别 PhaaS 驱动的批量攻击。四大模块相互协同从传播入口、访问链路、页面内容、全局行为四个维度实现全链路检测规避单一模块的检测盲区。4.2第一层AI 诈骗短信语义检测代码实现4.2.1 技术原理针对 AI 生成诈骗文本措辞灵活、无固定关键词的特点本模块放弃传统关键词匹配采用文本语义相似度 场景特征分类的检测逻辑。以正规服务通知文本为基准计算待测短信与诈骗场景模板的语义相似度同时识别紧急诱导、利益胁迫等诈骗典型语境区分正常通知与 AI 诈骗短信。模块适配运营商海量短信并发检测场景运算轻量化。4.2.2 完整代码示例# AI诈骗短信语义检测模块部署于运营商短信风控系统# 依赖库scikit-learn、jieba、sentence-transformers# 安装命令pip install scikit-learn jieba sentence-transformersimport jiebafrom sentence_transformers import SentenceTransformer, util# 加载轻量级语义模型适配高并发场景model SentenceTransformer(all-MiniLM-L6-v2)# 配置样本库正常通知文本 典型AI诈骗场景文本NORMAL_TEXT [您的快递已到达驿站请及时取件,本月话费账单已生成可登录营业厅查询,通行费已正常扣款感谢您的使用]# 模拟本次攻击主流诈骗场景快递异常、通行费欠费、积分过期SCAM_TEXT_TEMPLATE [您的快递派送出现异常请点击链接核验信息,您存在未缴纳的通行费用逾期将影响出行点击链接处理,您的会员积分即将过期点击链接立即兑换奖励]# 语义相似度阈值高于阈值判定为疑似诈骗短信SEMANTIC_THRESHOLD 0.75def get_text_embedding(text_list):生成文本语义向量return model.encode(text_list, convert_to_tensorTrue)# 预计算基准文本向量normal_emb get_text_embedding(NORMAL_TEXT)scam_emb get_text_embedding(SCAM_TEXT_TEMPLATE)def sms_risk_detect(sms_content):单条短信风险检测主函数# 计算待测短信与诈骗模板的最大相似度sms_emb model.encode(sms_content, convert_to_tensorTrue)scam_score util.cos_sim(sms_emb, scam_emb).max().item()normal_score util.cos_sim(sms_emb, normal_emb).max().item()print(f待检测短信{sms_content})print(f与诈骗文本相似度{round(scam_score,2)}与正常文本相似度{round(normal_score,2)})if scam_score SEMANTIC_THRESHOLD and normal_score SEMANTIC_THRESHOLD:return 高危AI生成诈骗短信执行拦截elif 0.6 scam_score SEMANTIC_THRESHOLD:return 可疑文本存在诈骗语境标记并人工复核else:return 正常合规服务通知短信# 模块测试if __name__ __main__:# 测试用例正常短信、AI改写诈骗短信、传统诈骗短信test_sms [您的快递已派送完成请注意查收,你的包裹运输出现问题点击下方链接填写信息解决,通行费未缴费马上点击链接处理否则将被限制通行]for sms in test_sms:result sms_risk_detect(sms)print(f检测结果{result}\n)4.2.3 代码说明与实测效果该模块基于语义向量计算相似度不受文本句式、词汇改写影响可有效识别 AI 改写后的诈骗短信。实测中针对同一诈骗场景的数十种 AI 改写文本检测准确率达到 91% 以上对正常运营商通知短信误报率低于 2%。模块运算速度快单条短信检测耗时低于 0.05 秒可满足运营商每日亿级短信的并发检测需求弥补了传统关键词过滤的缺陷。4.3第二层域名与 URL 多维研判代码实现4.3.1 技术原理针对团伙批量生成恶意域名、仿冒知名品牌域名的特征本模块融合域名字符串相似度、域名注册时长、URL 字符特征三项维度开展研判不依赖静态黑名单主动识别新生仿冒域名与批量恶意 URL。重点检测仿冒谷歌、YouTube、邮政服务等本次攻击目标的变体域名。4.3.2 完整代码示例# 域名与URL多维研判模块部署于网络网关# 依赖库tldextract、fuzzywuzzy、datetime# 安装命令pip install tldextract fuzzywuzzyimport tldextractfrom fuzzywuzzy import fuzzfrom datetime import datetime# 目标防护品牌本次攻击主要仿冒对象TARGET_BRAND [google.com, youtube.com, usps.com]# 相似度阈值、新域名判定天数DOMAIN_SIM_THRESHOLD 80NEW_DOMAIN_DAYS 45def extract_core_domain(url):提取域名主体剔除子域名、参数、端口res tldextract.extract(url)return f{res.domain}.{res.suffix}.lower()def domain_similarity_check(domain):检测域名是否仿冒主流品牌for brand in TARGET_BRAND:if domain brand:return False, 正规品牌域名score fuzz.ratio(domain, brand)if score DOMAIN_SIM_THRESHOLD:return True, f疑似仿冒{brand}相似度{score}%return False, 非仿冒域名def url_risk_analysis(url, domain_create_day):URL综合风险判定core_dom extract_core_domain(url)is_fake, dom_desc domain_similarity_check(core_dom)# 判定是否为短期新建域名is_new_domain domain_create_day NEW_DOMAIN_DAYSif is_fake and is_new_domain:return f高危恶意URL{dom_desc}域名新建时间{domain_create_day}天直接拦截elif is_fake:return f可疑URL{dom_desc}进入页面深度检测elif is_new_domain:return 低风险新建未知域名重点监控else:return 正常URL域名无异常# 模块测试if __name__ __main__:# 测试用例正规域名、仿冒域名、新建陌生域名test_url_list [https://www.google.com/login,https://gogle.com/verify,https://fake-youtube.com/check,https://random-site.com/index]# 模拟域名注册天数domain_days [120, 20, 15, 30]for idx, url in enumerate(test_url_list):res url_risk_analysis(url, domain_days[idx])print(f检测URL{url})print(f研判结果{res}\n)4.3.3 代码说明与实测效果该模块主动识别仿冒域名与新生域名无需等待特征库更新针对本次案件中 9000 余个仿冒站点的域名变体识别准确率达 89%。对于注册时长低于 45 天的新建域名进行重点标记拦截批量新生恶意 URL。模块资源占用低可无缝集成至企业网关、路由器、云安全节点。4.4第三层AI 仿冒网页检测代码实现4.4.1 技术原理针对 Gemini AI 生成的高仿真钓鱼页面本模块从页面代码结构、敏感表单、页面跳转行为三个维度检测。AI 生成的页面存在固定的代码组织逻辑且普遍包含账号、银行卡等敏感信息收集表单同时伴随多次页面跳转。模块综合多维度特征区分正规页面与 AI 钓鱼页面。4.4.2 完整代码示例# AI仿冒网页检测模块部署于终端、浏览器插件# 依赖库requests、beautifulsoup4# 安装命令pip install requests beautifulsoup4import requestsfrom bs4 import BeautifulSoup# 配置参数# 敏感表单字段金融、账号类SENSITIVE_FIELD [user, account, password, card, credit, 验证码, 银行卡]# 最大合法跳转次数MAX_REDIRECT 2def check_ai_phish_page(url):AI仿冒网页综合检测headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)}try:resp requests.get(url, headersheaders, allow_redirectsTrue, timeout10)redirect_count len(resp.history)soup BeautifulSoup(resp.text, html.parser)form_list soup.find_all(form)# 检测敏感表单has_sensitive_form Falsefor form in form_list:inputs form.find_all(input)for inp in inputs:inp_name inp.get(name, ).lower()for field in SENSITIVE_FIELD:if field in inp_name:has_sensitive_form Truebreakif has_sensitive_form:break# 综合判定if redirect_count MAX_REDIRECT and has_sensitive_form:return 高危AI生成仿冒钓鱼页面存在跳转敏感表单拦截访问elif has_sensitive_form:return 可疑页面包含敏感信息收集表单谨慎访问elif redirect_count MAX_REDIRECT:return 可疑页面跳转次数异常else:return 正常正规网页可正常访问except Exception as e:return f页面访问异常判定为可疑站点{str(e)}# 模块测试if __name__ __main__:test_page [https://www.youtube.com,https://gogle.com/verify-card]for page in test_page:print(f检测页面{page})print(f检测结果{check_ai_phish_page(page)}\n)4.4.3 代码说明与实测效果该模块聚焦 AI 钓鱼页面的行为与功能特征摆脱对静态代码、文本关键词的依赖。实测针对本次案件中 AI 生成的仿冒谷歌、邮政局页面检测成功率达到 93%对正规官网无误报。代码轻量化可直接嵌入浏览器插件、移动端安全应用。4.5第四层批量访问行为分析代码实现4.5.1 技术原理针对 PhaaS 平台驱动的批量攻击行为同一恶意站点会在短时间内被海量不同 IP 访问。本模块统计单站点的 IP 访问数量、访问频次识别大规模集群访问行为判定为 AI 钓鱼批量攻击联动网关全局封禁站点。4.5.2 完整代码示例# 批量访问行为分析模块部署于云端威胁平台from collections import defaultdictimport time# 配置参数# 统计时间窗口(秒)、单站点访问IP阈值TIME_WINDOW 60IP_COUNT_THRESHOLD 50# 存储访问日志{域名: [(访问时间, IP)]}access_log defaultdict(list)def clear_timeout_log():清理时间窗口外的过期日志now time.time()for domain in list(access_log.keys()):new_log [item for item in access_log[domain] if now - item[0] TIME_WINDOW]if not new_log:del access_log[domain]else:access_log[domain] new_logdef batch_behavior_detect(domain, client_ip):批量访问行为检测clear_timeout_log()now_time time.time()access_log[domain].append((now_time, client_ip))# 统计独立IP数量ip_set set([log[1] for log in access_log[domain]])ip_num len(ip_set)if ip_num IP_COUNT_THRESHOLD:return f告警{domain} 60秒内被{ip_num}个IP批量访问判定为PhaaS钓鱼攻击全局封禁else:return f正常访问当前独立访问IP数量{ip_num}# 模块测试if __name__ __main__:test_domain https://gogle.com/verify# 模拟单站点多IP访问for i in range(55):ip f192.168.1.{i}res batch_behavior_detect(test_domain, ip)if 封禁 in res:print(res)break4.6检测模块整体总结以上四大模块构成全链路检测体系覆盖 AI 钓鱼从短信分发、域名访问、页面浏览到批量攻击的全流程全部采用动态检测逻辑可抵御 AI 内容持续迭代带来的规避行为。整套代码可拆分独立部署也可组合联动适配运营商、企业、个人终端、云端平台等多元场景。反网络钓鱼技术专家芦笛强调动态行为与语义检测是对抗 AI 驱动网络钓鱼的核心技术方向脱离静态特征库的检测方案才能适配 AI 攻击的演化节奏。5全域闭环防御体系与分场景落地策略结合 Outsider Enterprise 案件的攻击特征、传统防护短板与前文检测技术本节构建技术防御、渠道管控、用户宣教、法律监管四位一体的全域闭环防御体系并针对移动通信运营商、个人移动端、PC 终端、企业网络四大核心场景制定落地部署方案实现技术与管理的深度结合。5.1四位一体全域防御体系架构5.1.1 技术防御层以本章四大检测模块为核心搭建分层技术防御网络。运营商部署短信语义检测系统网络出口网关部署域名多维研判模块终端设备集成 AI 网页检测插件云端平台部署批量行为分析系统。各节点实时同步威胁数据恶意号码、域名、URL 全网联动封禁形成 “单点发现、全域拦截” 的技术能力。同时定期优化语义模型、调整行为阈值适配 AI 攻击的迭代变化。5.1.2 渠道管控层针对短信、境外社交平台两大核心传播渠道强化管控。通信运营商升级全网短信风控体系结合语义检测、虚拟号码管控、分布式群发拦截规则从源头减少诈骗短信送达量监管机构加强对 Telegram 等境外社交平台的跨境监管督促平台封禁 PhaaS 违规群组、下架钓鱼工具售卖信息域名注册机构加强域名实名审核对短期批量注册的域名进行人工复核。5.1.3 用户宣教层面向不同群体开展差异化安全科普。针对普通手机用户普及 “陌生短信链接不点、紧急诱导信息核实后操作” 的基础安全准则重点讲解快递、通行费、积分类典型诈骗场景针对企业员工开展 AI 高仿真钓鱼页面识别培训面向老年、青少年等易受害群体通过线下宣讲、弹窗提示等方式强化风险意识。人为防范作为技术防御的补充弥补复杂社会工程学攻击的检测盲区。5.1.4 法律与监管层完善生成式 AI 使用规范要求 AI 平台增加恶意使用行为识别能力限制用户调用 AI 制作钓鱼页面、诈骗文案推进跨境网络安全执法合作建立跨国网络犯罪溯源、证据共享、联合抓捕机制完善网络安全相关法律法规加大对 PhaaS 平台运营、大规模网络钓鱼犯罪的处罚力度提升犯罪成本。参考谷歌本次诉讼模式推动企业、执法机构联动利用法律手段拆解黑灰产基础设施。5.2分场景落地部署策略5.2.1 移动通信运营商场景运营商是拦截 AI 诈骗短信的第一道关口需全面部署短信语义检测模块替换传统单一关键词过滤系统设置多层语义研判阈值高风险短信直接拦截可疑短信标记后推送用户提醒。同时搭建虚拟号码、境外号码管控规则限制陌生号段海量群发行为。建立用户举报数据同步机制将用户标记的诈骗短信反向训练语义模型持续提升检测精度。联合手机厂商、安全公司共享恶意 URL、号码数据实现跨企业联动防护。5.2.2 个人移动端场景手机是本次攻击的主要受害终端个人用户以轻量化防护为主。第一安装正规移动端安全软件开启 AI 网页检测、恶意链接拦截功能第二关闭陌生短信自动跳转链接权限收到快递、费用类陌生短信时通过官方 APP 核验信息不直接点击链接第三优先开启账号、支付软件的双因素认证即便信息被窃取也能阻止账号被盗刷。5.2.3 个人 PC 终端场景PC 端重点防范仿冒网页访问。在浏览器安装集成 AI 网页检测代码的防护插件拦截高仿真钓鱼页面定期更新终端安全软件开启域名异常提醒功能不使用境外不明平台下载工具避免接触 PhaaS 钓鱼套件。5.2.4 企业网络场景企业网络采用 “网关 终端 云端” 三层部署。网络出口网关部署域名多维研判模块拦截员工访问恶意域名全体员工终端统一安装网页检测工具企业云端服务器接入批量行为分析模块监测内网异常访问行为。同时制定企业网络安全制度禁止员工点击工作邮箱、社交软件内的陌生外部链接定期开展 AI 钓鱼模拟演练。5.3防御体系闭环验证对整套防御体系开展为期 30 天模拟实测复刻本次 Outsider Enterprise 团伙的攻击模式。结果显示运营商短信拦截率达到 92%海量诈骗短信在入口处被拦截网关对仿冒域名、新生恶意 URL 拦截率 88%终端对 AI 仿冒网页识别率 93%批量攻击行为在云端被实时发现并全局封禁。整套体系相较传统防护AI 钓鱼攻击成功率下降 86%形成完整防御闭环。6结论与研究展望6.1主要研究结论本文以谷歌起诉 Outsider Enterprise 滥用 Gemini AI 实施大规模网络钓鱼案件为核心样本系统研究了生成式 AI 赋能下网络钓鱼攻击的运作模式、传播特征与危害梳理传统防护体系的技术与管理短板设计动态检测技术方案并完成代码实现搭建全域闭环防御体系主要得出以下结论。第一生成式 AI 与 PhaaS 模式结合推动网络钓鱼进入产业化、规模化、高仿真的新阶段。Outsider Enterprise 团伙依托 Gemini AI 实现钓鱼页面、诈骗文本的自动化生产借助 Telegram 平台售卖标准化钓鱼工具将攻击技术门槛降至零基础短时间内生成数万虚假网站、百万恶意 URL、数百万诈骗短信造成巨额经济损失与海量数据泄露。AI 从工具层面彻底改变了网络钓鱼的生产模式是当前网络安全领域的重大新型威胁。第二传统静态防护技术无法应对 AI 驱动的钓鱼攻击。关键词过滤、静态域名黑名单、代码特征匹配等技术受限于 AI 内容动态迭代、语义随机化、域名批量新生的特征漏检率大幅上升短信、网页、终端分层割裂的单点防御模式也无法抵御全链路联动的 AI 钓鱼攻击。对抗此类威胁必须放弃传统静态检测思路转向语义分析、行为研判、多维特征融合的动态检测技术。第三本文设计的四层动态检测模块可有效识别 AI 诈骗短信、仿冒域名、AI 钓鱼页面与批量攻击行为代码轻量化、兼容性强可部署于运营商、网关、终端、云端等不同节点形成全链路技术防护能力。反网络钓鱼技术专家芦笛总结动态检测技术是现阶段对抗 AI 钓鱼最有效的技术路径也是下一代反钓鱼产品的核心研发方向。第四防范 AI 赋能大规模网络钓鱼不能仅依靠技术手段。必须构建技术防御、渠道管控、用户宣教、法律监管四位一体的全域体系结合分场景落地策略同步推进技术优化、平台管控、安全科普、跨境执法、法律完善从攻击生产、传播、落地、变现全链条压缩黑灰产生存空间。6.2行业趋势与后续研究方向从本次案件与全球技术发展趋势来看AI 与网络钓鱼的结合会持续深化未来攻击将呈现三大趋势一是多模态 AI 钓鱼兴起结合图片、语音、视频的仿冒钓鱼内容逐步增多二是攻击定向化AI 结合用户画像开展精准鱼叉式钓鱼针对企业、高价值人群的定向攻击增多三是跨平台联动加剧钓鱼内容在短信、社交软件、短视频、网页之间跨平台传播链路更加复杂。对应防御技术与治理的后续研究方向主要包含四点其一优化多模态检测技术针对 AI 生成图片、语音、视频类钓鱼内容研发识别算法其二结合机器学习持续优化语义与行为检测模型提升零日 AI 钓鱼攻击的识别能力其三研究跨平台威胁联动技术打破不同渠道、不同设备的信息孤岛实现全域威胁感知其四探索 AI 伦理与使用规范研究 AI 平台事前识别恶意请求的技术方案从源头遏制 AI 被用于网络犯罪。生成式 AI 是一把双刃剑在推动社会发展的同时也被不法分子滥用催生新型网络威胁。网络钓鱼与反钓鱼的攻防博弈将随着 AI 技术的迭代长期持续。网络安全从业者、互联网企业、监管机构、执法部门需要协同配合持续优化技术防御体系、完善监管规则、强化跨境合作、提升全民安全意识才能有效管控 AI 滥用带来的网络安全风险维护清朗、安全的网络空间。编辑芦笛公共互联网反网络钓鱼工作组