一、论文基础信息与核心定位基础信息:arXiv 预印本(编号 2601.21233v1),2026 年 1 月 30 日发布,cs.AI 方向;作者来自香港城市大学、迪肯大学、墨尔本大学、复旦大学、UIUC 等机构,通讯作者为香港城市大学 Cong Wang。核心定位:全球首个系统性证明「LLM 代码智能体的自主性会内生扩大系统提示词攻击面」的实证研究,提出了完全黑盒、自进化的系统提示词提取框架 JUSTASK,在 41 款商用 LLM 上实现 100% 提取成功率,同时完成了全球最大规模的商用模型系统提示词实证分析,量化了现有防御手段的边界。核心安全命题:系统提示词是现代 LLM 智能体系统中关键却几乎无防护的攻击面;代码智能体的自主交互能力,让攻击者无需任何特权、手工提示词、标注数据,就能系统性恢复目标模型的完整系统提示词。二、研究背景与问题提出的完整细节2.1 行业背景:代码智能体的核心架构与安全风险当前主流代码智能体(Claude Code、Cursor、GitHub Copilot)已从单轮对话工具,进化为多组件自主系统,集成了文件浏览器、Shell 执行器