AI 代码生成：从生成优先到组装模型，如何从源头减少代码生成？

张

张建站

2026/5/30 2:57:01

10分钟阅读

过度防护是系统不可靠的表现过度设置防护措施是系统为自身不可靠性进行长期弥补的表现。其实还有更好的办法。根据 Sonar 发布的《2026 年代码开发者现状调查报告》该报告基于对 1100 多名开发者的调查目前 42% 的提交代码由 AI 辅助完成其中约 29% 的代码未经人工审查就被合并。这里说的不是“简单审查”而是完全没有审查。业界对此的反应在意料之中设置更多防护措施如静态分析、令牌检查、视觉回归测试、可访问性审计和安全扫描等。每个工具都是针对实际故障模式的合理反应但综合来看它们反映出一个令人不安的问题系统在为自身的不可靠性进行长期弥补。AI 负责生成代码工具负责检查开发者负责仲裁而且整个流程的规模会随着代码产出量线性增长。对于任何计划开发多个应用程序的企业来说这都不是理想的扩展曲线。传统的思路——“如何为 AI 生成的代码设置更好的防护措施”——本身没错但在我看来并不全面。更有价值的问题应该是“如何从源头上减少需要防护措施的代码量”这个问题会引导我们采用一种截然不同的架构即从无到部分再到完全代码生成的渐进式曲线我称之为 AI 组装模型。当前情况生成 - 检查的循环靠谱吗当生成式 AI 工具从零开始生成一个 UI 组件如数据表、表单、导航栏时输出结果具有不确定性。它可能是正确的也可能存在缺失身份验证检查、硬编码颜色值绕过设计系统、可访问性标记损坏或者在并发负载下状态管理模式崩溃等问题。只有检查后才能发现这些问题而在企业规模下进行检查成本很高。因此业界在代码生成后增加了验证环节。静态分析器可以捕捉潜在的注入向量检查器可以标记设计令牌的偏差视觉回归套件可以将渲染的组件与基线进行比较可访问性扫描器可以检查 ARIA 角色和对比度DAST 工具可以探测运行中的应用程序是否存在 OWASP 十大漏洞。这些工具都能应对实际风险但都无法预防风险的发生只能在问题出现后进行检测。这是一种被动的应对方式存在结构性成本问题。采用先生成代码的模式构建的每个新应用程序都需要重新进行全面检查。每次根据提示生成的组件都可能出现各种缺陷。应用程序数量翻倍审计负担也会翻倍数量变为三倍审计负担同样变为三倍没有任何累积优势每次生成都是从零开始。对于一个发布实验性聊天机器人的团队来说这种成本还可以承受但对于一个在受监管业务领域构建数十个内部应用程序的企业项目来说这将成为开发生命周期中的主要成本——不是计算成本而是开发者诊断错误输出、QA 团队捕捉回归问题以及生产环境中缺陷漏检所花费的时间。AI 组装模型代码不生成行不行AI 组装模型基于不同的前提。最可靠的代码是那些无需按需生成的代码。该模型不是每次都让大语言模型LLM从零开始编写组件而是将开发者的意图无论是通过自然语言提示、可视化画布交互还是 Figma 导入表达映射到企业库中预构建、经过测试和认证的组件上。AI 的任务不是编写组件而是选择合适的组件并进行配置。这是一个重要的架构区别而非营销噱头。组装模型在三个不同的生成层级上运行每个层级的风险状况不同零生成组件映射将开发者的意图与组件库进行匹配。如果存在满足需求的认证组件则直接选择该组件无需进行代码生成。该组件的安全态势、可访问性合规性、视觉一致性和跨平台保真度都已经过验证使用该组件的应用程序可以继承这些特性。最小生成配置和绑定AI 对所选组件进行配置如设置属性、连接数据连接器、绑定导航路径和附加身份验证上下文。这是受模式约束的工作配置空间是可枚举和可验证的。AI 根据类型化模式错误配置属性是可检测和可纠正的错误与 AI 从零开始创建有缺陷的实现完全不同。有针对性的生成填补真正的空白对于自定义业务逻辑、新颖的集成以及库中没有等效组件的情况才进行代码生成。这是 AI 代码生成真正发挥价值的地方也是唯一需要进行全面防护检查的层级。关键区别在于范围只需验证实际生成的部分而不是所有内容。在这个模型中防护措施不是在代码生成后进行检查而是将开发者的意图引导到预构建的工件上而不是生成式模型。如果库中有合适的组件就不会启动代码生成如果启动了也只会针对触发生成的特定空白区域。预构建组件实际保障究竟几何只有当库中的组件是真正经过认证的工件而不仅仅是可复用的代码片段时组装模型才能发挥作用。质量必须是组件本身的属性而不是使用该组件的应用程序需要验证的内容。这意味着企业库中的每个组件都必须在多个维度上提供绑定保证视觉一致性在组件构建时验证设计令牌、暗模式行为、响应式断点和品牌合规性。从这些组件组装的每个应用程序都能继承视觉保真度无需对组装部分进行每个应用程序的视觉回归测试。从库中获取的任何内容都不会出现令牌偏差即生成的组件与设计系统逐渐偏离的问题。安全性身份验证框架、CSRF 保护和 OWASP 合规性是组件的结构属性。无法组装出不安全版本的安全组件。这比生成后扫描更可靠因为生成后扫描只能告诉你某次生成是否引入了漏洞而无法从源头上防止漏洞的产生。可访问性在组件构建时一次性验证 WCAG AA 合规性包括颜色对比度、ARIA 角色、焦点管理、键盘导航、屏幕阅读器兼容性和交互式组件行为。使用该组件的每个应用程序都能继承这些特性。这很重要因为 AI 生成代码中的可访问性缺陷在生成后审查中最容易被忽视而且部署后修复成本最高。跨平台保真度单个组件声明可以同时生成经过测试的 Web 工件和移动工件。平台兼容性是组件的属性而不是每个应用程序都需要重复的测试负担。对于同时维护 Web 和移动应用程序的企业来说这可以显著减少 QA 生命周期。后端服务架构防护措施有多重要前端组件的情况已经很有吸引力但更具挑战性和高风险的问题在于后端服务。持久层、API 端点、安全过滤器和服务集成等方面是典型企业应用程序中生成代码最多的地方也是架构错误影响最严重的地方。AI 组装模型通过将架构防护措施嵌入到每个生成的服务的结构属性中来解决这个问题这些防护措施不是开发者需要记住遵循的可选模式而是平台强制执行的不变规则。这一区别很重要开发者可能会忘记应用的模式最终就会被遗忘尤其是在 AI 辅助开发带来的时间压力下。以下六个后端防护措施尤其能体现出仅仅能编译的代码和能够安全运行受监管业务的代码之间的区别无状态、可水平扩展的服务应用层中没有会话状态任何实例都可以处理任何请求。扩展成为一个基础设施决策即通过在负载均衡器后面添加实例来实现而不是改变应用程序架构。处理 50 个用户的试点项目的服务架构同样可以处理为数百万用户提供服务的生产部署。这遵循了十二要素应用方法的无状态流程原则意味着“原型”和“生产”之间的差距不需要进行架构重写。安全、缓存、可审计的数据访问所有数据库交互都通过生成的持久层进行。平台输出中不会出现无防护、手动组装的 SQL 调用这种调用是导致十多年来一直位列 OWASP 十大漏洞之首的注入漏洞的原因。经常访问的数据在服务之间进行一致缓存。每次写入操作都会自动记录审计跟踪包括谁在何时更改了什么。对于受监管的行业来说这不是一种便利而是架构默认满足的合规要求。将机密信息与代码分离生成的服务代码中不会出现凭证。API 密钥、数据库密码和加密密钥在部署时从安全的机密库中注入不会写入源代码控制。旋转凭证不需要更改代码也不需要重新部署业务逻辑。这是十二要素“外部化配置”原则的结构体现不是风格指南中的建议而是代码生成管道本身的属性。端到端基于角色的访问控制大多数平台在 UI 层定义访问规则而将后端执行留给开发者。组装模型将 RBAC 生成为跨越每个层的单一连续约束。用户在界面中只能看到其角色允许的内容。在执行任何业务逻辑之前他们的 API 调用会根据相同的角色定义进行验证。他们的数据查询在数据库层进行过滤。一个定义处处执行没有漏洞用户看似拥有的访问权限和实际拥有的访问权限之间没有偏差。API 绑定的服务契约每个服务都公开一个类型化、版本化的 API 契约。服务通过这些契约进行通信而不是通过共享数据存储或直接耦合。每个服务都可以独立更改和重新部署而无需在整个堆栈中进行协调发布。这就是微服务架构在实践中真正发挥作用的方式与许多团队在平台没有强制执行服务边界时意外构建的分布式单体架构形成对比。根据行业标准验证安全性生成的应用程序会根据 OWASP 十大漏洞进行测试并在实际条件下通过动态应用程序安全测试进行验证。合规团队在每次发布时都会收到独立可审计的安全态势证据不是开发者声称遵循了最佳实践而是针对已知标准的可验证测试结果。这些单独来看都不是新颖的想法。十二要素应用、OWASP 合规性、外部化机密信息、端到端 RBAC 等都是广为人知的工程原则。新颖之处在于将它们作为代码生成架构的结构属性而不是清单上的理想目标。当这些防护措施成为架构不变量时它们不依赖于开发者的纪律不会在截止日期压力下受到侵蚀也不会在不同团队之间有所差异。成本分析组装模型真的划算吗AI 组装模型并非没有权衡。与单纯的生成式方法相比它需要更高的上下文开销。在生成第一行有用输出之前需要向系统传授组件库模式、设计令牌绑定和架构约束等信息这会消耗大量令牌。简单比较每次会话的令牌成本生成优先模型似乎更有优势但这种比较具有误导性因为它忽略了实际成本的累积之处。在生成优先模型中每次都会完整生成每个组件。每次生成运行都会消耗令牌来生成已经在组织的组件库中以测试形式存在的实现代码只要模型知道如何使用这些代码。由于概率性输出经常在第一次尝试时无法达到目标自我纠正循环频繁出现。而且每个生成的组件都需要进行全面的审计周期包括安全、可访问性、视觉回归和功能测试。在组装模型中组件代码已经存在AI 进行配置而不是构建。消耗的令牌更少自我纠正循环更少需要验证的输出也更少。上下文开销在每次会话中只需支付一次生成节省的成本会在每个组装的组件中累积并且随着在同一库上构建的每个额外应用程序而再次累积。但真正的优势不在于令牌经济性而在于缺陷成本。开发者诊断 AI 错误输出的时间更少QA 团队捕捉生成优先模型随机产生的回归问题的周期更少缺陷完全绕过防护措施导致的生产事故也更少。预构建、经过认证的组件在构建时一次性承担这些成本使用该组件的每个应用程序都能继承这些节省。这是质量投资的复利回报与生成 - 检查模式的线性成本增长形成鲜明对比。构建认证与测试验证合规影响几何对于金融服务、医疗保健、政府和保险等受监管行业的企业来说组装模型的合规影响值得单独关注。生成优先模型产生的合规工件本质上是“我们生成了这段代码然后进行了测试测试通过了。”这是一种有效的合规姿态但也是一种脆弱的姿态。它依赖于测试套件的完整性、审查过程的严格性以及每次生成运行都将接受相同标准审查的假设。鉴于 29% 的 AI 辅助代码在未经审查的情况下就被合并这个假设正面临明显的压力。组装模型产生的是不同的工件“这个应用程序是由在构建时针对特定标准进行认证的组件组装而成的。只有自定义生成的部分需要运行时验证。”构建认证方法将合规范围缩小到真正新颖的代码即没有库组件可以满足的业务逻辑和集成。其他一切都携带其合规证据嵌入在组件的认证历史中。这不是理论上的区别它改变了与审计人员、监管机构和内部风险委员会的对话。它将合规从每次发布的测试工作转变为开发平台的结构属性。而且它具有可扩展性在认证库上构建的第 100 个应用程序面临的合规负担与第一个相同而不是 100 倍的负担。令人不安的启示AI 代码生成问对问题了吗目前关于 AI 代码生成的讨论问错了问题。“如何为 AI 生成的代码添加更好的防护措施”这个问题默认了先生成所有代码再检查所有代码的前提。这导致了代码生成量和验证工具之间的军备竞赛在这场竞赛中代码生成量已经达到提交代码的 42% 且还在上升而验证工具总是落后于一种缺陷类型。AI 组装模型重新定义了问题。不是“如何更有效地检查”而是“如何从源头上减少代码生成”不是“如何在下游捕捉缺陷”而是“如何使应用程序组装部分的缺陷在结构上不可能出现”防护措施是必要的对于 AI 真正生成的每一行代码来说它们将始终是必要的。这里的观点不是反对防护措施而是反对将防护措施作为整个应用程序包括 70% 或 80% 可以从认证部件组装而成的部分的主要质量保障机制。率先理解这一点的团队不仅能够更快地发布产品还能以比生成优先团队更高的质量水平发布而生成优先团队如果不按比例扩展其验证基础设施就无法达到这种质量水平这意味着他们将失去 AI 辅助开发原本带来的大部分速度提升。New Tech Forum 为技术领导者包括供应商和其他外部贡献者提供了一个深入探讨新兴企业技术的平台。内容选择是主观的基于我们认为对 InfoWorld 读者重要且最感兴趣的技术。InfoWorld 不接受营销材料用于发布并保留对所有投稿内容进行编辑的权利。所有咨询请发送至 doug_dineleyfoundryco.com。分类开发方法、软件开发、开发工具、生成式 AI、人工智能