AI Agent Loop 与新术语地图
概述AI 应用开发的关注点正在从单次的 **Prompt Engineering提示词工程逐步转向Agent Loop智能体循环与 Agentic Workflow智能体工作流**。过去更常见的问题是如何写一个好提示词让模型一次性给出更好的答案。现在更重要的问题变成如何设计一个可以持续观察、思考、调用工具、检查结果并自我修正的 AI 系统。一句话概括Prompt 解决的是“这一轮怎么问”Loop 解决的是“一个任务如何持续推进到完成”。从 Prompt 到 Loop 的演进阶段核心问题典型能力局限Prompt Engineering怎么问模型角色设定、格式约束、Few-shot 示例一次性交互缺少持续反馈RAG怎么让模型查资料向量检索、混合检索、重排多数仍是“检索一次、回答一次”Tool Use怎么让模型调用工具Function Calling、API、数据库、文件系统工具调用若无闭环容易失控或半途而废Agent怎么让模型自主完成任务ReAct、计划、工具调用、记忆需要状态管理、权限控制和评估体系Agent Loop怎么让任务持续推进观察、行动、反馈、评估、迭代工程复杂度更高需要可观测性和护栏这条演进线说明AI 应用的核心不再只是“模型回答得好不好”而是“系统能不能可靠地完成一个复杂任务”。Agent Loop 是什么Agent Loop 是智能体围绕目标不断迭代的执行闭环。典型结构如下目标 Goal ↓ 观察 Observe读取上下文、文件、工具返回、外部状态 ↓ 思考 Plan/Reason判断下一步行动 ↓ 行动 Act调用工具、写代码、检索、执行命令、请求 API ↓ 反馈 Feedback读取结果、错误、测试输出、用户反馈 ↓ 评估 Eval判断是否达成目标 ↓ 继续循环或结束早期的 ReAct 模式可以看作 Agent Loop 的基础形式模型在“思考—行动—观察”之间反复切换。今天的 Agent Loop 则进一步加入了状态管理、长期记忆、权限控制、可观测性和评估体系。Workflow、Agent 与 Loop 的区别Workflow流程固定Workflow 是预先设计好的流程AI 通常只是其中一个节点。例如用户输入 → 检索知识库 → 调用 LLM 总结 → 格式化 Markdown → 保存结果特点稳定、可控、容易测试适合企业系统、审批流、固定业务链路灵活性较弱遇到异常情况需要人工设计分支Agent目标驱动Agent 是围绕目标自主选择下一步行动的系统。例如用户帮我排查这个 bug Agent读报错 → 搜函数 → 看测试 → 改代码 → 跑测试 → 根据失败结果继续修改特点适合开放任务和复杂问题能动态决定下一步对上下文、工具、权限、评估要求更高Loop执行闭环Loop 是 Agent 能持续推进任务的机制。没有 Loop 的 Agent 更像“会调用工具的聊天机器人”有 Loop 的 Agent 才能在任务失败、信息不足或结果不理想时继续迭代。实际工程中最常见的形态不是纯 Workflow也不是完全自主 Agent而是外层用 Workflow 控制边界内层用 Agent Loop 处理复杂步骤。新术语分层地图1. 模型层术语含义关注点LLM大语言模型文本理解、生成、推理Long Context长上下文一次处理更多资料但不等于替代 RAGReasoning Model推理模型更擅长多步推理、代码、数学、复杂规划Thinking Tokens推理 token模型内部推理消耗影响成本、延迟和质量Multimodal多模态统一处理文本、图片、音频、视频、PDF 等模型层解决的是“底层能力有多强”。但仅有强模型不等于有可靠应用仍需要上下文、工具、流程和评估。2. 上下文层术语含义关注点Context Engineering上下文工程设计模型应该看到什么而不只是写提示词Context Window上下文窗口一次请求能放入多少信息Memory记忆机制保存用户偏好、项目背景、任务状态和长期知识State状态Agent 当前执行到哪里、已有结果是什么Context Compression上下文压缩长任务中保留关键信息、丢弃噪声Prompt Engineering 是写好一段话Context Engineering 是搭好一个工作台。对于 Agent Loop 来说上下文质量直接决定循环是否稳定。3. 检索层术语含义关注点RAG检索增强生成先查资料再生成答案Hybrid Search混合检索关键词检索 向量检索Reranker重排模型对初步检索结果重新排序Query Rewriting查询改写把用户问题扩展成更适合检索的多个 queryGraphRAG图谱增强 RAG利用实体关系图增强复杂知识检索Agentic RAGAgent 化 RAG由 Agent 动态决定检索策略、轮次和验证方式普通 RAG 更像“查一次资料后回答”Agentic RAG 则会根据问题难度进行多轮检索、交叉验证和答案自检。4. Agent 层术语含义关注点Agent智能体围绕目标自主选择行动Agent Loop智能体循环观察、思考、行动、反馈、评估的闭环Tool Use工具使用调用搜索、文件、数据库、API、浏览器等外部能力Function Calling函数调用模型以结构化方式请求系统执行函数MCPModel Context Protocol为模型连接外部工具和数据源的协议Multi-Agent多智能体多个 Agent 按角色协作Handoff交接一个 Agent 将任务转交给另一个 Agent 或人类Human-in-the-loop人在环路中人类审批关键步骤控制风险Agent 层的核心是把模型从“回答者”变成“执行者”。但执行能力越强越需要权限边界和过程审计。5. 评估与控制层术语含义关注点Evals评测用测试集持续评估模型和 Agent 表现Guardrails护栏限制越权、违规、危险或格式错误行为Tracing链路追踪记录每一步模型调用、工具调用和中间结果Observability可观测性监控成功率、延迟、成本、错误率、用户反馈Policy策略定义哪些事情可以自动做哪些必须人工确认评估与控制层决定 Agent 能不能从 Demo 走向生产。如果没有 Evals 和 TracingAgent 失败时很难知道是哪一步出了问题。6. 应用架构层术语含义关注点Copilot副驾驶AI 辅助人类人做最终决策Autonomous Agent自主 AgentAI 长时间独立推进任务AI-Native ApplicationAI 原生应用核心流程围绕 AI 能力重新设计Durable Execution持久化执行长任务可暂停、恢复、重试State Machine / Graph状态机 / 图用节点、边和状态管理 Agent 流程Agentic SystemAgent 化系统多个模型、工具、状态、评估组成的完整系统AI 应用架构的重点是把不稳定的模型能力封装进可控、可观测、可恢复的软件系统中。对 Java / 企业应用开发的意义对于 Java 后端和企业系统开发者来说Agent Loop 不是一个脱离工程的概念而是一次新的系统集成机会。传统企业系统关注业务流程权限控制数据一致性日志审计异常补偿调度任务接口集成Agentic 系统同样需要这些能力只是中间多了一个 LLM 决策层。因此Java 开发者可以从以下方向切入企业知识库问答RAG 权限过滤 引用溯源 反馈评估智能工单助手读取工单 → 检索知识 → 给出处理建议 → 人工确认运维排障 Agent读取日志 → 分析异常 → 查询监控 → 生成排查步骤代码辅助 Agent定位问题 → 修改代码 → 跑测试 → 生成总结低代码平台智能助手理解表单、流程、脚本和接口辅助配置业务功能Java 开发者的优势不是训练模型而是把 AI 接入真实业务系统并处理权限、状态、事务、审计、可观测性这些生产级问题。