拆完Hermes源码，我发现Agent的“自我进化“根本不需要训练模型

张

张建站

2026/5/19 2:03:04

10分钟阅读

两个月 5.2 万 StarHermes Agent 用一个LLM 审判官机制实现了 Agent 的自我进化——不改模型权重只改怎么用模型的策略。我逐行读完源码后发现所谓的自动学习本质是 Prompt Engineering 文件持久化的一次精妙工程化实践。本文从源码层面拆解它的三大核心机制并与 OpenClaw 做一次硬核对比。引言Agent 赛道杀出一匹爱马仕2026 年 2 月Nous Research 悄悄开源了一个项目——Hermes Agent。没有铺天盖地的发布会没有大佬站台背书只有 GitHub 上一句简洁的 Slogan“The agent that grows with you.”两个月后它的 Star 数突破了 5.2 万日均增长超过 800多次霸榜 GitHub Trending 全球第一。社区里开始出现一种声音“换掉 OpenClaw 太爽了。”这让我很好奇——在 OpenClaw 已经拿下 30 万 Star、Claude Code 和 Codex 打得不可开交的 2026 年一个新框架凭什么能杀出重围于是我做了一件事逐行读完了 Hermes Agent 的核心源码。读完之后我的结论是Hermes Agent 的核心创新不在于它能做什么而在于它做完之后会发生什么。01一个根本性的分歧——做完就走 vs 越用越强要理解 Hermes Agent 的设计哲学最好的方式是把它和 OpenClaw 放在一起看。1.1 OpenClaw全能管家但记忆像金鱼OpenClaw社区昵称龙虾是 2025-2026 年最火的开源 Agent 框架30 万 Star插件市场 ClawHub 里有数千个插件能接入 Telegram、WhatsApp、Slack、飞书、企业微信——几乎是一个个人 AI 操作系统。但它有一个根本性的问题无状态。每次任务独立执行做完即结束。除非你手动配置AGENTS.md、SOUL.md、USER.md 等四层配置文件否则它不会记住上次的偏好。你今天教它我喜欢简洁的代码风格明天它就忘了。更关键的是——即使你在一次复杂任务中摸索出了一套高效的工作流OpenClaw 也不会自动把这个经验保存下来。你必须手动告诉它“帮我把刚才的流程总结成一个 Skill。”1.2 Hermes Agent不那么全能但会长记性Hermes Agent 的定位完全不同。它不追求什么都能做而是追求做过的事情下次做得更好。用一张表来对比维度OpenClaw Hermes Agent ☤核心哲学全能助手插件生态自我进化越用越强记忆能力无状态需手动配置四维持久记忆自动技能管理用户手动安装/编写 SkillAgent 自动从经验中创建 Skill学习方式不学习内置闭环学习系统插件生态数千个ClawHub较少但在快速增长部署门槛中等极低5 美元 VPS适合场景一次性任务、多平台集成长期使用、个性化需求一句话总结OpenClaw 是一个什么都能干但不长记性的全能管家Hermes Agent 是一个能力在成长的专属员工。02源码拆解——自我进化到底是怎么实现的这是全文最硬核的部分。我从 Hermes Agent 的源码中提炼出三大核心机制逐一拆解。2.1 四维持久记忆系统Hermes Agent 的记忆不是一个扁平的文本文件而是一个四维系统┌─────────────────────────────────────────────┐ │ Hermes 记忆架构 │ ├─────────────────────────────────────────────┤ │ │ │ 身份记忆 (IDENTITY) │ │ └─ Agent 的角色定义、行为准则 │ │ │ │ Agent 笔记 (MEMORY.md) │ │ └─ 用户偏好、项目上下文、经验教训 │ │ │ │ ⚡ 程序性记忆 (SKILL.md) │ │ └─ 可复用的工作流程、操作步骤 │ │ │ │ 对话历史 (Conversation History) │ │ └─ 当前会话的完整上下文 │ │ │ └─────────────────────────────────────────────┘源码中记忆的读写通过 memory_tool.py 实现。关键设计是冻结快照模式——每次会话开始时系统提示词会加载当前的 MEMORY.md 和 SKILL.md 内容作为快照。会话过程中即使后台更新了这些文件当前会话看到的仍然是开始时的版本。为什么这么设计因为如果记忆在会话中途被修改模型可能会产生混乱——它的系统提示词和实际文件内容不一致了。冻结快照保证了单次会话内的一致性。2.2 技能自动创造系统这是 Hermes Agent 最核心的创新。在传统 Agent包括 OpenClaw中Skill 的生命周期是这样的用户编写 Skill → 安装到 Agent → Agent 执行 → 结束 ↑ 用户手动说更新 Skill才会触发在 Hermes Agent 中Skill 的生命周期变成了Agent 执行任务 → 后台自动审查 → 判断是否有价值 → 自动创建/更新 Skill ↓ 下次会话自动加载源码中技能管理通过 skill_manager_tool.py 实现提供三个核心操作create从零创建一个新 Skillpatch精准更新已有 Skill 的某个部分delete删除不再需要的 Skill每个 Skill 本质上就是一个 Markdown 文件SKILL.md内容是自然语言描述的工作流程。比如# 数据爬取与分析 Skill ## 触发条件用户要求爬取网页数据并进行分析 ## 执行步骤 1. 先确认目标 URL 的 robots.txt 协议 2. 使用 web_search 工具获取页面内容 3. 提取关键数据点按用户要求的格式整理 4. 如果数据量大分批处理并汇总 ## 注意事项 - 用户偏好 Markdown 表格格式输出 - 每批次不超过 20 条数据没有代码没有 API 调用纯自然语言。这意味着 Skill 的创建和修改完全不需要编程能力——LLM 自己就能读懂、写出、修改这些 Skill。2.3 KEPA对提示做反向传播这是 Hermes Agent 最精妙的设计也是自我进化的核心引擎。社区把这个机制称为 KEPAKnowledge-Enhanced Prompt Adaptation我更喜欢用一个类比来解释它传统深度学习前向传播输入 → 模型 → 输出反向传播根据损失函数更新模型权重Hermes 的做法前向传播用户意图 → HermesLLM 工具→ 执行结果反向传播周期性回顾执行过程 → 检测失败点 → 更新 Skill/记忆关键差异不是更新模型权重而是更新如何使用模型的策略——包括提示模板、工具调用顺序、技能定义等。在源码中这个机制的实现出奇地简洁。核心在 run_agent.py 的 _spawn_background_review 函数# 伪代码还原核心逻辑 class BackgroundReview: def __init__(self): self.tool_call_counter 0 self.threshold 10 # 每 10 次工具调用触发一次 def on_tool_call(self): self.tool_call_counter 1 if self.tool_call_counter self.threshold: self.tool_call_counter 0 self._spawn_review() # 启动后台审查 def _spawn_review(self): # 在后台线程中运行不阻塞主 Agent review_agent create_agent( system_promptSKILL_REVIEW_PROMPT, tools[skill_manager, memory_tool], max_iterations8 # 最多 8 次工具调用 ) # 把当前对话历史喂给审查 Agent review_agent.run(conversation_history)审查 Agent 收到的 Prompt_SKILL_REVIEW_PROMPT大意是你是一个经验审查员。请回顾刚才的对话历史判断任务过程中是否有试错或中途改变策略最终方案是否具有可复用性如果值得保存请调用 skill_manager 创建或更新 Skill。如果不值得保存请回复 ‘Nothing to save.’整个自我进化的核心就是这么一段 Prompt 一个后台线程文件持久化。没有强化学习没有模型微调没有向量数据库——纯粹的 Prompt Engineering 文件系统。03这个设计到底强在哪弱在哪✅ 强在哪**1.**零成本进化传统的 Agent 学习需要收集数据、标注、微调模型——成本高、周期长。Hermes 的方式几乎零额外成本审查 Agent 的 Token 消耗很小最多 8 次工具调用Skill 文件就是普通的 Markdown 文本。可解释、可编辑因为 Skill 是自然语言写的 Markdown 文件你可以随时打开看看 Agent 学到了什么觉得不对可以直接手动修改。这比黑箱的模型微调透明得多。跨模型迁移Skill 不依赖特定模型。你今天用 GPT-4o 积累的 Skill明天换成 Claude 或 DeepSeek 一样能用——因为它们都是自然语言。渐进式积累每次使用都在积累经验Skill 库会越来越丰富。用三个月后的 Hermes 和刚装好的 Hermes体验完全不同。⚠️ 弱在哪1. “自动不等于准确”审查 Agent 的判断力上限就是底层 LLM 的能力上限。它可能保存了不重要的经验噪声遗漏了你认为重要的经验漏判写的 Skill 质量参差不齐2. 只有复杂任务才会触发审查 Prompt 明确要求只有涉及试错或中途改变策略的任务才值得保存。如果你的任务很简单、一步到位Hermes 大概率会判断 “Nothing to save.” 然后跳过。场景会自动保存吗复杂爬虫任务试了 3 种方案才成功✅ 大概率会只是改了一个输出格式❌ 大概率不会Skill 有 bug调试了好几轮✅ 大概率会传了不同参数正常执行❌ 大概率不会3. 更新有延迟由于冻结快照机制后台更新的 Skill 要到下一次会话才会生效。当前会话感知不到变化。4. 生态差距明显OpenClaw 有 ClawHub 数千个插件Hermes 的第三方生态还在早期。如果你需要大量现成的集成能力OpenClaw 目前仍然是更好的选择。04一个更深层的思考——Agent 的学习该由谁驱动拆完源码后我一直在想一个问题Agent 的学习到底应该是用户驱动还是Agent 自驱动OpenClaw 代表的是用户驱动模式你想让 Agent 学什么就手动写什么。SOUL.md 定义人格AGENTS.md 定义工作流USER.md 定义偏好——一切都在你的掌控之中。Hermes Agent 代表的是Agent 自驱动模式Agent 自己决定学什么、怎么学。你只管用它在后台默默积累经验。两种模式各有优劣用户驱动OpenClaw ├── ✅ 精确可控你写什么它就学什么 ├── ✅ 无噪声不会学到无用的东西 ├── ❌ 成本高需要用户持续投入精力 └── ❌ 容易遗漏你忘了说的它就不会学 Agent 自驱动Hermes ├── ✅ 零维护自动积累无需用户操心 ├── ✅ 兜底能力你忘了说的它可能帮你记住 ├── ❌ 有噪声可能学到不重要的东西 └── ❌ 不可控你不知道它什么时候会学、学了什么我的观点是最理想的方案是两者结合。核心的、确定性的知识如项目规范、个人偏好应该由用户显式定义——就像 OpenClaw 的 SOUL.md隐性的、经验性的知识如这个 API 容易超时最好加重试应该由 Agent 自动积累——就像 Hermes 的 KEPA事实上Hermes Agent 也支持用户手动编辑 Skill 和 Memory。它的自动进化是一个兜底机制而不是唯一的学习途径。05选 OpenClaw 还是 Hermes一张决策表如果你是…选 OpenClaw 选 Hermes ☤需要接入多个通讯平台Telegram/Slack/飞书✅⚠️ 支持但生态较弱需要大量现成插件✅❌追求数据完全本地化✅✅长期使用同一个 Agent希望它越来越懂你❌✅经常做重复性但有微调的任务❌✅团队协作需要统一的 Agent 配置✅⚠️预算极低5 美元/月⚠️✅想要 Agent 自动积累工作经验❌✅我的建议如果你是用完即走型用户选 OpenClaw如果你是长期陪伴型用户选 Hermes。当然两者并不互斥。你完全可以用 OpenClaw 做多平台集成和一次性任务用 Hermes 做需要长期积累的个人助手。06结语Agent 的未来是会长大的软件回顾整篇文章Hermes Agent 给我最大的启发不是某个具体的技术实现而是一个理念的转变传统软件是静态的——你装好什么样它就是什么样。Hermes 代表的新范式是动态的——软件会随着使用而成长。这让我想起 Andrej Karpathy 说的那句话“The hottest new programming paradigm is English.”Hermes Agent 把这句话推进了一步不仅编程语言变成了英语连学习的载体也变成了英语。Skill 是英语写的Memory 是英语写的审查 Prompt 也是英语写的。整个进化过程没有一行传统意义上的训练代码。这是一个值得所有 Agent 开发者思考的方向也许我们不需要微调模型只需要让 Agent 学会记笔记。当然Hermes Agent 目前还很年轻——两个月的项目生态、稳定性、企业级特性都还在完善中。但它提出的自我进化范式已经在 5.2 万 Star 的社区验证中得到了初步认可。最后用 Hermes Agent 的 Slogan 结束这篇文章“The agent that grows with you.”不是为你工作的 Agent而是和你一起成长的 Agent。这个微妙的措辞差异也许就是 Hermes 和所有传统 Agent 最本质的区别。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

2026年最实用的在线视频去水印工具！6款高能免费工具深度测评

短视频创作、影视素材归集与影音资源留存过程中，外置水印极易破坏视频画面整体性，大幅降低素材可用价值。伴随2026年线上影音处理技术全面升级，AI智能修复技术全面普及，多款免费线上工具已然实现高清无痕去除各类视频水印。当前市…...

2026/5/19 2:01:03 阅读更多 →

告别预编译包！手把手教你为Qt6项目定制编译OpenCV，解锁WITH_QT支持

告别预编译包！手把手教你为Qt6项目定制编译OpenCV，解锁WITH_QT支持在计算机视觉开发领域，OpenCV无疑是使用最广泛的库之一。然而，许多开发者可能没有意识到，直接从官网下载的预编译版本OpenCV可能无法充分发挥其与Qt框…...

2026/5/19 2:00:10 阅读更多 →

Fere AI 技术深度解析：面向加密货币与预测市场的自主交易智能体架构

摘要在加密货币与预测市场（Polymarket）高速发展的背景下，传统加密货币研究工具仅能提供数据查询与策略建议，无法实现从信号到交易的全链路自主执行。Fere AI 作为新一代自主交易智能体系统，突破了 “研究 - 决策 - 执行…...

2026/5/19 1:55:04 阅读更多 →

免费API宝藏库：开发者必备的Public APIs完全指南 [特殊字符]

免费API宝藏库：开发者必备的Public APIs完全指南 🚀 【免费下载链接】public-apis A collective list of free APIs 项目地址: https://gitcode.com/GitHub_Trending/pu/public-apis 还在为寻找可靠API而烦恼吗？Public APIs项目为你准…...

2026/5/18 14:52:32 阅读更多 →