一、前言近两年,AI Agent 项目越来越多。从早期的 AutoGPT,到面向开发者的 Claude Code、OpenAI Codex CLI,再到各种本地个人助手类项目,大家都在探索一个问题:如何让大模型不只是“回答问题”,而是真正能调用工具、执行任务、积累经验,并长期为用户工作?NousResearch 开源的Hermes Agent就是这类项目中的一个代表。它不是一个简单的聊天机器人,而是一个集成了模型调用、工具系统、长期记忆、技能系统、定时任务、多平台消息网关、子代理和研究数据生成能力的 AI Agent 框架。同时,很多人也会把 Hermes Agent 和OpenClaw放在一起比较。两者都支持工具调用、消息平台接入、长期运行和个人自动化,但它们的设计目标并不完全相同。本文将系统梳理:Hermes Agent 是什么;Hermes Agent 的核心能力;Hermes Agent 的架构设计;Hermes Agent 如何安装和使用;Hermes Agent 适合哪些场景;Hermes Agent 与 OpenClaw 的核心区别。二、Hermes Agent 是什么?Hermes Agent是 NousResearch 开源的一个自进化 AI Agent 框架。它的核心目标不是做一个普通聊天工具,而是构建一个可以长期运行、能够调用工具、能够保存记忆、能够沉淀技能,并且可以在不同平台上工作的智能代理系统。可以把 Hermes Agent 理解为:Claude Code / Codex CLI 类工具 + 个人自动化机器人 + 多平台聊天网关 + 技能系统 + 长期记忆系统 + Agent 研究平台。它既可以在本地终端里运行,也可以部署到 VPS、Docker、SSH 远程服务器、云端沙箱等环境中。用户既可以通过 CLI 和 TUI 与它交互,也可以通过 Telegram、Discord、Slack、WhatsApp 等消息平台远程调用它。三、Hermes Agent 的核心能力1. 多模型支持Hermes Agent 不绑定某一个模型厂商,而是支持多种模型服务和自定义端点。它可以接入:Nous Portal;OpenRouter;NVIDIA NIM;OpenAI;Hugging Face;Kimi / Moonshot;MiniMax;GLM / z.ai;自定义 OpenAI-compatible endpoint。用户可以通过命令切换模型,而不是修改代码。这一点对 Agent 框架非常重要,因为 Agent 通常需要较强的工具调用能力和较大的上下文窗口。Hermes Agent 官方也建议使用至少 64K token 上下文窗口的模型,否则复杂任务体验会明显变差。2. CLI、TUI 和多平台消息入口Hermes Agent 提供多种交互入口。最基础的是命令行:hermes也可以启动新的 TUI 界面:hermes--tui除此之外,Hermes Agent 还支持 Gateway 模式,可以把 Agent 接入各种消息平台,例如:Telegram;Discord;Slack;WhatsApp;Signal;Email;Matrix;Mattermost;Feishu / Lark;Microsoft Teams;Home Assistant。这意味着用户可以把 Hermes Agent 部署在服务器上,然后通过手机上的 Telegram 或 Slack 给它下达任务。例如:帮我检查服务器日志,找出最近 1 小时内的错误,并总结原因。或者:每天早上 9 点帮我检查 GitHub issues,并把摘要发到 Telegram。这让 Hermes Agent 不只是一个本地 CLI 工具,而更像一个长期在线的 AI 助手。3. 强大的工具系统Hermes Agent 的重点能力之一是工具调用。它不仅能回答问题,还可以调用工具完成实际操作。常见工具包括:工具类别能力示例Web 工具搜索网页、提取网页内容文件工具读取文件、修改文件、打补丁终端工具执行 shell 命令、运行脚本浏览器工具打开网页、浏览器自动化图像工具图像分析、图像生成语音工具文本转语音、语音消息处理记忆工具保存长期记忆、检索历史会话自动化工具创建定时任务、发送消息子代理工具把任务分派给多个子 Agent 并行执行这些工具会被组织成不同的toolsets。不同场景下可以启用不同工具集。例如:本地开发时可以启用 terminal、file、browser;Telegram 远程控制时可以关闭高风险工具;自动化任务中可以只启用 web、cron、messaging;生产环境中可以把 shell 工具放进 Docker 或 SSH 隔离环境。这种设计可以让 Hermes Agent 在能力和安全之间取得平衡。4. Skills 技能系统Hermes Agent 的一个重要特性是Skills。Skills 可以理解为 Agent 的可复用经验包。每个 skill 通常包含一个SKILL.md文件,用来描述某个任务的流程、规则、注意事项和可用资源。它的优势是:不需要每次都在 prompt 里塞满所有知识;只在需要时加载相关技能;可以把重复任务沉淀成固定流程;Agent 可以在完成任务后总结经验,创建或改进 skill。例如,针对 GitHub PR 工作流,可以做一个 skill: