大多数 Hermes 用户优化错了地方。他们花几个小时比较 Opus、Sonnet、GPT-5纠结主 Agent 到底用哪个模型却忽略了另一层一直在后台烧 token 的东西auxiliary models。Hermes 不只用一个模型。它还有一组专门处理边缘任务的模型槽位比如 vision、web extraction、compression、session search、approval、memory flushing 等。如果你把这些任务也交给昂贵模型或者让它们沿用高价默认配置那你每天都可能在悄悄多花钱。好消息是Hermes 现在把这件事做得更好管理了hermes model # Configure auxiliary models这是 Hermes 很实用的一次 operator 升级因为它教你的不是“用最强模型”而是重要任务用贵模型普通后台活用便宜快模型。大多数人优化错了层聊 Hermes 成本时很多人只看主模型。这很正常。主模型负责主要对话、工具编排和任务推理。如果你用 Hermes 做编码、研究或运维主模型当然重要。但账单不只来自这里。Hermes 背后还有很多辅助调用它们不属于主对话却一直支撑主流程。这些调用很容易被忽略因为它们看起来像产品内部行为而不是你的模型路由策略。这就是 operator 常犯的错。