Hermes 下启动 Sub Agent 失败的痛苦教训我以为 subagent 可以帮我并行搜索、整理资料、写好文件、一气呵成。结果它跑了 9 分钟中途超时什么都没写完。事情经过任务很简单搜索国产大模型DeepSeek V4、Kimi K2.6、GLM 5.1、Qwen3、MiniMax M2.7的最新数据整理成 context.md供主线程写文章用。我用了delegate_task给 subagent 分配了[web, file]工具集让它自己跑。delegate_task(goal搜索以下方向资料整理成结构化 context.md 保存到 ~/.hermes/tmp/...,toolsets[web,file])subagent 开始工作了开始搜索了搜了很多页面extract 了很多内容……然后9 分钟后status: interrupted Operation interrupted: waiting for model response (293.1s elapsed) input_tokens: 205,776文件没写任务中断一切归零。为什么这么慢四个核心原因1. 冷启动每个 subagent 都是全新 Sessionsubagent 没有任何上下文继承。它需要重新加载完整 system prompt重新初始化工具列表从零开始理解任务光初始化就要十几秒。这是固定成本无论任务多简单都省不掉。2. 工具调用是串行的每步都要等 LLMsubagent 的执行模式是web_search → 等模型推理 → web_search → 等模型推理 → web_extract → 等模型推理 → write_file每一步都是一次完整的LLM 推理 网络 RTT。如果搜 8 个方向每步间隔 10 秒叠起来就是好几分钟。这不是并发是串行 IO 密集型任务——偏偏 subagent 最不擅长这个。3. Token 雪球上下文越大越慢那次 subagent 的 token 消耗input_tokens: 205,776原因是每次 web_extract 返回几千字全部追加到对话历史里下一轮推理时要把所有历史重新带上。上下文越大Attention 计算越慢接近二次方级别。到了 200k tokens每次推理可能要 20-30 秒。任务越多滚雪球越快最终超时崩掉。4. Provider 共享配额主线程和 subagent 用的是同一个 providerCopilot / claude-sonnet-4.6。subagent 跑重任务时主线程也在等——配额可能排队进一步放大了延迟。根本误区把 subagent 当成更强的自己很多人包括我会这样想“这个任务我做要 10 步subagent 帮我做我可以去干别的。”这个思路本身没错。但问题在于subagent 做这 10 步每步都比你慢——因为它需要额外的上下文重建、推理等待、token 积累。subagent 的价值在于隔离和并行不在于加速串行任务。✅ 适合 subagent 的任务 - 真正相互独立、可并行的任务3 个子任务同时跑 - 推理密集、计算量大的单次任务代码审查、文档分析 - 需要上下文隔离的任务避免污染主线程 ❌ 不适合 subagent 的任务 - 多轮搜索 整理串行 IO 密集 - 需要频繁读写文件的流程每步都要等 LLM 确认 - 任务链条长、中间依赖多的5步以上、每步依赖上一步结果教训和改法教训一搜索 整理主线程自己做更快像搜新闻整理成文章这种任务本质是IO 密集 串行依赖。我自己直接做搜索几秒→ 处理本地→ 写作一次推理全程不到 2 分钟。subagent 做初始化15 秒→ 多轮搜索每轮 10 秒→ 上下文膨胀越来越慢→ 超时9 分钟后中断。结论串行 IO 任务主线程直接做。教训二给 subagent 的任务要自包含好的 subagent 任务长这样# ✅ 好自包含单次推理可完成delegate_task(goal分析这段代码的安全漏洞返回风险列表,context代码内容[具体代码])# ❌ 坏需要多轮 IO依赖外部搜索delegate_task(goal搜索 10 个方向的资料整理成 context.md然后写文章)一个 subagent一件事一次返回。教训三用 execute_code 替代轻量 subagent如果只是需要搜索 处理数据用execute_code调web_searchweb_extract效率远高于 subagent无冷启动脚本化控制不需要 LLM 每步决策输出直接进入主线程无跨 session 开销# execute_code 里直接批量搜索fromhermes_toolsimportweb_search,web_extract resultsweb_search(DeepSeek V4 benchmark,limit5)# 立刻拿到结果无等待一句话总结subagent 是放大器不是加速器。它能让你同时做多件事但不能让每件事本身变快。用对了是翅膀用错了是 9 分钟后的一条超时报错。