这个提法有价值但它只能算半个指标。Token 消耗当然不适合当最终成绩。一个系统烧了很多 Token只能说明它调用模型多、成本高、链路长。它可能在替用户完成任务也可能只是在反复重写、反复检索、反复纠错。把 Token 当成价值就像把工厂耗电量当成产量方向会偏。日活智能体数往前走了一步。它至少把注意力从模型消耗拉回到智能体有没有被使用。AI 进入业务后用户会更关心那些具体结果订票有没有办妥账目有没有查清代码有没有可合并报表能不能直接使用客户跟进有没有少漏掉线索。这张图把 DAA 放在入口位置同时提醒还要看任务质量和成本单个活跃数字不够用。但 DAA 也有天然问题。只数活跃智能体很容易把运行次数当成价值。一个每天自动跑一万次的低质量 agent可能很活跃却没有帮业务减少多少人工。一个每天只跑几十次的财务审计 agent如果能稳定发现风险、减少返工价值可能更高。To B 场景里尤其明显很多值钱的任务频率不高关键性很强。所以 DAA 更适合作为入口指标不能单独当结论。要判断一个 AI 平台有没有价值我会把它放进一组指标里看。日活智能体数看有多少 agent 确实在运行。任务完成率看它有没有把事办完。人工接管率看它会不会经常半路交回给人。单位任务成本看完成一次任务要烧多少 Token、算力和人工校验。留存和复用率看用户过几天、过几周还愿不愿意让它继续干活。这组指标更接近业务看板完成率、接管率、单次成本和复用率一起看才不容易被跑量带偏。这几个指标放在一起才比较接近真实价值。只看 DAA平台会有动力造很多轻任务、轻调用、自动跑的 agent只看 Token平台会有动力炫耀消耗和规模只看模型榜单平台又会忽视产品落地。李彦宏这个说法有意思是因为它承认 AI 行业的叙事正在变。过去大家讲模型参数、榜单、Token、上下文长度现在开始讲智能体、工作流、可用结果。这说明行业从演示阶段往使用阶段走。但移动互联网的 DAU 也走过弯路。一个 App 日活高不代表用户满意不代表商业模式健康也不代表社会价值高。AI 的 DAA 一样会遇到这个问题。一个智能体每天被唤醒不代表它真的可信它完成了任务也不代表结果能直接采用。难点会落在责任划分上。订一张票错了谁负责。写一段代码埋了漏洞谁复核。分析一份合同漏了风险谁签字。一个 agent 越接近真实生产力这些问题越绕不开。没有责任划分DAA 再高也只是热闹。跑量和关键任务的差异还是要回到结果次数好看不能替代审计、客服、研发复核这些高价值场景。所以我会把 DAA 看成一个不错的提醒AI 公司别再只炫模型消耗了要证明智能体真的在干活。可它要成为核心度量衡还得补上任务质量、成本和责任。未来靠谱的 AI 产品不会只说自己每天有多少 agent 在跑。它更应该敢说这些 agent 帮用户完成了多少任务节省了多少人工错误率是多少哪些环节必须人工确认用户为什么愿意继续用。这才是从热闹走向价值。