Token预算失控时代已然来临
时代变化太快了。最近我身边认识的老板们我也不敢说100%但直觉99%都沉迷于vibe coding去年我还经常和他们得瑟我用AI做的小游戏今年我都不敢吹牛了每个老板在这个领域投入的时间精力和预算都比我多不管是功成名就的上市公司董事长还是仍然在一线打拼的创业者没有例外你敢信而且各个来劝我别用cursor了太落伍了。然后就有一个更加有意思的事情就是很多老板都会吐槽一个事情现在公司token开销太狠了每月账单开始让人心疼了。不管是上市公司还是创业公司。另一个最近从职场从业者那里听到的消息也很有意思就是很多巨头为了提升开发效率已经不那么顾及所谓的代码安全了claude code几乎无差别的在多个全球顶级互联网巨头内部使用除了极少数特别涉密的部门基本上没限制了我们以前以为这些巨头内部会用自己的模型或者会基于安全考虑不使用外部大模型其实不是的。这也是anthropic最近财务数据非常耀眼的原因吧一个季度营收上百亿美金已经比肩巨头了。但巨头们的token开销也是相当惊人的他们以为减员增效可以用token获得更高的性价比最后帐算下来好像好像情况开始失控了。正好最近网上看到一些新闻美国几个巨头也开始意识到这个问题并开始着手限制第三方token的消耗了。uber总裁也抱怨短短4个月时间2026年的token预算已经用完了。这才多久前两年还是努力敦促程序员拥抱AI以消耗token为先进生产力的象征现在预算全面失控估计很快token消耗逐步收紧将成为越来越多企业的选择。当然这个世界不是平的有些地方有些企业还在努力鼓励员工拥抱AI呢这怎么说没法说。几个原因1、AI编程技术的成熟化很多老板说去年AI编程其实还是很多问题的是呀去年我磕磕绊绊真的是因为有多年编程底子才能勉强hold住项目今年不一样了困在bug里鬼打墙的情况越来越罕见了。今年小白用AI编程更友好了所以大家也更愿意去尝试了。2、openclaw的崛起ai agent对token的消耗是指数级增加上周一个海外上市的云算力厂商负责人跟我说过在openclaw之前他们还是要宣传推销自己的算力资源openclaw之后基本上是有多少算力就卖掉多少根本不愁客户现在是大量询单吃不下来。3、一些企业畸形的奖励和考核体系用的越多越证明自己但其实产出效率未必那么好。特别是员工习惯把各种无聊的问题也都扔给最贵的模型的时候。4、试错成本变低伪需求更容易泛滥以前提出需求需要排期需要资源对齐那么产品经理也好项目负责人也好需要评估优先级需要做出取舍然后很多需求自己就砍掉了只保留最关键最核心的。现在反正两天就能搞定试试看呗。越来越多脑洞想法都可以试试看token消耗就爆表了特别是一些大厂根本不设限制。5、做私活的也多起来了大厂token不受限公司开发任务交给AI一会就搞定了然后大把时间用公司配给的AI自己做点东西这种据说也挺多的我昨天开直播评论区很多人说也会这么做。6、最关键的是员工没有成本意识。其实好几个老板跟我吐槽他们自己用AI都抠抠索索的最好的模型当然也要用但是普通的任务国产模型可以解决而且成本只有1/n只有困难任务才交给最好的模型对不对。我现在也是我大部分开发其实是cursor的auto模式说白了这底层就是kimi对不对。只有特别关键或者遇到卡壳的时候才会换比较贵的顶级模型。老板们很多都是切换混用什么模型做设计什么模型写代码什么模型做简单任务什么模型跑复杂分析。但他们员工可没这个意识最贵的模型全搞定不香么反正买单的是老板自己何必给老板省钱。美国巨头已经集体行动了财务压力让他们开始反思曾经的tokenmaxxing政策并且开始着手改变你随便搜索一下这样的新闻已经很多。国内越来越多企业也开始意识到并且开始重视这个事情其实国内目前情况看上去没那么严重说实话国内真正实现token自由的公司没那么多很多公司无障碍使用海外大模型这件事上依然困难重重我身边的老板都是比较前卫的他们的案例可能并不是那么有代表性但是之前在这方面走的最激进最开放的公司可能会重新调整政策比如进行必要的限额鼓励和引导程序员通过不同模型切换来控制整体成本并基于实际产出表现给与必要的额外token成本激励。当然今天饭桌上还听到老板们的一个推测他们认为今年后半年顶尖编程模型还会有一个巨大的跃升而国产大模型也会随之快速跟进那么年底国产大模型的可用性将很可能超越今天最好的美国大模型的编程能力并且成本是对方的1/10如果这个推测属实他们会敦促团队全面拥抱国产大模型。所以这些老板的想法是先不过度控制熬过这半年过渡期看看。前几年讲降本增效是用token换人这才多久token本身也需要降本增效了。如果你所在的企业仍然实行 token自由策略随便你使用最新最好的大模型珍惜这段时间吧。知识星球加入3天内退出无理由全额退款