AI成本通缩但账单变贵,中美争夺塔尖,赌AI不可替代性能维持多久?
AI成本通缩但账单变贵中美争夺塔尖赌AI不可替代性能维持多久Django框架联合创始人Simon Willison或许是当下世界上对Claude Code和Codex了解最深的开发者之一。过去30天他消耗了价值2180.16美元的token实际却仅支付了200美元。许多人看到的是其中的划算而Simon关注的却是另一件事——这种便宜正在逐渐消失。OpenAI已将Codex从按消息估算改回按token计费Anthropic虽未提高Opus 4.7的挂牌价格却通过新的tokenizer让同样文本最多多切35% token。以往被平台补贴掉的那部分成本正一点点回到用户账单上。对Simon而言这意味着一个具体变化过去200美元能烧掉2000多美元token的日子正在成为历史且不会再成为长期模式。未来某一天他消耗的那2180美元很可能真的需要支付2180美元。这对任何重度开发者来说都不是个轻松的消息。而且这件事几乎不可避免。企业已率先感受到这种变化。据The Information报道Uber进入2026年没几个月就烧穿了全年AI预算主因是Claude Code。4月23日OpenAI发布GPT - 5.5输入和输出价格从GPT - 5.4的2.5/15美元提高到5/30美元Anthropic虽维持Opus 4.7的挂牌价格不变但Willison估算其有效成本约为Opus 4.6的1.4倍。一个明涨一个暗涨。仅看这些新闻很容易得出“AI越来越贵了”的结论。但问题是这个结论与过去几年最重要的研究结果相悖。a16z合伙人Guido Appenzeller给这条曲线起过一个名字LLMflation。2021年每百万token 60美元的GPT - 3级能力如今只需0.06美元。武汉大学Mingdeng Du团队今年3月统计OpenRouter 318个模型和Epoch AI 3237条记录后发现过去六年token价格整体下降约600倍。经济档模型价格半衰期只有1.10年中档模型1.55年都快过摩尔定律。若只看成本如今的大模型行业根本不像在涨价更像是在经历一场历史罕见的通缩。于是问题来了如果成本在下降账单为何越来越贵很多讨论把企业今天付的两笔钱混为一谈所以永远算不明白这笔账。第一笔钱AI开始真正干活Claude Code修一个Bug并非在聊天框里简单回答问题。它要读取代码仓库、分析依赖关系、调用工具、运行测试、理解报错再把结果送回模型推理。用户最后看到的可能只是几百行代码改动背后却消耗了几十万token。推理模型也是如此行业测算显示一些复杂推理任务里模型内部消耗的token可达最终输出的几十倍甚至上百倍。所以Uber的预算失控未必意味着浪费也可能意味着AI开始真正干活了。过去几年人们习惯把大模型当作搜索引擎、聊天机器人或写作助手。如今越来越多企业将其当作工程师、分析师、运营人员和客服团队使用。任务变复杂了消耗自然会上升。就像买法拉利的人不会抱怨油耗不是不在乎钱而是买法拉利就是为了其性能。如今很多Agent任务也是如此代码审查、复杂运维、金融分析、合同审核等场景中顶级Agent和顶级模型往往绑定。当然可以换一个便宜五倍的模型但结果很可能大打折扣。这部分钱买的是能力并没有白花。第二笔钱塔尖模型的稀缺性如果故事到此结束结论会很简单AI更能干了所以更贵了。但问题恰恰出在这里。过去几年最重要的研究结果表明AI并没有变贵而是在经历前所未有的降价。很多人记住了武汉大学论文里六年降价600倍这组数字真正值得关注的却是那条没有降下来的曲线。论文对模型分层后发现经济档和中档模型都在沿着同一条轨迹下滑能力越来越普及价格越来越接近成本。若故事到此结束AI最终会变成一种标准化商品就像云服务器、电力或带宽。但偏偏有一部分模型不遵守这个规律论文对旗舰模型价格做指数拟合得到的R²只有0.031也就是说降价规律到这里几乎失效。与此同时推理模型相对于普通模型还存在平均31.5倍溢价这不是统计误差而是市场结构。普通能力越来越便宜不可替代的能力却没有。OpenAI提高GPT - 5.5的价格Anthropic通过tokenizer提高Opus 4.7的有效价格都发生在这条曲线之外。于是出现一个有意思的现象同样是token有些正在迅速商品化价格越来越接近成本有些正在迅速硬通货化价格越来越接近稀缺性。这也是GPT - 5.5和DeepSeek可以同时存在且都合理的原因前者卖的是当前最强能力后者卖的是已被验证、正在扩散的能力两者在AI市场中遵循不同的定价原则。塔尖的价值既然顶级模型最终都会扩散今天的GPT - 5.5迟早会变成明天的普通能力为何还有人拼命往塔尖冲因为塔尖最大的价值从来不是卖贵而是定义什么叫先进。汽车行业就是如此一辆5万元的车和一辆500万元的车都能把人从A点送到B点后者更贵但豪车存在的意义不只是让富人消费。ABS、ESP、主动安全、智能驾驶等很多后来成为行业标配的东西最早都出现在最贵的那批车上等技术成熟再进入更大的市场。豪车赚到的钱是一方面更重要的是它定义了行业下一步的走向。AI也是如此最新的架构、最长的上下文、最复杂的推理链、最激进的训练方法都会首先出现在塔尖模型里。它们中的绝大多数会失败少数成功的部分再被蒸馏、压缩、工程化最后进入更便宜的产品。塔尖提价不是为了卖得更贵而是稀缺性和不可替代性本身就是最刚性的价格支撑。只要一个模型代表当前最先进能力其价格就不再完全由成本决定而是由有多少人需要它以及有多少人能够替代它决定。这也是美国前沿模型公司真正捍卫的东西不是某一个版本而是“最先进模型”这个位置本身。中美之争美国以全球AI创新第一策源地自居无论是否认可这个说法至少在当下它仍掌握着最强闭源模型、最强商业化产品和最强融资能力。既然掌握这个位置价格自然不会跟着成本一起跌因为它卖的不是token而是不可替代性。美国前沿收的那笔钱不是利润而是赌注的本金。SpaceX的S - 1招股文件显示Anthropic自2026年5月起向它采购COLOSSUS与COLOSSUS II的算力合约到2029年5月每月最高约12.5亿美元而这只是它供应商名单里的一家。从价格与成本那道缝里挤出来的钱转手投入机房。这种承诺成立的前提是它赌自己手里那点不可替代性未来几年不会崩塌。中国押的也是同一道题只是方向不同。很多人把中国模型理解成低价路线这是一种误读。如果只是低价中国不会出现DeepSeek的百亿美元融资不会出现智谱持续冲击更强编码能力也不会出现腾讯混元结束两年单边降价、重新提高API价格。中国企业同样在争夺塔尖因为没有人愿意永远接受别人的价格锚点。真正的区别在于中国更相信技术扩散。DeepSeek把V4 - Pro永久降到原价四分之一百万token输入输出合计约5.27美元是GPT - 5.5的七分之一、Claude Opus 4.7的六分之一同时推进约100亿美元融资。小米MiMo - V2.5系列永久降价最高降幅99%。火山引擎披露豆包大模型日均token已突破120万亿三个月翻倍。这些动作背后不是简单的价格战而是一种产业判断。过去二十年中国最成功的产业几乎都遵循同一条路径新能源车、动力电池、光伏皆是如此。先追赶最先进技术再把先进技术工程化、规模化、商品化最后把原本属于少数人的能力带进大众市场。AI正在重复这条路径。塔尖固然重要但最大的市场从来不在塔尖。中国赌的是塔尖能力扩散的速度会快于塔尖收租的速度而这道墙现在有多厚没人知道。智谱4月7日开源的GLM - 5.1编程能力达到Claude Opus 4.6的94.6%MIT协议商用零限制训练全程跑华为昇腾、没有一张英伟达卡。今天这场看似在争论token价格的较量争的不是价格而是AI的不可替代性还能维持多久。美国赌的是这道墙足够厚中国赌的是这道墙会越来越薄。等答案揭晓两边的下注里必有一笔成为再也收不回的沉没成本。