Token的战争,华为云不打
作者 | 由仪编辑 | 葛覃过去半年AI云的牌桌上似乎只剩下一种声音Token。Token单位价格的下限不断刷新日均Token调用量不断突破峰值几乎每家云计算或模型厂商的财报会上都会大谈特谈Token消耗量或者MaaS收入仿佛Token规模可以换算成AI云的竞争力。在6月5日举行的华为云INSPIRE创想者大会上华为公司董事、华为云CEO周跃峰就任以来的第一次大型媒体见面会便直接把另一种立场摆到了桌面上。他表示华为云不太在乎Token总量是多少在当前国产化算力正在成长的情况下也不太在乎收入的总量是多少他更愿意看的是每一个Token给生产力、给生活水平真正带来多大的价值。当然了说归说行业内外真正关注的是华为云是被迫转向还是主动选择了另一条赛道梳理华为云的战略转向首先要看清华为云整个结构底层是以昇腾、鲲鹏为代表的国产芯片算力上层是一个个难啃的行业场景解决方案包括医疗、制造等中间厚厚的一层负责把硬件的算力翻译成场景的生产力也就是华为云最新提出的Agentic Infra相关产品和能力。由此看出华为云的骨架和肌理本就和其他云厂商不同以Token为中心的叙事试图把复杂的B端生意简化为标准的单一指标这符合互联网云厂商的熟悉打法先打透价格、做大规模再用流量喂养下一轮迭代。有意思的是在海外的硅谷Tokenmaxxxing火爆了六个月之后同样开始出现另一种声音——Tokenpocalypse。Tokenmaxxxing指的是用尽一切手段尽可能多地使用TokenTokenApocalypse字面上是Token的末日隐含意义是Token正在大幅贬值调用量曲线一路上扬可真正能沉淀下来的结果、能复用的场景资产并没有跟着同步往上走。行业里更多人意识到大家其实是在用一种越发越多、却越来越不值钱的货币去支撑一份看上去越来越大、实则越来越薄的生意。Token本身不再重要重要的是Token背后代表的每一分价值华为云先于绝大多数厂商走上了这条路既有现实条件的约束也是主动找寻的出路。用另一种养料堆出的硅基黑土地理解华为云的最好入口是周跃峰反复提到的那个词——硅基黑土地。在他的定义里这片黑土地最难被模仿的第一层正是底层算力。鲲鹏负责通算、昇腾负责智算操作系统欧拉、智算软件栈CANN全部开源开放构成了一整套全国产化的算力硬件系统今天华为云上跑起来的每一个Token背后都是这套国产硅基在支撑。这条路走得并不轻松周跃峰自己也承认华为公司因为没有办法用别人的算力只能努力让自己的算力持续进步再凭借实打实的效果赢得商业上的认可。华为云没有捷径可走每一次性能提升都得自己往上垒。本次大会发布的AICS灵衢智算集群就是这种垒的最新成果10万卡级集群规模总算力200 EFLOPSToken生成时延压到10毫秒以内千卡每秒吞吐500万Tokens在线服务可用性99.95%。放到行业对照里看区别就更清晰别人家的算力底座是万国牌可以用英伟达以及海外其他厂商的GPU和网络方案华为云这片黑土地只能用国产硅基“泥土”一寸一寸往上堆没有第二个选项。周跃峰也表示自己没有办法构建万国牌的硅基黑土地这正是华为云和别的云公司根本性的不同也是他不愿意去比收入、比规模名次的原因因为对华为云来说那种比较没有意义。在AI卡资源全球紧张、国产化算力正在成长的情况下他不打算参加Token总量竞赛反而把它重新定义为另一件事发展第二个算力平面让AI有更多的技术路线和生态可以选择。这是华为云和这一轮AI云竞赛里其他玩家最根本的分歧别人是在现有的最优解上做规模优化华为云是在为整个产业撑起一条算力路径。华为公司最近发布的韬定律也是这一理念的体现半导体产业基础每往前一步华为云的硅基黑土地才能再厚一寸。硅基黑土地足够的肥沃才能够长出更多的庄稼和参天大树。周跃峰提到它指的不是商业故事是AI产业物理意义上的地基。把算力翻译成生产力需要做什么如果说底层是土地、上层是庄稼那中间这一层就是把水、肥、根系连起来的土壤结构。它不显眼但决定了整片地能不能真的长出东西。华为云一次性发布了多款AI产品它要解决一个核心问题底层自己一点点堆出来的国产硅基怎么才能被上层成百上千个行业场景顺畅地用起来。大模型仍然飞速迭代算力在指数级膨胀在周跃峰看来今天大多数企业自建AI系统的方式注定是被动的很可能部署完就已经落后了华为云希望把这种快消化掉让上层不用感知底层的复杂。例如CCE Volcano Next通智一体化调度引擎通过训推共池、碎片整合把通算和智算混在一起调度资源利用率提升30%以上。新一代ModelArts Next把RL强化学习、机密推理、模型路由、模型矩阵打包成一组能力。值得强调的是华为云在中间层做的另一个选择——开放能开源的尽量开源能解耦的尽量解耦让更多伙伴接入做大国产AI生态。MaaS模型路由已经接入15余款SOTA模型调度精准率超过95%调用成本平均降低20%让企业不需要懂底层算力的脾气就能让大模型越用越聪明。再上面一层是面向智能体的AgentSphere运行底座、智果AgentArts企业级智能体平台以及开源版openJiuwen把门槛降到最低。周跃峰用翻译器来形容码道CodeArts的那句话其实可以推广到整个中间层——它的价值不在于自己有多厚而在于能不能让上面的人和下面的硅基真正对话起来。某种程度上华为云必须做到足够开放才能让更多人对国产AI云这一条路径抱有信心开放到让客户不必担心锁定开放到让开发者敢于把自己的能力沉淀进来开放到让整个生态愿意陪着这片黑土地一起把厚度往上加。华为云可能是AI时代最开放的云。去行业里找那种换不掉的Token虽然Token经济火热但是行业公认Token的粘性比较差标准化的Token是商品用户随时会被低价吸引走。对模型或者云厂商来说要么始终让自己的Token价格最低要么找到那些不容易被替换的Token场景。华为云的选择显然是后者。行业AI梦工厂专区就是华为云找到的答案智慧医疗、具身智能、智能制造、科学计算华为云一次性宣布上线四个专区。周跃峰表示AI面向行业深耕要比toC或者通过APP给个人带来情绪价值难得多需要更多的耐心和更多的投入。但越难的事护城河越深。一旦客户的核心业务跑在某个行业专区里它共享专属的数据集、原子能力、合作伙伴生态这部分Token就不再是商品意义上的Token而是嵌进客户业务流程里的一部分生产力。智慧医疗专区是目前较为成熟的样本全中国看切片的病理医生只有两万多名远远不够绝大多数县域和地市级医院不足以做好病理诊断很多偏远医院由于经验不足病理误诊率较高。瑞金医院联合华为共建的RuiPath大模型沉淀了瑞金大量专家和医生的医疗经验包括上海瑞金、邯郸市中心医院、河北工程大学附属医院、瑞安市人民医院、黔西南州兴义市人民医院、武安市第一人民医院等20余家医院正式入驻其中很多是过去技术红利够不到的非三甲医院。患者不再需要跑到上海排队挂号远程就能共享高水准的医疗能力。在这个场景里每一个Token背后都是一份病理报告、一次确诊和被多争取出来的时间。具身智能专区瞄准的是另一个结构性问题全国300多家具身智能创业公司绝大多数没有能力自建从数据合成、模型训练、仿真验证到部署的整套工具链。华为云这次发布的CloudRobo是全球第一个全流程具身智能开发平台直接搭在公有云上中小创业公司只需要付很少的算力费用就可以在专区里共享数据、模型、仿真和案例。这些专区的共同点是Token被嵌进一条具体的行业流水线里粘性高、可替代性低、价值密度大每一个Token的背后都是一次生产效率的提升是企业能从AI中获得的实实在在的回报。把三层放在一起看华为云这一轮的战略格外清晰它没有用万国牌的硅基去和友商比谁的Token更便宜、谁的调用量更高而是一头扎进国产硅基的笨功夫里把黑土地一寸一寸堆出来又在上面一头扎进具体的行业里去找那些真正能解难题的Token场景中间一层是把这两端紧密连接的完整链路。这是一种现阶段很容易被低估、也很难被复制的打法但预计会成为更多云厂商下半年的叙事。Token的战争华为云不打它在打另一场战争让每一个Token都长在能够创造生产力的行业土壤里。