千寻智能Spirit v1.6反超英伟达Cosmos 3,靠真实数据闭环3个月融资近50亿!
千寻智能Spirit v1.6反超英伟达Cosmos 36月1日老黄在GTC上花不少篇幅讲物理AI和具身智能发布Cosmos 3。英伟达称其为面向Physical AI的最新前沿、全球首个完全开放的全能模型有视觉推理等能力老黄自豪表示它在全球各大排行榜开放模型中排第一。但仅一天后RoboArena榜单更新千寻智能的Spirit v1.6反超登上全球第一。RoboArena评测机制及意义RoboArena切中机器人基础模型评测核心问题很多模型在仿真环境表现好在真实场景难稳定复现。它可理解为LMArena的具身机器人版本比的是机器人策略在真实世界完成任务的能力。由UC Berkeley、Stanford、NVIDIA等发起相关论文入选CoRL 2025 Oral。其机制有分布式协作、双盲对决、Elo式动态排名、开放评测网络意义是把具身智能评测从「静态跑分」推向「真机对抗」。千寻智能成首个在该「客场」榜单获全球第一的中国企业表明其多任务执行等能力进入全球第一梯队。Spirit v1.6真实任务表现及迭代机制从双盲对比视频看第一组打开笔记本任务Spirit v1.6动作衔接自然快速完成任务Cosmos 3几乎无有效尝试第二组把卡皮巴拉放到盘子里任务Spirit v1.6完成识别等操作虽有短暂调整但整体连贯pi 0.5既未识别目标也未有效抓取。今年稍早Spirit v1.5在RoboChallenge真机评测获第一有不错稳定性。从v1.5到v1.6千寻智能靠持续采集真实场景数据、关注失败点、反馈评测结果到训练和优化的迭代机制在RoboArena完成反超。具身智能模型不同于纯软件模型Spirit v1.6表现说明千寻智能运转起数据闭环。真实世界数据是胜负关键在GTC上黄仁勋强调物理AI数据难获取因互联网视频多为第三人称视角机器人需要第一人称、可行动、可反馈的数据。Cosmos 3目标之一是缓解数据稀缺问题大厂认为模型能力提升依赖构建贴近机器人行动的数据体系。千寻智能更注重真实世界数据沉淀已自研7代数采设备在全国100多城市搭建网络计划2026年沉淀百万小时级数据。其「数据金字塔」底层是大规模真实世界交互数据来源多样中间层是数据工程能力失败数据更有价值上层是模型能力和任务泛化数据规模提升或让任务成功率更稳定。Spirit v1.6成绩验证真实世界数据是具身智能公司关键竞争变量。资本押注千寻智能原因千寻智能3个月完成四轮融资近50亿本轮15亿A轮资金将用于模型迭代、数据基础设施建设和商业落地。融资节奏不常见资本关注其是否形成可持续飞轮真实场景产生数据提升模型能力支撑更多场景落地再产生数据。融资本身不证明技术领先资金用途通常是扩大模型设施、建设数据体系、推进场景部署千寻智能优势集中在这三方面且将商业化作为数据和模型迭代一部分。它与博世合作验证工业场景执行能力与京东合作让Moz机器人进门店服务小墨机器人落地宁德时代产线工作量达人工3倍。不同场景推动模型补齐能力形成商业化「黄金三角」。具身智能竞争走向具身智能竞争从单点模型能力走向系统能力比拼各环节共同构成物理AI落地基础。千寻智能连续表现说明具身智能进入更接近真实应用的验证阶段谁能建立数据闭环、转化场景反馈谁就能在竞争中占主动。物理AI故事才开始千寻智能正走通关键之路。