谷歌Gemini 3.5 Flash表现不佳、成本高且“智力不够”,3.5 Pro能否力挽狂澜?
谷歌Gemini 3.5 Flash遭冷遇距离谷歌的Gemini 3.5 Flash发布已超一周。皮查伊在发布会上称其性能比3.1 Pro强是Agent时代的底座。然而网上评价除速度快外全是缺点输出错误多、啰嗦token消耗量爆炸。谷歌Antigravity负责人瓦伦·莫汉5月25日发帖称已增设Gemini 3.5 Flash (Low) 模型优化资源消耗。据内部测试处理简单任务时该模型比Gemini 3.5 Flash (Medium) 约减少45%的token生成量在软件工程任务上表现优于上一代旗舰模型Gemini 3 Flash (High)。但网友并不买账瓦伦评论区被冷嘲热讽攻占。3.5 Flash成本高、表现差网上对Gemini 3.5 Flash评价一致快但不够好。皮查伊强调模型便宜可现实相反。官方定价虽比Claude Opus 4.7低但完成任务的实际成本高。Artificial Analysis测试显示Gemini 3.5 Flash完成全部任务总成本是Gemini 3 Flash的5.5倍比Gemini 3.1 Pro高出75%甚至比GPT - 5.5 medium还贵。原因在于完成任务的轮次多Flash模型平均每个任务需49轮对话而GPT - 5.5或Opus 4.7约20轮。此外Flash输出啰嗦复杂任务token消耗爆炸还有用户触发使用限制。谷歌还修改了AI Pro订阅额度规则引发用户不满。性能不均衡“智力不够”Benchmark显示Gemini 3.5 Flash在部分榜单表现不错但在综合推理榜上表现难看低于Gemini 3.1 Pro、Claude Opus 4.7和GPT - 5.5等。其记忆方面也有问题虽宣传有最高1M token上下文但测试成绩不佳。Artificial Analysis测试中Flash编程指数得分低于Gemini 3.1 Pro和GPT - 5.5。污染谷歌产品体验谷歌I/O 2026上皮查伊宣布Gemini是全产品宇宙连接层Gemini 3.5 Flash嵌入多数产品。外媒称“Gemini无法避开”其糟糕体验污染了谷歌产品。如AI Overview和AI Mode出现“disregard/ignore/stop”故障多个单词被误判为指令谷歌回应称是AI Overviews自身问题正在修复。3.5 Pro成关键目前Gemini 3.5 Pro还在内部测试官方期待6月推出。谷歌产品负责人称3.5 Pro像项目经理Flash像执行团队。若3.5 Pro表现好谷歌或能挽回局面若表现不佳谷歌在AI领域可能全面溃败。谷歌硬件表现亮眼谷歌2026年Q1财报显示公司收入增长其中谷歌Cloud收入同比增长63%。皮查伊称Cloud增长是“强劲需求”结果即TPU硬件和数据中心卖得好。基于谷歌模型的AI解决方案增长近800%Gemini Enterprise付费月活用户环比增长40%API使用的AI token增长。Cloud的backlog本季度翻番公司预计24个月内完成50%。Anthropic等大客户租用或采购谷歌TPU资源。谷歌还宣布了第八代TPUTPU 8t针对训练目标是goodput超97%TPU 8i针对推理有384MB板载SRAM用更多CPU主机。微软预测2028年将有13亿个Agent投入运行这或是谷歌分设TPU 8t和8i的原因。但Anthropic能用TPU造出好模型谷歌却只拿出Gemini 3.5 Flash。