2026年5月AI模型性能排行:代码能力Claude霸榜,智谱GLM杀入前十
hello小伙伴们大家好啊我是你们的大飞现在AI发展的实在是太快了所以我们不得不每个月进行一次排行榜解读感谢AI给小编赏口饭吃小Tips以下的排行数据主要来自于海外的一些测评机构以最新的榜单为准。AI使用量排行主要统计API的使用总量不包含网页对话这种Google、Claude、OpenAI、DeepSeek在API上面的使用量排名前4符合直觉前者因为足够强大后者因为足够便宜AI多维度排行第一个是聪明程度第二个是反应速度第三个是它的价格对比聪明度 速度OpenAI 遥遥领先基本属于“独占一档”的存在价格OpenAI 同样遥遥领先……毕竟好东西不便宜国产AI智能和速度上稍逊一筹但DeepSeek 和小米的价格低得离谱性价比之王虽然OpenAI也有价格低的选择但模型太傻了下面呢是各个AI在每个细分领域的排名咱们一个个看文本生成长思考在纯文本生成写文章、对话、总结等任务上Claude独占了前四名Google Gemini紧随其后分别在第6名和7名Claude 写出来的东西确实更有“人味儿”而 Google 则在多语言和长上下文中表现更加优秀代码编程Claude 无疑是霸榜的存在了代码编程永远的神但令我感到惊喜的是我们国产的智谱AIGLM竟然在代码生成方面杀进了前十甚至干掉了 OpenAI 小编还真没有使用过智谱AI的模型这次可要去试试了数学推理数学推理一直是AI的“智商检测器”。不仅仅是复杂数学推理也包括我们以前的那种脑筋急转弯50米去洗车要不要开车Google Gemini拿下第一OpenAI和Claude紧随其后。国产的模型又没上榜文生图曾经非常火的Nano Banana已经跌落至第三名了第一名的是GPT-image2但AI在文生图方面还属于起步阶段这个排名可能很快就会发生变化文生视频终于国产模型发力了字节跳动、阿里巴巴通通上榜。Google、OpenAI也是紧随其后文生视频也是起步阶段变化非常快。不过很开心我们国产的模型走到了世界的前列小担忧排行榜看完了但不知道小伙伴们有没有一种感受AI开始“无孔不入”了以前坐公交车上放的是激情澎湃的保健品广告虽然也很烦人但现在全是AI合成的老年旅游宣传。刷短视频十个里头五六个是AI演员、AI短剧、AI配音。连综艺节目的旁白都换成了冷冰冰的AI阅读感觉活在了赛博朋克的世界。小编并不是反对AI但是滥用就是另外一回事了希望我们的发展可以兼顾速度与人文吧你觉得现在的AI是“真香”还是“泛滥”了评论区聊聊