星知

logo
logo
登录

AI编码Agent真实战力大比拼!OpenClaw"小龙虾"排行榜出炉

OpenClaw"小龙虾"排行榜公布大模型编码Agent战力,Claude家族表现亮眼,GPT-5.2排名靠后,为从业者提供参考
发布时间:2026/03/10 04:15|分类:人工智能
AI编码Agent真实战力大比拼!OpenClaw"小龙虾"排行榜出炉
近日,"OpenClaw AI Agent 小龙虾能力排行榜"评测结果在AI圈刷屏,该榜单测试主流大模型在OpenClaw框架下的编码任务成功率,为开发者选AI Agent提供参考。评测采用统一任务集,以自动化检查+LLM智能评审确保结果客观可复现。榜单显示,前三为Gemini3Flash Preview、MiniMax M2.1、Kimi K2.5;Claude家族三款模型成功率破90%,成最大赢家;GPT-5.2仅65.6%成功率,排名落后,DeepSeek V3.2处于中游。这表明参数规模与实际Agent能力并非正相关,框架适配更关键。AIbase表示该榜单值得从业者参考,将持续追踪相关动态。
人工智能星知