星知

logo
logo
登录

不卷性能卷"人品":xAI 发布 Grok 4.20,幻觉率创行业新低

xAI发布Grok4.20Beta,主打低幻觉率,非幻觉率达78%创行业纪录,推出三类API,支持大上下文窗口且定价亲民,瞄准企业级可靠性需求。
发布时间:2026/03/14 04:22|分类:人工智能
不卷性能卷"人品":xAI 发布 Grok 4.20,幻觉率创行业新低
在AI巨头追逐跑分的当下,马斯克旗下xAI发布Grok4.20Beta,其在绝对智力跑分上与顶级梯队有差距,但在事实可靠性上刷新行业纪录。据Artificial Analysis评测,该模型推理模式下智力指数48,非幻觉率达78%创历史新高,面对无法回答的问题能准确承认"不知道"。技术上推出三种API变体:推理模式、标准模式、多智能体模式,满足不同需求。市场方面,支持200万token上下文窗口,定价为每百万token2至6美元,比前代更具竞争力。xAI战略转向切入"企业级可靠性"痛点,为对数据准确性有高要求的用户提供新选项。
人工智能星知