xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

xAI发布Grok4.20Beta大语言模型，非幻觉率78%创行业纪录，以高事实可靠性打造差异化优势

发布时间：2026/03/14 04:27|分类：人工智能

2026年3月12日，xAI正式发布新一代大语言模型Grok4.20Beta。据Artificial Analysis评估，该模型智能指数达48分（较前代提升6分），AA全知测试非幻觉率78%，创行业纪录。xAI同步推出带推理功能、不带推理功能及多智能体模式的三种API版本，支持200万个令牌上下文窗口，每百万令牌成本2-6美元，较Grok4显著降低。该模型在未知领域承认“不知道”的频率提升，错误率约五分之一。当前大模型竞争转向推理深度与事实准确性，Grok4.20以“诚实性”“低幻觉率”构建差异化优势，提升了AI在严谨行业的落地潜力，为多智能体协作奠定信息信任基础。

人工智能星知

星知

xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

最近发布

三星电子单季利润暴增 180 倍：AI 存储独撑全局，手机家电却在亏钱

WorkBuddy重大升级:「人机双写」上线，AI时代的Office来了!

月之暗面Kimi完成F轮超35亿美元融资投后估值350亿美元

月之暗面 Kimi 拿下 35 亿美元 F 轮，估值冲到 350 亿，G 轮已提前起跑

星知

xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

最近发布

三星电子单季利润暴增 180 倍：AI 存储独撑全局，手机家电却在亏钱

WorkBuddy重大升级:「人机双写」上线，AI时代的Office来了!

月之暗面Kimi完成F轮超35亿美元融资 投后估值350亿美元

月之暗面 Kimi 拿下 35 亿美元 F 轮，估值冲到 350 亿，G 轮已提前起跑

月之暗面Kimi完成F轮超35亿美元融资投后估值350亿美元