2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta。据Artificial Analysis评估,该模型智能指数达48分(较前代提升6分),AA全知测试非幻觉率78%,创行业纪录。xAI同步推出带推理功能、不带推理功能及多智能体模式的三种API版本,支持200万个令牌上下文窗口,每百万令牌成本2-6美元,较Grok4显著降低。该模型在未知领域承认“不知道”的频率提升,错误率约五分之一。当前大模型竞争转向推理深度与事实准确性,Grok4.20以“诚实性”“低幻觉率”构建差异化优势,提升了AI在严谨行业的落地潜力,为多智能体协作奠定信息信任基础。