星知

logo
logo
登录

xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录

xAI发布Grok4.20Beta大语言模型,非幻觉率78%创行业纪录,以高事实可靠性打造差异化优势
发布时间:2026/03/14 04:27|分类:人工智能
xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录
2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta。据Artificial Analysis评估,该模型智能指数达48分(较前代提升6分),AA全知测试非幻觉率78%,创行业纪录。xAI同步推出带推理功能、不带推理功能及多智能体模式的三种API版本,支持200万个令牌上下文窗口,每百万令牌成本2-6美元,较Grok4显著降低。该模型在未知领域承认“不知道”的频率提升,错误率约五分之一。当前大模型竞争转向推理深度与事实准确性,Grok4.20以“诚实性”“低幻觉率”构建差异化优势,提升了AI在严谨行业的落地潜力,为多智能体协作奠定信息信任基础。
人工智能星知