视觉大模型遭遇滑铁卢：首个中国古文字OCR评测基准开源

腾讯等机构开源首个覆盖汉字“七体之变”的古文字OCR评测基准，评测显示主流视觉大模型在古文字识别中表现极差，暴露出技术短板

发布时间：2026/05/20 04:06|分类：人工智能

腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院，推出业界首个完整覆盖汉字"七体之变"演化轨迹的中国古文字感知评测基准"Chronicles-OCR"。该数据集由领域专家多层级交叉标注，含2800张高质量图像，针对不同字体采用不同标注方式。基于该基准评测28个主流多模态大语言模型后发现，主流视觉模型在古早字体端到端检测任务中全军覆没，细粒度识别最高准确率仅27.1%，开启推理模式会使表现进一步下降。评测还揭示视觉大模型易识别载体纹理而非微观笔画风格，该基准开源为视觉大模型优化指明方向。

人工智能星知

星知

视觉大模型遭遇滑铁卢：首个中国古文字OCR评测基准开源

最近发布

9.9元解锁无限出图！香蕉 2、Image2免费随便造

让机器人学会番茄炒蛋的"幕后推手"：Genesis AI 开源全栈训练场

AI 互动酿成悲剧：用户起诉 OpenAI，称 ChatGPT 加剧其心理病情

Anthropic 移除 Claude Code 中隐藏的用户代码引发关注