星知

logo
logo
登录

视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源

腾讯等机构开源首个覆盖汉字“七体之变”的古文字OCR评测基准,评测显示主流视觉大模型在古文字识别中表现极差,暴露出技术短板
发布时间:2026/05/20 04:06|分类:人工智能
视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源
腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,推出业界首个完整覆盖汉字"七体之变"演化轨迹的中国古文字感知评测基准"Chronicles-OCR"。该数据集由领域专家多层级交叉标注,含2800张高质量图像,针对不同字体采用不同标注方式。基于该基准评测28个主流多模态大语言模型后发现,主流视觉模型在古早字体端到端检测任务中全军覆没,细粒度识别最高准确率仅27.1%,开启推理模式会使表现进一步下降。评测还揭示视觉大模型易识别载体纹理而非微观笔画风格,该基准开源为视觉大模型优化指明方向。
人工智能星知