星知
体验星知
核心优势
产品特点
适用场景
星知大模型
新闻资讯
星知智能体
登录
返回列表
视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源
腾讯等机构开源首个覆盖汉字“七体之变”的古文字OCR评测基准,评测显示主流视觉大模型在古文字识别中表现极差,暴露出技术短板
发布时间:
2026/05/20 04:06
|
分类:
人工智能
腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,推出业界首个完整覆盖汉字"七体之变"演化轨迹的中国古文字感知评测基准"Chronicles-OCR"。该数据集由领域专家多层级交叉标注,含2800张高质量图像,针对不同字体采用不同标注方式。基于该基准评测28个主流多模态大语言模型后发现,主流视觉模型在古早字体端到端检测任务中全军覆没,细粒度识别最高准确率仅27.1%,开启推理模式会使表现进一步下降。评测还揭示视觉大模型易识别载体纹理而非微观笔画风格,该基准开源为视觉大模型优化指明方向。
人工智能
星知
最近发布
中央网信办开设AI乱象举报专区 明确 14 类受理举报问题
2026/06/13
讯飞医疗正式发布星火医疗大模型V3.5
2026/06/13
打通AI应用"最后一公里":阿里云秒悟Meoo CLI正式开源
2026/06/12
拥抱AI办公新范式:塔塔咨询为 5 万员工配备Claude
2026/06/12