星知
体验星知
核心优势
产品特点
适用场景
星知大模型
新闻资讯
星知智能体
登录
返回列表
视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源
腾讯等机构开源首个覆盖汉字“七体之变”的古文字OCR评测基准,评测显示主流视觉大模型在古文字识别中表现极差,暴露出技术短板
发布时间:
2026/05/20 04:06
|
分类:
人工智能
腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,推出业界首个完整覆盖汉字"七体之变"演化轨迹的中国古文字感知评测基准"Chronicles-OCR"。该数据集由领域专家多层级交叉标注,含2800张高质量图像,针对不同字体采用不同标注方式。基于该基准评测28个主流多模态大语言模型后发现,主流视觉模型在古早字体端到端检测任务中全军覆没,细粒度识别最高准确率仅27.1%,开启推理模式会使表现进一步下降。评测还揭示视觉大模型易识别载体纹理而非微观笔画风格,该基准开源为视觉大模型优化指明方向。
人工智能
星知
最近发布
9.9元解锁无限出图!香蕉 2、Image2免费随便造
2026/07/04
让机器人学会番茄炒蛋的"幕后推手":Genesis AI 开源全栈训练场
2026/07/04
AI 互动酿成悲剧:用户起诉 OpenAI,称 ChatGPT 加剧其心理病情
2026/07/03
Anthropic 移除 Claude Code 中隐藏的用户代码引发关注
2026/07/03