星知
体验星知
核心优势
产品特点
适用场景
星知大模型
新闻资讯
星知智能体
登录
返回列表
视觉大模型遭遇滑铁卢:首个中国古文字OCR评测基准开源
腾讯等机构开源首个覆盖汉字“七体之变”的古文字OCR评测基准,评测显示主流视觉大模型在古文字识别中表现极差,暴露出技术短板
发布时间:
2026/05/20 04:06
|
分类:
人工智能
腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院,推出业界首个完整覆盖汉字"七体之变"演化轨迹的中国古文字感知评测基准"Chronicles-OCR"。该数据集由领域专家多层级交叉标注,含2800张高质量图像,针对不同字体采用不同标注方式。基于该基准评测28个主流多模态大语言模型后发现,主流视觉模型在古早字体端到端检测任务中全军覆没,细粒度识别最高准确率仅27.1%,开启推理模式会使表现进一步下降。评测还揭示视觉大模型易识别载体纹理而非微观笔画风格,该基准开源为视觉大模型优化指明方向。
人工智能
星知
最近发布
Google AI Studio 移动应用正式登陆 Google Play,支持预注册
2026/05/20
千问APP深度接入国家药监局数据,上线数百万份药品及器械权威信息
2026/05/16
xAI 发布全新CLI工具Grok Build,助力开发者编码更高效!
2026/05/16
山姆·奥尔特曼深陷利益冲突质疑:在多家 OpenAI 合作伙伴中持股超 20 亿美元
2026/05/15