星知

logo
logo
登录

百度文心发布PaddleOCR-VL-1.6:准确率破96.33%刷新文档解析SOTA

百度文心推出PaddleOCR-VL-1.6,以96.33%准确率刷新文档解析SOTA,并在复杂真实场景中保持领先,推动多模态文档理解应用落地。
发布时间:2026/06/03 03:19|分类:人工智能
百度文心发布PaddleOCR-VL-1.6:准确率破96.33%刷新文档解析SOTA
百度正式发布文心大模型衍生模型PaddleOCR-VL-1.6。该模型在OmniDocBench v1.6评测中以96.33%的准确率超越Gemini-3-Pro、GPT-5.2及GLM-OCR等主流大模型,刷新文档解析领域SOTA,综合性能位居全球第一。PaddleOCR基于文心大模型训练,支持超100种语言识别,用户覆盖全球170多个国家和地区。PaddleOCR-VL-1.6在保持0.9B轻量化架构的同时,通过模型驱动的数据构建机制与渐进式训练优化,提升了表格、古籍、生僻字、印章、图表等复杂场景的识别能力。在Real5-OmniDocBench真实复杂场景评测中,该模型以93.19%的总指标保持领先,可应对扫描件、弯折、屏幕拍照、光照变化和倾斜文档等难题。由于延续前代架构,企业和开发者可平滑迁移。目前PaddleOCR在GitHub Star数已突破79.2K,超越谷歌Tesseract OCR,新模型已上线官网并开源代码与权重。
人工智能星知