百度发布端到端文档智能模型Qianfan-OCR:以40亿参数推动识别解析从“多段式”走向“一体化”

当前,政务服务、金融风控、医疗质控、科研管理等领域正加快数字化转型,但大量信息仍以票据、合同、报表、病历、论文等“图像化文档”形式保存。如何在保证准确率的前提下,将文档中的文字、版式结构与语义关系快速转为可计算、可检索、可审计的数据,已成为企业提升效率、降低合规风险的关键问题。长期以来,行业多依赖传统OCR及后处理方案,但在复杂表格、混合图表、跨栏排版、公式和脚注等场景中,仍容易出现结构信息丢失、语义被切割、误差层层叠加等问题。

此次技术进展说明了我国在人工智能基础研究与工程落地上的持续推进,也显示出科技企业面向真实业务痛点的解决能力;随着数字化转型更深入,文档智能处理将在更多场景中成为关键能力。面向未来,持续加强核心技术攻关并完善产业生态,将有助于我国在该领域保持竞争优势。