国际首个文本可度量数量信息抽取标准发布 助力非结构化数据规范转化与价值释放

数字经济时代,数据已成为推动创新的重要资源;但全球每天产生的海量非结构化文本数据,其潜在价值长期难以充分释放。近日,国际标准化组织经过三轮国际投票,正式发布ISO 24617-15标准,为此问题提供了系统性的解决方案。当前,医疗电子病历、上市公司财报、电力运行报告、金融审计文本等非结构化数据中,包含大量关于实体属性、数值、计量单位及其复杂关系的关键信息。这些可度量数量信息是大数据分析与智能决策的基础,但在实际提取中长期面临多重挑战:缺乏统一的语义表示规范、实体关系表达复杂、表述存在歧义、计量单位易混淆、特殊数值区间难以准确识别等,限制了数据更利用。

ISO 24617-15标准的发布,不仅标志着中国在数据标准化领域取得重要进展,也为全球非结构化文本数据的价值挖掘提供了关键支撑;随着更多行业加快落地应用,该标准有望深入推动数据驱动型社会建设,为全球数字经济发展提供新的动力。中国在对应的基础领域的持续投入与实践,也将为国际技术治理与标准合作提供更多经验与路径。