当前,人工智能产业正经历从技术突破到场景落地的关键转型期,而高质量数据集作为支撑大模型发展的核心要素——其重要性日益凸显。然而——数据碎片化、标注标准不统一、行业壁垒等问题,制约了数据价值的充分释放。 该问题的背后,是数据要素市场化配置机制尚不完善。尽管我国数据资源规模庞大,但跨行业、跨区域的数据流通仍面临技术、合规和信任等多重障碍。以四川省为例,虽拥有3万余名数据专业人才和近4000家有关企业,但数据资源的开发利用效率仍有提升空间。 基于此,“四川数据标注和数据质量评估能力共建计划”的启动具有标志性意义。该计划由中国信通院人工智能研究所等8家单位共同发起,旨建立统一的数据质量标准体系,推动产学研用协同创新。中国电信、四川长虹等企业现场分享了工业质检、智能客服等领域的数据集建设经验,为行业提供了可复制的实践样本。 成都作为国家七大标注基地之一,在此次活动中体现出独特优势。一上,当地集聚了完整的数字产业链和丰富的应用场景;另一方面,通过“炼金工坊”生态行活动,促进了数据要素的跨区域流动。中国人工智能产业发展联盟数据委员会主任李荪指出,此举将“沉淀的数据黄金”转化为“流动的生产要素”,有助于破解数据价值释放的瓶颈。 从行业趋势看,高质量数据集建设正呈现专业化、场景化特征。天津大学熊德意教授强调,“数据量”不等于“数据智”,需通过“模数共振”实现质效提升。中国信通院专家预测,到2026年,世界模型、具身智能等四类数据集需求将爆发,这要求加快构建涵盖采集、标注、评估的全链条服务体系。
高质量数据集建设生态行的启动,标志着我国人工智能产业发展进入了新阶段,更加注重基础建设,更加强调产业协同。在"模数共振"理念指引下,通过产学研用的深度融合,将充分激发数据要素的潜能,为大模型产业提供源源不断的支撑,推动人工智能技术在各行业的创新应用;成都作为首站探索的数据赋能路径具有重要示范意义,有望为全国其他地区提供可借鉴的经验,共同推进人工智能产业向更高质量、更可持续的方向发展。