首页 抖音推荐文章正文

科技观察|国家高质量数据集标准体系的特点

抖音推荐 2025年06月27日 22:29 1 admin

高质量数据集是开发和训练人工智能模型的基础,能够提高模型精度与可解释性、减少训练时长,已成为AI模型发展的核心要素。2019年10月十九届四中全会首次提出将数据作为新的生产要素以来,高质量数据集产业正处于高速发展期。国家高质量数据集标准体系的建设,有望在高质量数据集建设及数据价值释放中发挥更大作用。

科技观察|国家高质量数据集标准体系的特点

当前我国高质量数据集标准建设有六方面的特点。

一是顶层驱动,政策密集。国家战略层面高度重视,《关于构建数据基础制度更好发挥数据要素作用的意见》、《数据要素×三年行动计划》等政策文件密集出台。随着数据成为核心生产要素,高质量数据集标准体系建设将成为数字时代的“基础设施”,其影响将渗透至经济、科技、社会的各个层面,是国家数字竞争力的基石,其建设水平将直接决定中国在全球数字经济格局中的地位。

二是体系化构建,覆盖全链条。标准体系设计科学系统,围绕高质量数据集“建、管、用、流”全生命周期,规划了基础通用、关键技术、质量控制、工具平台、流通交易、行业应用、安全保障七大类别、35项具体标准,覆盖了从采集、标注、合成、质量测评到流通交易、安全管理的各个环节。

三是问题导向,聚焦痛点。通过《建设指南》、《分类指南》、《采集方法》、《格式要求》等规范建设流程、统一接口,提升供给效率与一致性来打破行业壁垒、公共数据开放不足等问题以便解决数据供给短板;加速规范数据标注、数据合成、预处理清洗等关键技术,提升数据集质量,来应对技术瓶颈问题;专门设立“流通交易标准”,研制《产品设计规范》、《价值评估》、《交易指南》、《运营管理指南》,破解数据确权、定价、交易难题等来消除流通障碍;通过安全技术、评估、管理规范同步推进,保障数据合规减少安全风险。

四是分层推进,协同发展。构建了“国标(GB/T)—行标—团标(T/)”协同的标准生态。国标定基础框架与核心要求;行标深化行业落地;团标快速响应细分领域需求。国际标准也被纳入参考。

五是质量为核心,评测牵引。将“高质量”作为数据集的核心价值。《质量测评规范(草案)》构建了包含文档完整性、质量合规性、场景适用性三维度及十余项细化指标的综合评测体系,是标准体系落地的关键抓手,旨在“以评促建”。

六是行业牵引,应用落地,《“数据要素×”三年行动计划》涉及的钢铁、医疗、金融等12个领域,成为标准应用的试验田和主战场,针对性研制《行业高质量数据集建设指南》,推动标准与产业深度融合。

高质量数据集标准体系的建设,是国家激活数据要素价值、发展数字经济的关键棋局。其特点是政策强驱动、体系全覆盖、问题导向准、质量为核心、行业接地气。这是数据驱动时代的基础性工程,对科学研究、产业发展、社会治理和国家安全具有深远影响。虽然还处于起步阶段,但因为顶层设计完整,今年计划制定的4项草案抓住了在格式、分类、测评规范方面的关键点,基础工作做好,后来可期。

(大众新闻 袁然 策划 汤代禄)

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动