登录窗口
作者登录 审稿登录 编辑登录 读者登录
订阅 | 旧版入口 | English
 
  • 首页
  • 期刊简介
  • 编委会
  • 作者投稿
  • 订阅指南
  • 联系我们
  • 过刊目录
首页>战略与政策>加快建设人工智能高质量数据集
加快建设人工智能高质量数据集
发布时间:2025-02-10   
   来源:科技日报   作者:王晓明
点击数量:122次

视觉中国供图

当前,人工智能处在快速发展的关键时期,正在重塑经济社会发展模式。2024年中央经济工作会议指出,开展“人工智能 ”行动,培育未来产业。数据作为人工智能发展的三大核心要素之一,是人工智能模型训练的基础要素,也是人工智能模型应用的核心资源,加快建设人工智能高质量数据集,对于推动“人工智能 ”场景落地具有重要意义。

高质量数据集建设存在的问题

高质量数据供给是推动新一代人工智能加快发展的关键要素。当前,面向新一代人工智能的数据供给仍有不足,数据处理专用技术有待进一步突破,数据产业和数据生态有待丰富,高质量数据集的整体规划和支持政策还有待完善。

首先,通用领域、垂直领域以及具身智能领域的高质量数据供给仍有不足。一方面,中文公开数据在质量和数量方面落后于英文数据。另一方面,我国公共数据开放利用程度有待提高,各地开放标准不统一,专门面向人工智能发展的高质量行业数据集仍较匮乏。具身智能领域真实交互数据采集不足,主要原因在于智能机器人与环境的交互数据获取困难且成本高昂,同时,企业采集数据缺乏统一的参照标准。

其次,高质量数据的合成、处理和利用技术亟待提升。利用深度学习和强化学习生成高精确度、多样化合成数据的技术在成熟度和应用范围上急需突破。随着社会自动化和智能化程度的不断提高,对数据处理的要求也不断提升,因此急需针对结构化、半结构化和非结构化数据的处理技术进行迭代优化,进一步提高数据处理效率。

再次,数据主体和商业模式发展尚不成熟。我国缺乏类似美国Databricks和Snowflake“数据 人工智能”模式的高质量数据汇聚和治理主体,具备大规模数据汇聚管理分析能力的公司数量不足。医疗、法律、保险、金融、工业、科研等多个领域的公共数据授权运营主体目前仍在培育中,数据集构建和运营利用的商业模式发展还不够成熟。

最后,高质量数据集的专项规划和支持政策有待完善。我国已出台一系列数据发展相关指引政策,但是面向新一代人工智能模型训练和场景应用的高质量数据集专项规划和支持政策尚未出台,其建设、运营、流通、利用等方面举措有待进一步细化。在数据采集方面,各领域数据缺乏适用的标准规范;在数据使用方面,缺少面向大模型和具身智能模型训练的数据共享和流通促进机制,一定程度上限制了模型能力的快速提升。

多措并举建设高质量数据集

针对当前存在的资源、技术、模式、制度等方面问题,结合新一代人工智能发展的需要,建议发挥政府和市场的协同作用,多措并举推进高质量数据集建设。

一是加快公共数据开放和企业数据流通,建设面向新一代人工智能的高质量数据集。建议形成部门、行业、地区共同参与的协同机制,围绕高质量数据集建设,扩大数据供给范围和规模,完善公共及行业数据标准,加速可信数据空间建设。面向医疗、教育、科研、法律、工业、农业、物流、金融、能源、交通等重点领域建设大数据中心及大模型行业应用创新(工程)中心,打破信息孤岛,构建完备数据生态,构建高质量数据集,提升垂直领域人工智能模型能力。着眼自动驾驶、具身智能等未来产业需求,开放相关公共数据,制定行业数据标准,探索企业间数据流通机制,鼓励企业和研究机构创建高质量行业数据集。

二是围绕建设行业高质量数据集关键技术问题加大攻关力度。面向数据合成和处理,加快开发数据合成、数据治理的关键共性技术;面向数据流通汇聚,大力推广隐私计算、区块链等技术;面向“数据 人工智能”应用模式,着力开发数据管理技术,探索新型模型结构和训练架构。鼓励面向人工智能的数据产品、数据服务企业牵头承担国家重大项目,开展应用基础研究和关键核心技术攻关。推动产学研合作和创新联合体建设,打造数据技术、产品和服务深度融合的新型合作模式。面向重点场景,打造数据技术“测试场”,提供真实数据环境、模拟应用场景,建设中试基地,吸引企业、高校和科研机构参与数据技术的创新和验证,加速新技术推广和应用。

三是引导企业和商业模式创新,构建人工智能数据产业生态。大力培育人工智能数据资源、技术、服务、应用、安全、基础设施等多领域企业,重点建设面向人工智能行业的数据产业创新平台。鼓励企业基于“数据 人工智能”探索多领域商业模式,支持企业与各方合作,打造基于高质量数据集的产业创新链和生态系统。鼓励企业探索大模型和具身智能应用场景,驱动数据产业发展。支持模型应用、模型开发、数据服务、数据产品等相关企业组建创新联合体,开发高质量数据集,发展“数据即服务”“知识即服务”“模型即服务”等新业态。

四是加大人工智能高质量数据集建设政策支持力度。面向新一代人工智能技术开发和应用发展需求,完善数据资源构建体系,培育数据产业,支持数据技术发展,系统推进高质量数据集建设,强化行业应用。统筹中央和地方财政资金、产业引导基金和各类政策性投资,加大对高质量数据集建设的投入。鼓励金融机构创新产品和服务,增加对数据相关企业的融资支持。引导社会资本有序参与人工智能高质量数据集的开发利用。    

(作者系中国科学院科技战略咨询研究院研究员)





推荐文章
  • 油气安全战略与“双碳”战略:关系与路径
    百年变局叠加世纪疫情给全球能源安全敲响警钟,深刻理解能源转型...
  • 2023年中国经济增长速度的预测分析与政策建议
    受新冠肺炎疫情及采取的对应措施等因素的影响,2022年中国经...
  • 《2022研究前沿》——11个大学科领域发展趋势与重点研究问题
    2022年12月,中国科学院科技战略咨询研究院、中国科学院文...
  • 《2022技术聚焦》——20个高影响力专利技术焦点分析解读
    2022年,中国科学院科技战略咨询研究院研制《2022技术聚...
  • 新时代科技强国战略
    科技强国是现代化强国的核心要义,科技现代化是中国式现代化的重...
  • 科技改革十年回顾与未来走向
    文章从科技宏观治理、攻关应急体制机制、科研人员全职业生涯、科...
专题
  • 专题:生物制造——回顾与展望
  • 专题:智慧农业的发展与思考
  • 专题:人工智能与公共安全
  • 专题:纪念中国科学院学部成立70周年
  • 专题:人工智能与未来社会
  • 专题:科技创新与产业创新深度融合
  • 专题:高端制造的现状与未来思考
  • 专题:国家关键技术战略的认识与对策
  • 专题:大力推进科研范式变革
  • 专题:国家公园现代化治理体系建设
  • 专题报道
  • 专题:新时期重大科技基础设施建设理论与实践
  • 专题:“十五五”区域协调发展与国土空间发展格局优化
  • 专题报道
  • 专题:黄河流域科技创新研究与对策
  • 专题:科技创新引领现代化产业体系建设
  • 专题:前沿科技伦理风险及其治理
  • 专题:中国能源发展战略研究
  • 专题:科技预算绩效评价的理论与实践
  • 专题:中国生态文明建设进展与成效
  • 专题:技术经济安全理论与实践
  • 专题:开放科学发展趋势与治理策略
  • 专题:综合防治荒漠化 打赢“三北”攻坚战
  • 专题:科技创新支撑“一带一路”高质量发展
  • 专题:主要“一带一路”共建国家气候变化影响和适应研究
  • 专题:跨越“中等技术陷阱”与实现中国式现代化
  • 专题:构建自立自强的信息技术体系
  • 专题:新材料科学发展战略思考与创新实践
  • 专题:智库双螺旋法应用及实证研究
  • 专题:海洋观测探测与安全保障技术
  • 专题:中国空间科学——战略与突破
  • 专题:科技与金融融合逻辑与建议
  • 专题:数据要素市场化配置问题探究
  • 专题:中国战略性关键矿产资源安全研究
  • 专题:“双循环”格局下中国区域创新
  • 专题:哲学助力科技创新
  • 专题:绿色“一带一路”建设的挑战与应对
  • 专题:服务碳中和目标的海洋负排放技术路径与战略思考
  • 专题:哲学与科学
  • 专题:生物多样性保护与生态文明
  • 专题:生态草牧业高质量发展
  • 专题:建党百年·青年说
  • 专题:碳中和目标背景下的能源转型
  • 专题:科技助力“黑土粮仓”建设
  • 专题:科技伦理治理的战略研究
  • 专题:有组织的基础研究
  • 专题:新时代科学基金运行体系与管理研究
  • 专题:融合科学与开放数据
  • 专题:黄河流域生态保护和高质量发展
  • 专题:科技领航黄河三角洲农业高新技术产业示范区高质量发展
  • 专题:湾区比较研究
  • 专题:荒漠化治理与可持续发展
  • 专题:“十四五”规划的区域战略与空间治理
  • 专题:长江经济带高质量发展
  • 专题:公共卫生应急体系建设的战略思考
  • 专题:环境污染与人体健康
  • 专题:科技评价——实践与展望
  • 专题:畜牧业可持续发展
  • 专题:水声信号处理和声呐技术·发展现状和展望
  • 专题:中国高性能计算发展战略
  • 专题:行星科学——新学科·新梦想
  • 专题:国际新形势下知识产权保护研究
  • 专题:中国科技70年·回顾与思考
  • 专题:战略生物资源的保护与利用
  • 专题:2030年可持续发展目标的理论、指标与实践
  • 专题:土壤与可持续发展
  • 专题:知识产权转化与运营
  • 专题:“丝绸之路经济带”中亚能源地缘配置与国家安全
  • 专题:科学普及问题政策研究
  • 专题:分子模块设计育种
  • 专题:环境微塑料污染与管控策略
  • 专题:中国科学院·改革开放四十年
  • 专题:传统工艺的认知与振兴
  • 专题:国家生态保护与建设工程生态成效评估
  • 专题:心理学与社会治理
  • 专题:大气灰霾追因与控制
  • 专题:中国微生物组计划
  • 专题:“一带一路”建设对策研究
  • 专题:土壤微生物组
  • 专题:建成遗产
  • 专题:作物病虫害的导向性防控
  • 专题:青藏高原综合科学研究进展
  • 专题:气候变化的全球治理
  • 专题:科技促进农业供给侧结构性改革
  • 专题:生物传感与器官芯片
  • 专题:“十三五”区域发展战略研究
  • 专题:分布式可再生能源和智能微网
  • 专题:2015/2016超级厄尔尼诺事件研究
  • 专题:精准扶贫重大战略与政策研究
  • 专题: 生物安全——新问题、新挑战
  • 专题:绿色设计
  • 专题:空间科技助力“一带一路”建设
  • 专题:信息化变革科研模式
  • 专题:“一带一路”生态风险与地缘战略
  • 专题:脑科学与类脑智能
  • 专题:现代智库建设及其思想传播
  • 专题:知识产权强国建设
  • 专题:海岸科学与可持续发展
  • 专题:心理健康研究与服务
  • 专题:当代国家凝聚力研究
  • 专题:海洋科学发展现状与展望
  • 专题:云计算创新发展战略
  • 专题:在线社交网络分析理论和技术
  • 专题:西藏经济社会与科技协同发展
  • 专题:土壤与生态环境安全
  • 专题:可持续发展从行动走向科学
  • 专题:创新发展政策研究
  • 专题:土壤与可持续发
  • 专题:落实全面深化改革的科技思考
  • 专题:生物计算机研究进展
  • 专题:科教国际化发展战略
  • 专题:互联网产业发展战略
  • 专题:标准化发展战略
  • 专题:土壤重金属污染治理
  • 专题:可持续发展的难点与热点
  • 专题:生态系统服务与评估
  • 专题:知识产权战略与创新驱动发展
  • 专题:我国空间科学发展的挑战和机遇
  • 专题:知识产权的法制保障
  • 专题:城镇化战略研究
  • 专题:现代农业
  • 专题:大气灰霾追因与控制
  • 专题:知识产权管理
  • 专题:科研信息化
  • 专题:农业物联网
  • 专题:国家创新平台建设
 
 
您是第34755253位访问者!
1996-2021 中国科学院版本所有 备案序号: 京ICP备05002857
地址:北京三里河路52号 邮编 100864 Email:bulletin@cashq.ac.cn
技术支持:北京勤云科技发展有限公司