正在阅读:大力发展数据标注产业 推动我国人工智能创新发展

大力发展数据标注产业 推动我国人工智能创新发展

2025-01-17 08:22:37来源:国家数据局 关键词:数据标注人工智能阅读量:22673

导读:人工智能是新一轮科技革命和产业变革的重要驱动力量。数据标注是对原始数据进行采集、清洗、分类、标记、质量检验等专业数据治理活动,能有效提升数据供给质量,是人工智能发展的关键环节。大力发展数据标注产业,对推动人工智能创新发展、带动大学生就业和促进数字经济高质量发展具有重大意义。
  人工智能是新一轮科技革命和产业变革的重要驱动力量。数据标注是对原始数据进行采集、清洗、分类、标记、质量检验等专业数据治理活动,能有效提升数据供给质量,是人工智能发展的关键环节。大力发展数据标注产业,对推动人工智能创新发展、带动大学生就业和促进数字经济高质量发展具有重大意义。
 
  01
 
  发展数据标注产业的重大意义
 
  (一)数据标注是提升数据供给质量的关键环节,是提升人工智能产业竞争力的先手棋
 
  大模型已成为中美科技竞争的制高点,数据供给质量决定了模型的基础能力。当前,全球主流基础大模型,中文语料仅占全部语料的1%,高质量中文数据成为制约我国基础大模型能力的瓶颈。训练一个领先的大模型,需要数百万甚至数千万条标注数据。数据标注发展水平成为决定中美人工智能胜负的关键因素。美国在数据标注领域投入巨大,培育了一批数据标注独角兽企业,产业迅速发展。例如,OpenAI在训练GPT系列模型时,投入数千人力和数亿资金进行数据标注,高质量语料集炼就了全球最好性能基础大模型。相比之下,我国虽是全球第二大数据资源国,但数据质量不高,开发利用比例低。全面提升中文语料质量,成为破解我国大模型发展和提升人工智能产业竞争力的关键环节。
 
  (二)数据标注是充分释放数据要素价值的前提条件,是数据要素价值化的必选项
 
  我国是全球第一个将数据资源作为核心生产要素的国家,加快数据要素市场化配置,发挥数据的倍增、叠加、放大效应,是实现数据要素价值赋能经济创新发展的关键。我国是数据资源大国,但不是数据资源强国。2023年,我国数据资源32ZB(泽字节),保存数据仅有2.9%,数据留存率远低于发达国家水平。数据质量低,大量数据被浪费,成为制约我国数据资源价值发挥的瓶颈。数据标注能为机器提供高质量的数据,赋能机器学习、深度学习等人工智能算法的训练,从而实现数据价值转化。以医疗领域为例,通过对大量医疗影像数据进行标注,可以训练出精准的疾病诊断模型,提高医疗诊断的准确性和效率,为患者提供更好的医疗服务。目前,标注数据已广泛应用于生成式人工智能、自动驾驶、电子商务、精准医疗、智能制造等智能场景应用,是数据要素化的必选项。
 
  (三)数据标注产业逐步向智能化、知识化和专业化迈进,是解决大学生就业的有效路径
 
  随着人工智能从通用领域向专业领域演进,数据标注对专业性、技术性的人才需求日益增长,数据标注产业也从劳动密集型,逐步向知识密集型转变,为大学生创造了数百万就业岗位。比如,美国从事数据标注的岗位超过30万,德国最大的数据标注公司Clickworker全球雇佣了120万标注员,印度到2030年数据标注人才的需求也将到100万。我国各地发展的数据标注基地,也对拉动大学生就业产生了显著效果。比如,日照数据标注基地,2024年从业人员突破1.1万人。国内大型互联网公司在全国数据标注基地人员都超过了数万人。通过发展数据标注产业,能够有效缓解大学生就业压力,促进人才培养与产业发展的良性互动。
 
  (四)发达国家纷纷布局数据标注产业,使之成为数字经济发展的基础性、战略性产业
 
  美国、德国、英国、印度等国家和地区纷纷将数据标注产业作为数字经济发展的基础性、战略性产业,支持数据标注产业发展。美国是数据标注产业发展的领航者,通过政府战略、企业创新、产业领先等方面,全方位推动了数据标注服务的高质量发展。特别是前沿技术的深度融合应用上。欧盟则通过构建“欧洲共同数据空间”和推动数据相关法案,整合了工业、绿色协议、移动、卫生、金融、能源、农业、公共行政、技能等多个战略性行业和领域的数据,试图构建欧洲统一数据市场并大力发展数据标注产业。印度凭借庞大的低成本数字人才优势,吸引全球科技巨头投资,大力发展数据标注产业,成为全球重要的数据标注基地。
 
  02
 
  推动我国数据标注产业发展的思路与重点
 
  一是加快发展一批数据标注基地,培育壮大市场主体。今年5月,国家数据局公布首批全国数据标注基地建设城市名单,通过推动数据标注基地建设,以点带面大力发展数据标注产业,激发行业发展活力。以国家数据标注基地试点为抓手,围绕技术创新、行业赋能、生态培育、标注应用、人才就业和安全发展等六个方面做好试点,探索推进数据标注产业发展的最优路径。另外,通过加大财税政策支持力度、完善数据标注基础设施建设、制定行业标准规范、鼓励技术创新与应用、强化人才培养与引进等措施的实施,培育和壮大市场主体。
 
  二是鼓励数据标注核心技术研发,提升数据标注水平。通过国家重点研发专项,加大对人工智能技术在标注技术研发投入。加快数据标注技术研发费用纳入研发加计扣除,鼓励企业加快科技创新投入。重点布局跨语言、跨领域、跨模态语义对齐、4D标注、大模型标注、数据合成等标注核心技术攻关项目。支持研发专家标注、多模态标注、众包标注、标注审查、质量评估等智能化高端化工具,提升数据标注科技水平。
 
  三是围绕数据标注关键环节,制定数据标注标准。构建数据标注标准框架体系,加快制定数据标注的国家标准和行业标准,明确标注质量、流程、技术等方面的要求。建立健全数据标注标准实施与监督机制,促进协同创新。加强对数据标注企业和项目的监督和检查。
 
  四是加大数据标注人才培养,提升人才专业化素养。加强职业教育和培训体系建设,支持高校和职业院校开设数据标注相关专业和课程。推动企业与教育机构合作,共建实训基地和培训中心,培养具备专业技能和职业素养的数据标注人才。制定吸引和留住高层次人才的政策措施,促进数据标注领域的国际交流与人才合作。
 
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

  • 全域人工智能之城建设驶入快车道

    市科委、中关村管委会,市经济和信息化局,市发展改革委,市政务和数据局,市卫生健康委,北京经开区管委会领导出席,来自各央国企、研究机构,及京内外近500家人工智能上下游生态企业与会。
    人工智能中国智造
    2025-04-30 09:49:19
  • AI已经成为人形机器人最大的瓶颈?

    在看似繁荣的表象下,行业共识正在逐渐浮现:人工智能(AI)技术的滞后,已成为人形机器人实现真正智能化的最大瓶颈。
    人形机器人人工智能
    2025-04-28 15:32:08
  • 从“原子”到算法!人工智能领域的“元素周期表”诞生

    研究团队发现,处于同一“主族“的算法(如支持向量机与核方法)具有相似的数学内核,而位于相同“周期“的算法(如决策树与随机森林)则共享相近的泛化能力图谱。
    人工智能计算机科学
    2025-04-27 17:01:21
  • 宾利发布突破性人工智能皮革检测技术

    人工智能皮革检测系统并不能完全取代宾利训练有素的工匠的技艺。通过自动化人工检测流程,该系统能够提供最高品质的皮革,工匠们可以用它来打造精致的手工缝制细节。
    人工智能皮革检测技术
    2025-04-27 14:42:55
  • 早报|深圳大学人工智能学院正式揭牌成立;SK海力士完成96GB CXL内存模块验证

    深圳大学人工智能学院正式揭牌成立,学院建设基础学科研究中心和算力平台,与腾讯云共建产业学院;SK海力士宣布,其基于CXL 2.0标准的DDR5 96GB内存模块已通过客户验证......
    人工智能内存模块数据传输设备
    2025-04-23 10:41:12
  • 宝马押宝人工智能,能赌赢吗?

    宝马在电池续航方面也取得了显著进展,宝马第六代动力电池技术搭载大圆柱电芯,能量密度提升至300Wh/kg,支持15分钟内完成80%电量快充。
    宝马人工智能
    2025-04-16 14:58:14
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了