正在阅读:面向高质量数据建机制搭平台,北京人工智能模型语料中心正式上线!

面向高质量数据建机制搭平台,北京人工智能模型语料中心正式上线!

2024-04-24 10:28:49来源:“发展北京”微信公众号 关键词:北京人工智能模型语料中心阅读量:20728

导读:面对大模型企业对高质量数据集的迫切需求,北京市充分发挥数据资源丰富、人工智能发展领先的优势,开展了数据基础制度先行区等有益探索。
  人工智能是发展新质生产力的重要引擎、是引领未来的战略性技术。大模型的发展遵循规模增长定律,即算力、数据等资源的规模越大、质量越高,大模型的智能水平就越强。
 
  面对大模型企业对高质量数据集的迫切需求,北京市充分发挥数据资源丰富、人工智能发展领先的优势,开展了数据基础制度先行区等有益探索。
 
  近期,在国家发展改革委等部门的支持下,北京市发展改革委与人民网、高等教育出版社、国家图书馆、北京广播电视台、海淀区融媒体中心等多家数据单位密切对接、深化合作,通过央地联合、政企合作等方式,加快推动人工智能模型语料中心建设,并于4月20日正式上线数据运营平台,首批约1100TB高质量数据集即将向大模型企业开放,为大模型产业提供更加充沛的数据动力。

  数据如何赋能大模型产业发展?和发改君一起来了解下吧~
 
  以平台为支撑,实现数据聚合管理
 
  数据运营平台包括“开源数据+共享数据+高价值数据”三个子平台,能够支持多种数据汇聚和使用形式,将形成国家级数据汇聚和运营管理能力,为大模型产业发展提供坚实的数据支撑。
 
  高质量数据集呈三大显著特征
 
  发改君了解到,一批高质量数据集也正式在北京人工智能模型语料中心上线。这批高质量数据集具有以下三大特征——
 
  权威准确
 
  从源头上保证信息权威准确,避免大模型学到错误的知识、生成错误的内容。
 
  丰富多元
 
  能够为大模型企业提供亟需的文本数据集以及图片、音频视频等多模态数据集。
 
  知识含量高
 
  涉及新闻传播、医药卫生、现代农业、教育教学等众多专业领域。
 
  下一步,北京市发展改革委将对标国际先进,服务国家战略,不断优化工作机制,拓展数据合作的广度和深度,推动更多高质量数据汇聚,并在价值观和技术层面确保数据安全,为北京大模型产业引领发展提供更丰富、更高质量的数据支撑,加快建设具有全球影响力的人工智能创新高地。
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了