正在阅读:谷歌在化学发力 应用机器学习技术预测分子性质

谷歌在化学发力 应用机器学习技术预测分子性质

2017-04-19 09:44:57来源:雷锋网 编辑:沐子飞 关键词:机器学习数据谷歌阅读量:32673

导读:近,机器学习在化学领域的应用有很大进展,特别是化学搜索问题,从药物筛选、电池设计到OLEDs设计,催化剂的发现。
  【中国智能制造网 企业动态】近,机器学习在化学领域的应用有很大进展,特别是化学搜索问题,从药物筛选、电池设计到OLEDs设计,催化剂的发现。 历史上化学家使用薛定谔方程做数值近似来解决化学检索问题,如使用密度泛函理论(DFT),然而近似值的计算成本限制了搜索的规模。

谷歌在化学发力 应用机器学习技术预测分子性质
 
  为了能够扩大搜索能力,已有几个研究小组使用DFT生成的训练数据,创建ML模型来预测化学性质,例如Matthias Rupp等用机器学习模型来预测各种有机分子的原子化能,J?rg Behler 和 Michele Parrinello引入DFT势能面的一种新的神经网络表征。在这些工作的基础之上,谷歌研究院在QM9基准数据集(配有DFT计算的电子,热力学和振动性质的分子集合)上应用了各种机器学习方法。
 
  谷歌研究院发布了两篇论文,介绍了他们在这一领域的研究,研究工作由Google Brain团队,Google Accelerated Science团队,DeepMind和巴塞尔大学合作完成。 篇论文《Fast machine learning models of electronic and energetic properties consistently reach approximation errors better than DFT accuracy》调查了回归分子和分子表征的选择对快速机器学习模型的影响,模型用于构建有机分子的十三个基态电子性质,每个回归/表征/性质组合的性能通过学习曲线评估,该曲线描绘近似误差,以此作为训练集大小的函数。论文在QM9基准数据集上测试了多种机器学习方法,并集中改进有希望的深层神经网络模型。
 
  第二篇论文《Neural Message Passing for Quantum Chemistry》描述了一种称为消息传递神经网络(MPNN)的模型族,将其抽象地定义为包含很多对图形对称性具有不变性的神经网络模型。研究团队在MPNN模型族中开发了新变体,性能明显优于QM9基准测试的所有基准测试方法,另外某些目标的性能改进了近四倍。
 
  从机器学习的角度来看,分子数据之所以有趣,原因之一是一个分子的自然表征以原子作为边界的结点和键。能够利用数据中固有对称性的模型更容易泛化,这很容易理解,卷积神经网络在图像识别上之所以成功,一部分原因是模型能够记住图像数据中的一些不变性知识,比如把一种图片中的狗挪到图片左边还是一张狗的照片)。 图形对称性这一固有特征是机器学习处理图像数据非常理想的性质,在这领域也有许多有趣的研究,例如Yujia Li等研究了结构化图片的特征学习技巧,David Duvenaud等应用图像神经网络学习分子指纹信息,Steven Kearnes等提出一种机器学习模型用于无向图的学习。尽管这一领域已有所进展,谷歌研究院希望找到化学(和其他)应用模型的佳版本,并找出文献中提到的不同模型之间的联系。
 
  谷歌研究院提出的MPNN模型提高了QM9数据集任务(预测所有13种化学性质)的好性能,在这个特定的数据集上,他们的模型可以准确地预测13种性质中的11个,这样的预测性能已经足够准确,能对化学家未来的应用有帮助。另外,此模型比使用DFT模拟要快30万倍。但是在MPNN模型走向实际应用之前还有很多工作要做。实际上,MPNN模型必须应用于比QM9数据更多样化的分子集合(例如数目更大,变化更大的重原子集合)。当然,即使有了更真实的数据集,模型的泛化性能还是很差。克服以上两个挑战需要解决机器学习研究的核心问题,例如泛化。
 
  预测分子性质是一个非常重要的问题,它既是先进的机器学习技术的应用场景,也为机器学习带来了非常有趣的基础研究课题。后,分子性质的预测有助于造福人类的新药物和材料的设计。谷歌科学家们认为传播研究成果,帮助其他研究者学习机器学习应用都是及其重要的。
 
  原标题:谷歌研究院在化学发力:应用机器学习技术预测分子性质
我要评论
  • 数字经济民营企业座谈会在福州召开

    国家数据局将深入贯彻党中央、国务院决策部署,强化数据要素保障,深化数据资源开发利用和开放共享,推动科技创新和产业创新深度融合,打造具有国际竞争力的数字产业集群,更好激发数字经济创新活力。
    数字经济数据
    2025-05-08 09:57:33
  • 国家数据局综合司关于征集数据基础设施建设优秀案例的通知

    为落实《国家数据基础设施建设指引》(简称《建设指引》)工作部署,加快推进数据基础设施建设,现组织征集数据基础设施建设优秀案例,总结数据基础设施建设经验,遴选推广先进做法,供各方借鉴参考。
    数据基础设施
    2025-04-28 10:13:06
  • 以高质量数据促进人工智能发展 国家数据局将开展四方面工作

    近期人工智能技术发展出现新的进展,引发全球广泛关注。这背后,离不开算法、算力、数据的协同创新。国家数据局局长刘烈宏说,高质量数据与人工智能的结合,将会进一步发挥数据和人工智能的倍增效应。
    人工智能数据
    2025-03-30 13:52:34
  • AI长眼睛了!谷歌推出Gemini实时视频功能

    谷歌已正式在Gemini Live平台推出崭新的AI功能,此功能赋予AI“视觉”,能直接查看用户设备屏幕或手机摄像头的画面,并即刻回应用户的查询。
    谷歌Gemini Live平台AI功能
    2025-03-24 10:28:03
  • 烟台:数据跨部门调用 “e拍通”跑出改革加速度

    山东坚持分步实施、有序推进,在全省范围大力推行“免证办事”“一码通行”,凡是通过电子证照、数据共享可以获取的信息,不再要求企业和群众提供相应材料。
    电子证照数据
    2025-03-11 11:45:10
  • 聚焦物流行业发展问题 开展物流数据开放互联试点工作

    随着数字经济时代的到来,物流行业正经历着变革。数据作为新的生产要素,正在重塑物流行业的运营模式和价值链。物流业数据融合是指将来自不同来源、不同格式的物流数据进行整合、处理和分析,以提取有价值的信息和知识的过程。
    物流行业数据
    2025-02-20 10:24:45
版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了