正在阅读:阿里联手中科院研发“听音识人”技术被CVPR收录

阿里联手中科院研发“听音识人”技术被CVPR收录

2021-03-25 09:18:16来源:TechWeb 关键词:听音识人技术语音技术阅读量:22945

导读:据阿里安全图灵实验室资深算法专家华棠介绍,该技术后续将在内容安全和账户安全领域探索应用,对抗伪造类视频攻击,保护用户财产和信息安全。
  近日,中科院和阿里安全的研究者让AI掌握通过声音找到“主人”的任务。经验证,相较于人类67%的正确率,AI的准确率接近90%。在“1对N”的匹配实验中,AI还能对声音归属人脸的“可能性”进行排序。
 
  该技术是一种自适应的学习框架,用来挖掘和学习人脸与声音的潜在联系,该论文研究成果随即也被CVPR 2021接收。
 
  现有研究表明,人脸和声音受到年龄、性别、生理结构、语言习惯等共同因素的影响,两者的联系强烈而复杂多样。该研究第一作者、中科院计算所博士研究生温佩松介绍,中科院和阿里安全的研究团队将公开数据集中两种类型的数据在共享空间中表示,从而达到跨模态匹配的目的,在学习策略上利用了数据集的局部和全局信息,提高了模型的学习效率和效果。
 
  通俗来看,即声音可能是音频格式,人脸是图片格式,两类信息以不同的格式存储,难以比较,所以研究者将声音和人脸“翻译”成了同一种格式的信息,让AI模型可以对两种信息之间的关联自行学习。AI学会了两种信息的关联性之后,就能帮声音找到人脸,或者帮人脸找到声音。因此,AI的这项技能不仅可以“听音识人”,还能“见人知声”。
 
  温佩松介绍,该研究进行了三类实验,第一种,给定一段声音和仅含有一张正确人脸的若干张人脸图片,AI匹配声音和人脸的正确率最高可达87.2%;第二种,给定一段声音和一张人脸,询问AI这是否属于同一个人,准确率最高可达87.2%;第三种,给定一段声音和含有若干张正确人脸的图片,要求AI把所有人脸排序,使得正确的人脸尽可能靠前,AI也能准确完成任务。该实验在公开测试集上一共测试了20076张人脸和21850段音频,AI的表现都令人惊喜。
 
  在相同的任务上,如果待鉴别对象不限制性别,人类判断的准确率达81.3%,在限制性别的情况下,准确率仅为57.1%,性别因素对AI的影响却非常小,准确率依然如上述结果,高于人类。
 
  据阿里安全图灵实验室资深算法专家华棠介绍,该技术后续将在内容安全和账户安全领域探索应用,对抗伪造类视频攻击,保护用户财产和信息安全。“有些人利用伪造视频试图骗过认证系统,AI的这项技能将进一步验证声音与相应真人是否匹配,防范欺诈,守护安全。”华棠说,这也是让AI在提升安全水位上有更多用武之地。
 
  (原标题:阿里联手中科院研发“听音识人”技术被CVPR收录)
我要评论
文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

版权与免责声明:

凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。

本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。

不想错过行业资讯?

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

推荐产品/PRODUCT 更多
智造商城:

PLC工控机嵌入式系统工业以太网工业软件金属加工机械包装机械工程机械仓储物流环保设备化工设备分析仪器工业机器人3D打印设备生物识别传感器电机电线电缆输配电设备电子元器件更多

我要投稿
  • 投稿请发送邮件至:(邮件标题请备注“投稿”)1271141964.qq.com
  • 联系电话0571-89719789
工业4.0时代智能制造领域“互联网+”服务平台
智能制造网APP

功能丰富 实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号:gkzhan

打开抖音 搜索页扫一扫

视频号

智能制造网

公众号:智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID:gkzhan2006

打开快手 扫一扫关注
意见反馈
我要投稿
我知道了