让AI模仿人类的学习方式,结果会怎样?
8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大技术榜单。据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模式,多方位提升了机器的语言理解能力,部分能力甚至已超越人类。目前,这些技术均已大规模应用于阅读理解、机器翻译、人机交互等场景。
据悉,过去几年,AI在图像识别、语音识别等方面已逐步超越人类水平,但在复杂文本语义的理解上,AI与人类尚有差距,其主要原因就是传统AI学习文本知识效率较低。
为此,业界提出了一种模仿人类的学习思路,即先让AI在大规模的网页和书籍文字中进行训练,学习基本的词法、语法和语义知识,然后再在固定领域内的文本上进行训练,学习领域专有知识。
这一思想就是预训练语言模型的核心创新。自Google提出模仿人类注意力机制的BERT模型以来,预训练语言模型已成为NLP领域的热点研究方向。
达摩院早在2018年就开始布局通用的预训练语言模型,并逐渐将该思路拓展到了多语言、多模态、结构化和篇章文本理解和文本生成领域,如今已建立一套系统化的深度语言模型体系,其自研通用语言模型StructBERT、多语言模型VECO、多模态语言模型StructVBERT、生成式语言模型PALM等6大自研模型分别刷新了世界纪录。
其中,StructBERT能让机器更好地掌握人类语法,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。该模型以平均分90.6分在自然语言处理领域数据集GLUE Benchmark中位居第一,显著超越人类水平(87.1分)。
达摩院语言技术实验室团队表示:“实验室的目标是让AI掌握人类知识的基础技术,预训练语言模型的诞生使得AI像人一样学习新知识成为可能,未来达摩院会全面对外开放这些技术,让特定领域的AI变得更加智能。”
过去两年,阿里获得了30多项NLP领域顶级赛事世界头名,有100多篇相关顶会论文; 阿里自然语言技术已在金融、新零售、通讯、互联网、医疗、电力、客服等领域服务超十亿用户和数万企业客户。
原标题:阿里达摩院包揽AI领域六大榜单:用人类的学习方式超越人类
版权与免责声明:
凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。
本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。
鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。