AI人工智能是现在的热门,很多服务都上了AI客服,如何让AI用最少的样本来理解自然语言是个难题,国内还有中文语言理解的需要。在日前的中文语言理解权威评测基准CLUE评测中,阿里的AI模型就拿到了双料冠军。
日前, 中文语言理解权威评测基准CLUE公布了小样本学习评测榜单FewCLUE的新结果,阿里巴巴在大模型和无参数限制模型两项赛事中双双刷新榜单较好纪录,仅次于“人类”,并在极少(一个类别仅十余个)样本条件下,超过了新闻文本分类上的人类识别精确度。
这证明了AI小样本学习在NLP任务上具备超越人类的能力。
FewCLUE是CLUE新推出的一项中文小样本学习评测榜单,包括大模型和无参数限制模型双赛道,用来评估预训练模型是否能够通过小样本学习来掌握特定的自然语言处理任务。基于这项评估,科研人员可以更精准的衡量预训练模型的泛化性和准确率。
预训练模型在特定自然语言处理任务上要取得高精度的成本很高,科研人员进而转向攻关小样本学习技术,希望用较低的成本实现可观的识别精确度。
据悉,阿里云机器学习平台PAI和和达摩院共同提出了一种大模型+小样本的联合方案,在大规模通用预训练基础之上,将亿级知识图谱融入预训练模型,打造了强大的底座KGBert,结合Fuzzy-PET少样本学习,在多个任务上比预训练微调技术提升近25%了准确率,甚至在一个小样本学习任务上的精准度超过了人类。
例如,在智能客服场景下的用户需求识别,仅需人工标注几十条样本,就能让需求识别的准确率达到90%。
值得一提的是,这项小样本学习技术已在阿里巴巴的实际场景落地且有很好的业务表现,目前阿里云智能客服云小蜜仅用20条样本就可以做到快速冷启动,实现精准问答,准确率超过80%,并在政务、金融、通用线多个业务场景落地。开发者可基于PAI直接调用行业解决方案,也可以二次开发打造自己的模型。
阿里云PAI是国际领先的机器学习平台,过去几年陆续打破多项国内外AI记录:2019年10月,英文多轮阅读榜单QuAC取得第一;2020年3月,中文CLUE分类榜单取得第一;2020年8月,英文SuperGLUE取得国内第一,世界第二。
“我们希望通过算法与工程的协同设计构建端到端的大规模AI工程能力,用云上AI平台PAI服务各行各业。”阿里巴巴副总裁、阿里云计算平台负责人贾扬清表示:“目前,PAI支持从数据标注、模型设计、分布式训练、模型管理和模型服务等AI资产管理的各方面需求,全面提升AI落地企业应用的效率。”
(原标题:AI比人类更懂中文 阿里拿下FewCLUE双料冠军)
版权与免责声明:
凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。
本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。
鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。