最新行业资讯

头条号

最新原创观点

百家号


资讯中心

亚马逊开发出有史以来最大的文本转语音模型

2024-02-19 11:07:06来源:TechWeb.com.cn 阅读量:20987

分享:
导读:研究人员表示,尽管遇到了文本转语音引擎固有的困难,如发音错误或语调错误,但该模型在处理复杂的语言结构方面表现出了非凡的能力。
  2月18日消息,据外媒报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。
 
  外媒报道称,这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音(来自公共网站)来进行训练,其中大部分为英语语音,但也包括德语、荷兰语和西班牙语,这使它成为自然语音的新标准。
 
  研究人员表示,尽管遇到了文本转语音引擎固有的困难,如发音错误或语调错误,但该模型在处理复杂的语言结构方面表现出了非凡的能力。
 
  研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。
 
  外媒称,这一突破标志着文本转语音技术的发展向前迈出了重要的一步,在不久的将来有可能得到广泛的应用。
 
  然而,该团队表示,为了避免滥用,BASE TTS不会向公众发布。相反,他们计划把它作为一种学习应用。

我要评论

文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关。

相关新闻

版权与免责声明:凡本网注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本网将追究其相关法律责任。

本网转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。

如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

不想错过最新资讯?

下载智能制造APP

一键筛选来订阅

信息更精准

企业直播

更多

产品商城 更多


关于我们|本站服务|会员服务|商站通服务|旗下网站|友情链接|产品分类浏览|意见反馈|兴旺通|频道

智能制造网 - 工业4.0时代智能制造领域“互联网+”服务平台

Copyright gkzhan.comAll Rights Reserved法律顾问:浙江天册律师事务所 贾熙明律师

客服热线:0571-87756395采购热线:0571-87759926媒体合作:0571-89719789

客服部:采购部:编辑部:展会合作:市场一组:市场二组:

关闭