ElevenLabs 发布 Eleven 多语种 V2 版–支持近 30 种语言的基础人工智能语音模型

Admin 2023-8-26 297 8/26
这一进步将使全球的媒体公司、游戏开发商、出版商和独立创作者能够大幅提高其内容的可访问性。
ElevenLabs 发布 Eleven 多语种 V2 版--支持近 30 种语言的基础人工智能语音模型

语音人工智能平台 ElevenLabs 在消除内容的语言障碍方面取得了重大进展,发布了支持 28 种语言的多语言功能的新基础深度学习模型--Eleven 多语言版本 2。
这一进步将使全球的媒体公司、游戏开发商、出版商和独立创作者能够显著提高其内容的可访问性。
这些新功能是该平台自今年 1 月推出以来发布和改进的一系列新功能的延续,也标志着公司测试阶段的正式结束。
ElevenLabs 的使命是让所有内容都能以任何语言、任何语音进行无障碍访问
世界领先的语音人工智能软件公司ElevenLabs今天推出了一种新的多语言语音生成模型,能够用近30种语言准确地生成 "情感丰富 "的人工智能音频。

试用多语言版本2


这项完全基于内部研究的进步将使创作者能够为欧洲、亚洲和中东的国际市场制作本地化的音频内容。在过去的18个月里,ElevenLabs对人类语音的标记进行了分析,建立了在语音生成中理解语境和传达情感的新机制,并合成了新的、独特的声音。

通过 Eleven Multilingual v2,当文本输入到 ElevenLabs 文本到语音平台时,新模型可以自动识别近 30 种书面语言,并以前所未有的真实度生成这些语言的语音。

同时,无论使用的是合成语音还是克隆语音,说话者在所有语言中都能保持其独特的语音特征,包括原始口音。这意味着同一声音可用于 28 种不同语言的内容。

继向平台上的所有创作者公开发布 "专业语音克隆 "功能之后,又推出了这一功能。这一产品更新与额外的安全和保安功能同时推出,允许用户创建自己声音的完美数字副本,与原声几乎没有区别。今天发布的版本意味着您的声音将可以使用多语言模式提供的近 30 种语言。

现在支持的语言包括:中文、韩语、荷兰语、土耳其语、瑞典语、印尼语、菲律宾语、日语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、斯洛伐克语、克罗地亚语、经典阿拉伯语和泰米尔语。

这些语言包括英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语。

继最近推出新功能并不断改进平台后,ElevenLabs 今天还确认该平台将正式退出 Beta 版。这一转变标志着公司致力于为全球 100 多万用户提供可靠、先进工具的关键时刻。

展望未来,ElevenLabs 计划推出一种机制,允许用户在平台上分享声音,并从新音频的开发中获益,从而促进人类与人工智能的合作机会。

ElevenLabs 的联合创始人兼首席执行官 Mati Staniszewski 评论说:

创办 ElevenLabs 的梦想是让所有内容都能以任何语言、任何声音被普遍访问。随着Eleven多语种版本2的发布,我们离实现这一梦想又近了一步,可以用各种方言提供人类质量的人工智能语音。

"我们的文本到语音生成工具有助于创造公平的竞争环境,为所有创作者带来高质量的口语语音功能。这些优势现已扩展到近 30 种语言的多语言应用。最终,我们希望在人工智能的帮助下,覆盖更多的语言和语音,消除内容的语言障碍。在 ElevenLabs,我们相信这些可访问性的飞跃最终将促进更大的创造力、创新和多样性。

通过降低以多种语言创建高质量音频内容所需的成本和资源,ElevenLabs 使公司和创作者能够制作出更具想象力、更易获取、能引起不同文化和语言共鸣的内容。

对于独立游戏开发商和发行商来说,多语言语音生成工具提供了新的机会,可以为国际受众翻译游戏体验和音频内容,在不影响语音质量和准确性的情况下,用他们自己的语言与玩家和听众建立联系。

同样,教育机构现在也有办法即时为学习者提供目标语言的准确音频内容,提高语言理解能力和发音技巧,并满足留学生的不同教学风格和学习需求。

各种类型的创作者都可以使用ElevenLabs的工具,通过多语言语音补充视觉内容,提高视觉障碍者或有额外学习需求者的内容可访问性。

该公司于2023年1月推出的首套人工智能语音工具包括通过选择预先设计的合成语音将任何文本转化为语音的能力,以及创建克隆自己的语音的能力。多语种语音合成工具是 ElevenLabs 在实现所有内容都能以任何语言、任何语音进行访问这一使命上迈出的又一步。

这项技术已被多个创意垂直领域和行业所采用,包括帮助独立作家创作有声读物、为视频游戏中的次要角色配音、支持视障人士访问在线书面内容,以及为全球首个人工智能广播频道提供动力。ElevenLabs 还与一系列领先的内容创作者和工作室建立了合作关系,包括人工智能视频生成器 D-ID、全球最大的有声读物出版商之一 Storytel、开放式科学视频平台 ScienceCast(其视频生成工具可将发表在 arXiv 上的科学研究论文进行浓缩)、全球领先的内容创作者平台 TheSoul Publishing、Embark Studios 和 Paradox Interactive 等令人难以置信的游戏开发商以及媒体平台 MNTN。

- THE END -
最后修改:2023年8月26日

非特殊说明,本博所有文章均为博主原创。