ElevenLabs推出Turbo 2.5 AI模型:普通话转语音速度飙升3倍
【HowToTech科技】7月20日消息,ElevenLabs于昨日(7月19日)通过博文向世界宣布,他们已成功推出全新的Turbo
v2.5文本到语音AI模型。这款新模型支持包括普通话在内的32种语言,覆盖了全球近80%的地区,为用户提供高品质、低延迟的AI对话体验。
Turbo
v2.5模型的一个显著特点是新增了对越南语、匈牙利语和挪威语的支持。这三种语言分别被8500万、1300万和530万人使用,此举无疑将ElevenLabs的AI服务扩展到了更广泛的用户群体。
据HowToTech科技了解,此次更新不仅增加了新的语言支持,还显著提高了印地语、法语、西班牙语、普通话等27种语言的响应速度,其中最高提升了3倍,英语的响应速度也提高了25%。这一改进得益于Turbo
v2.5模型融合了尖端的文本到语音技术和最新的低延迟模型架构,使得用户能够在几乎无需等待的情况下获得高质量的AI生成音频。
Turbo模型的快速语音合成功能,在保持音质流畅自然的同时,响应时间控制在400毫秒以内,为用户提供了极佳的交互体验。
ElevenLabs,这家总部位于伦敦的公司,自2022年成立以来,一直致力于开发先进的人工智能语音模型和工具。他们的服务能够创建不同语言、口音和情感的合成语音,极大地丰富了AI语音的应用场景。
公司CEO Mati
Staniszewski透露,ElevenLabs目前拥有一支由约40名分布在全球的远程办公员工组成的团队,并计划在年底前将团队规模扩大至100人。
在推进AI技术的同时,ElevenLabs也非常重视人工智能内容的透明度。他们开发了如AI Speech
Classifier等工具来辅助识别合成音频,同时还在积极探索电影配音等新的应用领域。更令人期待的是,他们正在开发一个平台,允许用户生成AI语音并通过授权获得收益,这无疑为AI语音技术的发展开辟了新的商业模式。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...