ElevenLabs推出人工智能音效模型

小火箭 • 2026年1月18日 am12:49 • 小火箭, 小火箭加速, 小火箭加速器, 小火箭节点

“

ElevenLabs计划推出新的文本转声音模型，让创作者通过描述想象力生成音效。该公司早已研究AI技术，此次新模型填补了AI视频生成缺乏音频的空白。用户可在注册页面加入早期访问等待列表。尽管ElevenLabs领先，其他竞争对手如MURF.AI和WellSaid Labs也有可能进入该领域。

由前谷歌和Palantir员工创立的AI初创公司ElevenLabs，凭借其掌握的基于机器学习（ML）的语音克隆和合成技术，正酝酿推出一款新的文本转声音模型。

据报道，该公司今日发布预告，宣布即将推出的AI技术将允许创作者仅通过用词描述他们的想象力，就能够生成音效。这项技术预计将在AI驱动的数字体验时代掀起新的浪潮，为内容创作提供全新的可能性。

虽然ElevenLabs尚未公开该模型的细节，但据悉该公司已发布了长达一分钟的预告片，展示了其功能，并展示了OpenAI的新模型Sora生成的视频，并添加了自己的AI声音。此外，该公司还设立了一个注册页面，呼吁潜在用户加入该模型的早期访问等待列表。

ElevenLabs成立于2022年，专注于研究AI技术，旨在实现音频和视频内容跨越语言和地域的访问。为了实现这一目标，该公司推出了一系列产品，包括能够以29种不同语言提供自然语音和情感的文本到语音以及语音到语音模型（在语音到语音中使用原始说话者的声音）。

尽管ElevenLabs的工具已被广泛应用于制作内容的企业和个人，但AI生成的内容的兴起也日益显现，其中包括诸如Runway、Pika以及最近的OpenAI（具有Sora）等工具。这些产品能够根据简单的文本提示生成逼真的AI视频，但却缺乏默认音频。ElevenLabs的新模型将填补这一空白，使用户能够通过描述他们想要的来为内容制作音效。

据悉，一旦投入使用，这项技术将让AI创作者轻松地为其作品增加自然的背景音效，涵盖了各种声音，从鸟鸣到移动车辆和汽车喇叭，甚至包括人们在繁忙街道上交谈、进食或行走的声音。

至于ElevenLabs何时公开发布该模型的计划尚未透露，但该公司已经开放了早期访问的注册。感兴趣的用户可以前往试用页面，并使用他们的姓名和电子邮件注册，同时描述他们需要声音效果的用途。此外，ElevenLabs还要求早期志愿者为AI音效编写一个示例提示，以优化模型的响应。

一旦完成注册，用户将被纳入等待列表，并在该模型可用时获得访问权限。然而，具体的时间表尚不确定。

新的文本到声音技术可能给ElevenLabs带来先发优势，但值得注意的是，其他几家在AI语音领域活跃的公司也有可能进入这一领域，包括知名的公司，如MURF.AI 、Play.ht和WellSaid Labs。

据Market US的数据显示，这类工具的全球市场规模在2022年达到了12亿美元，预计到2032年将接近50亿美元，复合年增长率略高于15.40%。

除了AI生成的内容，从新模型产生的声音甚至可以应用于从文本或任何其他视频（Instagram剪辑、商业或视频游戏预告片等）产生的普通语音——这需要一点背景音频。如何使用以及它提供什么样的质量，这还有待观察。