ElevenLabs推出人工智能音效模型

ElevenLabs推出人工智能音效模型-3

ElevenLabs计划推出新的文本转声音模型,让创作者通过描述想象力生成音效。该公司早已研究AI技术,此次新模型填补了AI视频生成缺乏音频的空白。用户可在注册页面加入早期访问等待列表。尽管ElevenLabs领先,其他竞争对手如MURF.AI和WellSaid Labs也有可能进入该领域。

由前谷歌和Palantir员工创立的AI初创公司ElevenLabs,凭借其掌握的基于机器学习(ML)的语音克隆和合成技术,正酝酿推出一款新的文本转声音模型。

据报道,该公司今日发布预告,宣布即将推出的AI技术将允许创作者仅通过用词描述他们的想象力,就能够生成音效。这项技术预计将在AI驱动的数字体验时代掀起新的浪潮,为内容创作提供全新的可能性。

虽然ElevenLabs尚未公开该模型的细节,但据悉该公司已发布了长达一分钟的预告片,展示了其功能,并展示了OpenAI的新模型Sora生成的视频,并添加了自己的AI声音。此外,该公司还设立了一个注册页面,呼吁潜在用户加入该模型的早期访问等待列表。

ElevenLabs成立于2022年,专注于研究AI技术,旨在实现音频和视频内容跨越语言和地域的访问。为了实现这一目标,该公司推出了一系列产品,包括能够以29种不同语言提供自然语音和情感的文本到语音以及语音到语音模型(在语音到语音中使用原始说话者的声音)。

尽管ElevenLabs的工具已被广泛应用于制作内容的企业和个人,但AI生成的内容的兴起也日益显现,其中包括诸如Runway、Pika以及最近的OpenAI(具有Sora)等工具。这些产品能够根据简单的文本提示生成逼真的AI视频,但却缺乏默认音频。ElevenLabs的新模型将填补这一空白,使用户能够通过描述他们想要的来为内容制作音效。

据悉,一旦投入使用,这项技术将让AI创作者轻松地为其作品增加自然的背景音效,涵盖了各种声音,从鸟鸣到移动车辆和汽车喇叭,甚至包括人们在繁忙街道上交谈、进食或行走的声音。

至于ElevenLabs何时公开发布该模型的计划尚未透露,但该公司已经开放了早期访问的注册。感兴趣的用户可以前往试用页面,并使用他们的姓名和电子邮件注册,同时描述他们需要声音效果的用途。此外,ElevenLabs还要求早期志愿者为AI音效编写一个示例提示,以优化模型的响应。

一旦完成注册,用户将被纳入等待列表,并在该模型可用时获得访问权限。然而,具体的时间表尚不确定。

新的文本到声音技术可能给ElevenLabs带来先发优势,但值得注意的是,其他几家在AI语音领域活跃的公司也有可能进入这一领域,包括知名的公司, 如MURF.AI 、Play.ht和WellSaid Labs。

据Market US的数据显示,这类工具的全球市场规模在2022年达到了12亿美元,预计到2032年将接近50亿美元,复合年增长率略高于15.40%。

除了AI生成的内容,从新模型产生的声音甚至可以应用于从文本或任何其他视频(Instagram剪辑、商业或视频游戏预告片等)产生的普通语音——这需要一点背景音频。如何使用以及它提供什么样的质量,这还有待观察。

ElevenLabs推出人工智能音效模型-4

往期推荐

ElevenLabs推出人工智能音效模型-5

ElevenLabs推出人工智能音效模型-6

OpenAI发布强大的视频生成工具,让整个行业哀鸿遍野

ElevenLabs推出人工智能音效模型-7

人人都能看懂的Sora技术报告

ElevenLabs推出人工智能音效模型-8

揭秘OpenAI Sora的关键要素:时空补丁

ElevenLabs推出人工智能音效模型-9

OpenAI的Sora如何改变游戏规则:深入了解其核心技术

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/476.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>