免费开源的文本转音频——Fish Speech,AI克隆生意

办公技巧 1月前 397

近两年,AI发展的速度真的太迅猛了。

当你还没尝试过传统的文本转语音,或许更新的技术已经到来,甚至都被另一个技术超越了。

上面是我和一位同事的聊天对话,她让我帮她把文本转成语音。

这几年我都发过10篇左右的文本转音频文章了,他们都还没有尝试过。且这还是最传统的文本转语音方式,使用的是平台内置的播讲人

这一年多以来,大家更是把目光转向了AI音频克隆和生成,文本转音频能更多样化、个性化。

最近又诞生了一个开源的AI文本转音频项目,瞬间冲上热榜(7.4K⭐),可以在线使用,也可以自行搭建。

在线使用

网址(复制后浏览器访问):44886.com/go-398

传统的文本转音频,要么是预制好了播讲人,要么是自己克隆后自己悄悄用。

这个平台最大的特点是——可以模型共享。你可以使用别人创建的声音模型来文本生成语音。

这些别人调好的模型,细节优化非常好,你可以直接使用。

瞬间生成音频文件。

在生成的时候没有参数可以调整,只可以选择模型,所以生成的质量和模型的好坏紧密相关。可以挑广场中热度高的模型来生成试试。

自己创建模型

只需要1分钟时间,就能用自己的声音创建模型。

如果你不想自己的声音被公开使用,一定记得这儿要选择“私有”。

你可以直接在创建的网页上,现场录音。大约朗读3段文字即可,太多反而不行。

录完音频,你的模型瞬间就能生成了,赶快去试试生成效果如何吧!

平台和开源的区别

在平台上免费使用是有限制的,每天可以免费用50次。

很多人不理解:为什么很多项目声称开源,但进官网还分免费和收费?

集中给大家科普一下:

  • 开源是指项目源码是开放的,你可以用源码自己去搭建一个平台,这需要一定的门槛。

  • 官方用源码搭建好了示例平台,这个平台会有很多人使用,服务器是很贵的,所以会有收费计划。

如果你动手能力强,可以用自己的电脑来跑这些开源项目,不花钱;如果你想图方便,就用官方的示例平台,不是重度使用,每天50次已经足够了。

开源地址:https://github.com/fishaudio/fish-speech

- end -

不坑老师小灶资源(限时开启) ¥ 199