最接近真人发声的AI语音合成工具ChatTTS

简介:ChatTTS文本转语音,支持停顿,笑声

文字转语音,我想很多视频创作者并不陌生吧!直接使用转换工具,将文本转换为音频,可以大大地节省后期配音的工作。还可以通过这类工具模仿明星的声音,实现和明星对话。当然,应用场景不止这些,下面我列举了一些相关场景。

应用场景

1. 视频解说:视频解说的语音部分如果自己去配音,太耗时间。有了这个软件我们就可以自己输入文本就可以生成符合自己要求的配音效果

2. 小说故事配音:几乎所有短视频平台都有人在做小说转视频。其实就是一张图片配上音频,图片可以直接使用SD生成,音频部分就可以使用这款软件进行配音。还可以定制化不同的音效。最主要的是,一个人就可以分饰多个角色,一个人就可以配音整个小说人物音频

还有很多应用场景,我们这里举例的是目前最为流行的行业的应用。大家可以发挥自己的想象,还有哪些行业需要配音,欢迎大家在微信公众号文章底部留意。

市面上文字转语音的工具很多,但是,很少有工具可以控制语音的停顿,也无法添加笑声。然而,最近小编发现了一款叫做“ChatTTS”的文字转语音模型,这个模型完美的支持停顿,笑声以及其他情感类的语气词。于是,在好奇心的驱使下,我也体验了一下该模型,下面大家一起来了解下吧!

1. 下载软件

大家可以在公众号发送【ChatTTS】获取下载链接。

下载的是一个压缩包【text_tts.zip】,解压缩后得到如下目录结构:

双击TextTTS.exe就可以直接打开,启动应用大概需要30秒,耐心等待一下就好:

2. 填写文字,选择音色及其他参数

应用启动之后,我们就可以填写待转换语音的文本,音色。关于音色,大家可以在广场那里查看全部音色,官方提供了上前个已经克隆好的音色,足够我们日常工作使用。

3. 预处理

预处理是针对文本添加停顿,笑声的方式。可提高AI对文本的理解,从而提供更好的声音效果。我们也可不使用预处理,自己给文本添加停顿及笑声,输入框下方有停顿和笑声按钮,点击即可在光标处插入相应的提示词。

使用预处理是需要注意了,有的时候模型的预处理可能会出问题,甚至直接改变文本原有的内容。大家使用预处理后一定要检查是否正确

4. 确认生成声音

一切准备就绪后,点击右侧的确认按钮,进行生成声音:

5. 对话模式

对话模式就是批量处理文本合成音频的功能,主要是区分合成音频人的声音

合成后会自动保存在我们设置好的保存目录下,如需要进行其他操作的可以进入输出目录下进行操作。

如果使用的电脑没有显卡或者显卡的内存小于4G的,程序会自动隐藏硬件运算选项,以免程序报错。如果有显示硬件运算的表示电脑支持GPU加速处理,对于处理比较长的文本合成音频,至少可以提高2倍的速度。

 

有遗漏或者不对的可以在我的公众号留言哦

编程经验共享公众号二维码

编程经验共享公众号二维码
更多内容关注公众号
Copyright © 2021 编程经验共享 赣ICP备2021010401号-1