Bert – VITS2 – 2.3 是一种基于深度学习的文本到语音合成软件1。它融合了 VITS2 和多语言 Bert 模型,在多语言语音合成方面具有出色能力,尤其是其针对中文的特化版本,能很好地满足不同语言的语音合成需求2。
该软件在语音合成方面有诸多优势1。它通过改进之前工作的几个方面,有效合成了更自然的语音,在提高多说话人模型中语音特征的自然度、相似性以及训练和推理效率方面效果显著,还能显著减少对音素转换的强依赖,更趋近于完全端到端的单阶段语音合成方法。
软件下载
© 版权声明
THE END
- 最新
- 最热
只看作者