i人的福音!一个强大开源的文本转语音工具!

是个陈序员 2024-07-21 20:54:54

大家好,我是 Java陈序员。

现在的自媒体可谓是十分火热,各个视频剪辑软件提供了文本生成语音的功能,但大多都是千篇一律的音色,比如“这个男人叫小帅”。

如果你想做自媒体,既不想录制自己的语音,又想自己的视频配音与他人不同,可以考虑使用大模型来训练生成自己的语音。

今天,给大家介绍一个开源免费的文本转语音工具,支持十几种语言生成!

关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。

项目介绍

EmotiVoice —— 一个强大的开源 TTS 引擎(Text To Speech,即文本转语音),完全免费开源!

EmotiVoice 供了一个易于使用的 Web 界面用于文本转语音,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

此外,EmotiVoice 还提供了用于批量生成结果的 API 接口。

项目使用启动工具

EmotiVoice 的使用方法十分简单,在 Windows 环境下,解压软件压缩包后,双击运行 start.bat 即可启动。

双击运行 start.bat 后,将会在 CMD 命令窗口中运行服务:

并在浏览器中自动打开 Web 界面:

单句合成

1、选择说话人,工具提供了十几种不同的男女音色供选择

2、选择情绪,工具提供了普通、生气、开心、惊讶、悲伤、厌恶、恐惧等语音情绪

3、输入合成文本

4、点击合成

5、合成的音频可以进行在线播放和下载,或者在合成时勾选生成音频后直接保存在wav_file目录下

故事剧本多人合成

EmotiVoice 除了提供单句合成,还提供了故事剧本多人合成的功能。

1、输入角色和文本

2、为角色选定声音情感

3、为角色选定配音员

4、点击合成音频

快速上手完整安装conda create -n EmotiVoice python=3.8 -yconda activate EmotiVoicepip install torch torchaudiopip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict

更多的模型训练,可参考项目文档。

Docker 部署

尝试 EmotiVoice 最简单的方法是运行 Docker 镜像,需要一台带有 NVidia GPU 的机器!

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

容器启动成功后,访问:

http://localhost:8501/

EmotiVoice 作为一款 TTS 引擎,可以说功能十分强大,而且开源免费,大家快去围观体验吧~

项目地址:https://github.com/netease-youdao/EmotiVoice最后

推荐的开源项目已经收录到 GitHub 项目,欢迎 Star:

https://github.com/chenyl8848/great-open-source-project

或者访问网站,进行在线浏览:

https://chencoding.top:8090/#/

大家的点赞、收藏和评论都是对作者的支持,如文章对你有帮助还请点赞转发支持下,谢谢!

0 阅读:0

是个陈序员

简介:感谢大家的关注