✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。
我是Srlua小谢,在这里我会分享我的知识和经验。🎥
希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮
记得先点赞👍后阅读哦~ 👏👏
欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙
目录
随着开源程序的发展,越来越多的程序员开始关注并加入开源大模型的行列。每个人对开源行业和项目的关注点各不相同,现在快来加入我们的开源热门项目推荐活动,分享你感兴趣的热门项目吧!
chattts作者本人也在 x 上表示,ChatTTS 突破了开源天花板。不过,目前开源的只是底模,没有经过 SFT 监督微调。
最像人声的AI来了!语音开源天花板ChatTTS火速出圈,3天就斩获9k个star。
项目地址:https://github.com/2noise/ChatTTS/tree/main
ChatTTs是一种语音合成技术,它使用先进的人工智能算法和模型来生成自然流畅的语音输出。通过ChatTTs,计算机可以将文本转化为逼真的人声,并以多种语音风格和语调进行表达。这项技术在语音助手、虚拟主播、有声读物等领域具有广泛的应用潜力。
开源项目“ChatTTS”是一个文本转语音的工具,它具有以下特点:
1. 多语言支持:ChatTTS不仅可以说中文,还可以说英文,对于多种语言的转换都能应对自如。
2. 细粒度控制:该工具支持一些细节的控制,例如加入笑声、停顿和语气词,使得生成的语音更加生动有趣。
3. 逝去声音的复刻:ChatTTS能够复刻已经逝去的人的声音,例如乔布斯的发布会,让你随时可以重新聆听。
4. 高度逼真的模仿:无论是语调还是语气的变化,ChatTTS都能准确地模仿,并且几乎听不出来是由AI生成的。
5. 中英文混合:ChatTTS能够灵活处理中英文混合的情况,表现出半中半英的流利口音,展现出高水平的语言能力。
通过这些功能,ChatTTS在文本转语音的领域已经达到了一个新的水平。希望这个项目能够为用户带来更好的体验和更多的可能性。
从GitHub下载代码。
git clone https://github.com/2noise/ChatTTS
在开始之前,请确保已安装所需的软件包。您将需要torch和ChatTTS。如果尚未安装,可以使用pip安装:
pip install torch ChatTTS
为您的脚本导入必要的库。您将需要torch、ChatTTS和IPython.display中的Audio。
- import torch
- import ChatTTS
- from IPython.display import Audio
创建ChatTTS类的实例并加载预训练模型。
- chat = ChatTTS.Chat()
- chat.load_models()
定义要转换为语音的文本。将
texts = ["你好,欢迎使用ChatTTS!"]
使用infer方法从文本生成语音。设置use_decoder=True以启用解码器。
wavs = chat.infer(texts, use_decoder=True)
使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放。
Audio(wavs[0], rate=24_000, autoplay=True)
这是供参考的完整脚本:
- import torch
- import ChatTTS
- from IPython.display import Audio
-
- # 初始化ChatTTS
- chat = ChatTTS.Chat()
- chat.load_models()
-
- # 定义要转换为语音的文本
- texts = ["你好,欢迎使用ChatTTS!"]
-
- # 生成语音
- wavs = chat.infer(texts, use_decoder=True)
-
- # 播放生成的音频
- Audio(wavs[0], rate=24_000, autoplay=True)
如何觉得部署较为麻烦的,可以选择在线网站进行免费使用~
项目一经发布,各路网友纷纷试用起来,给出了声音确实真假难辨。
还有人拿 GPT 生成文本,让 ChatTTS「读」出来,语气语调和真人的差距非常小:
希望对你有帮助!加油!
若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!