• 热门开源项目ChatTTS: 国内语音技术突破,实现弯道超车



    ✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭
    ~✨✨

    🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。

    我是Srlua小谢,在这里我会分享我的知识和经验。🎥

    希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮

    记得先点赞👍后阅读哦~ 👏👏

    📘📚 所属专栏:人工智能话题分享

    欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙

    ​​

    目录

    热门开源项目ChatTTS推荐

    如何部署使用ChatTTS?

    1.从GitHub下载

    2.安装依赖项

    3.导入所需库

    4.初始化ChatTTS

    5.准备文本

    6.生成语音

    7.播放音频

    8.完成脚本

    在线网站使用

    体验地址:

    效果反馈:

    常见问题​


    热门开源项目ChatTTS推荐

    随着开源程序的发展,越来越多的程序员开始关注并加入开源大模型的行列。每个人对开源行业和项目的关注点各不相同,现在快来加入我们的开源热门项目推荐活动,分享你感兴趣的热门项目吧!

    chattts作者本人也在 x 上表示,ChatTTS 突破了开源天花板。不过,目前开源的只是底模,没有经过 SFT 监督微调。 

    ​​最像人声的AI来了!语音开源天花板ChatTTS火速出圈,3天就斩获9k个star。

    项目地址:https://github.com/2noise/ChatTTS/tree/main

    ChatTTs是一种语音合成技术,它使用先进的人工智能算法和模型来生成自然流畅的语音输出。通过ChatTTs,计算机可以将文本转化为逼真的人声,并以多种语音风格和语调进行表达。这项技术在语音助手、虚拟主播、有声读物等领域具有广泛的应用潜力。

    开源项目“ChatTTS”是一个文本转语音的工具,它具有以下特点:

    1. 多语言支持:ChatTTS不仅可以说中文,还可以说英文,对于多种语言的转换都能应对自如。

    2. 细粒度控制:该工具支持一些细节的控制,例如加入笑声、停顿和语气词,使得生成的语音更加生动有趣。

    3. 逝去声音的复刻:ChatTTS能够复刻已经逝去的人的声音,例如乔布斯的发布会,让你随时可以重新聆听。

    4. 高度逼真的模仿:无论是语调还是语气的变化,ChatTTS都能准确地模仿,并且几乎听不出来是由AI生成的。

    5. 中英文混合:ChatTTS能够灵活处理中英文混合的情况,表现出半中半英的流利口音,展现出高水平的语言能力。

    通过这些功能,ChatTTS在文本转语音的领域已经达到了一个新的水平。希望这个项目能够为用户带来更好的体验和更多的可能性。

    如何部署使用ChatTTS?

    1.从GitHub下载

    从GitHub下载代码。

    git clone https://github.com/2noise/ChatTTS
    

    2.安装依赖项

    在开始之前,请确保已安装所需的软件包。您将需要torch和ChatTTS。如果尚未安装,可以使用pip安装:

    pip install torch ChatTTS
    

    3.导入所需库

    为您的脚本导入必要的库。您将需要torch、ChatTTS和IPython.display中的Audio。

    1. import torch
    2. import ChatTTS
    3. from IPython.display import Audio

    4.初始化ChatTTS

    创建ChatTTS类的实例并加载预训练模型。

    1. chat = ChatTTS.Chat()
    2. chat.load_models()

    5.准备文本

    定义要转换为语音的文本。将替换为您想要的文本。

    texts = ["你好,欢迎使用ChatTTS!"]
    

    6.生成语音

    使用infer方法从文本生成语音。设置use_decoder=True以启用解码器。

    wavs = chat.infer(texts, use_decoder=True)
    

    7.播放音频

    使用IPython.display中的Audio类播放生成的音频。将采样率设置为24,000 Hz并启用自动播放。

    Audio(wavs[0], rate=24_000, autoplay=True)
    

    8.完成脚本

    这是供参考的完整脚本:

    1. import torch
    2. import ChatTTS
    3. from IPython.display import Audio
    4. # 初始化ChatTTS
    5. chat = ChatTTS.Chat()
    6. chat.load_models()
    7. # 定义要转换为语音的文本
    8. texts = ["你好,欢迎使用ChatTTS!"]
    9. # 生成语音
    10. wavs = chat.infer(texts, use_decoder=True)
    11. # 播放生成的音频
    12. Audio(wavs[0], rate=24_000, autoplay=True)

    在线网站使用

    如何觉得部署较为麻烦的,可以选择在线网站进行免费使用~

    体验地址:

    ChatTTS: Text-to-Speech For Chat

    效果反馈:

    项目一经发布,各路网友纷纷试用起来,给出了声音确实真假难辨。 

    还有人拿 GPT 生成文本,让 ChatTTS「读」出来,语气语调和真人的差距非常小:

    常见问题

    ​​

    希望对你有帮助!加油!

    若您认为本文内容有益,请不吝赐予赞同并订阅,以便持续接收有价值的信息。衷心感谢您的关注和支持!

  • 相关阅读:
    Java 新手如何使用Spring MVC 中的查询字符串和查询参数
    前端甘特图组件开发(一)
    元学习在小样本学习任务中的应用
    字节跳动社招内推,长期有效,长期有效,长期有效
    Django03_Django基本配置
    谣言检测(SRD-PSCD)《Rumor Detection with Self-supervised Learning on Texts and Social Graph》
    Terminator终端
    深度学习中常用的注意力模块及其原理和作用
    springboot+人力资源管理系统 毕业设计-附源码181614
    [Java Framework] 解决监听ContextRefreshedEvent事件执行多次问题
  • 原文地址:https://blog.csdn.net/Srlua/article/details/139709912