• 语音识别技术paddlespeech的安装和使用


    PaddleSpeech 介绍

    PaddleSpeech是百度飞桨(PaddlePaddle)开源深度学习平台的其中一个项目,它基于飞桨的语音方向模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译(英译中)、语音合成、标点恢复等应用示例。

    安装paddlespeech

    PaddleSpeech 快速安装方式有两种,一种是 pip 安装,一种是源码编译(官方推荐)。

    使用pip安装paddlespeech

    $ pip install pytest-runner
    $ pip3 install paddleaudio==1.0.1
    $ pip3 install paddlespeech==1.0.1
    
    • 1
    • 2
    • 3

    使用源码编译安装

    $ git clone https://github.com/PaddlePaddle/PaddleSpeech.git
    $ cd PaddleSpeech
    $ pip install pytest-runner
    $ pip install .
    
    • 1
    • 2
    • 3
    • 4

    提示:安装过程可能因为缺少各种的库报错,如:librosa 依赖的系统库,gcc 环境问题,kaldi 安装等可以在网上查找。

    音频示例下载

    $ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
    $ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
    
    • 1
    • 2

    paddlespeech工具

    查看帮助

    $ paddlespeech  help
    $ paddlespeech asr help
    
    • 1
    • 2

    基本使用

    语音合成

     $ paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
    
    
    • 1
    • 2

    如果报错

    $ pip install numpy==1.23.0
    $ sudo apt-get install libsndfile1
    
    • 1
    • 2

    执行过程

    $  ts-paddle /paddle/PaddleSpeech paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav
    grep: warning: GREP_OPTIONS is deprecated; please use an alias or script
    /usr/local/lib/python3.7/dist-packages/librosa/core/constantq.py:1059: DeprecationWarning: `np.complex` is a deprecated alias for the builtin `complex`. To silence this warning, use `complex` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.complex128` here.
    Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
      dtype=np.complex,
    100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 489M/489M [01:01<00:00, 7.96MB/s]
    100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 915M/915M [01:51<00:00, 8.22MB/s]
    100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 589M/589M [01:01<00:00, 9.57MB/s]
    100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 107k/107k [00:00<00:00, 1.33MB/s]
    W0606 13:22:41.408085  2451 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.5, Driver API Version: 11.7, Runtime API Version: 11.7
    W0606 13:22:41.412684  2451 gpu_resources.cc:91] device: 0, cuDNN Version: 8.4.
    /paddle/PaddleSpeech/output.wavλ ts-paddle /paddle/PaddleSpeech ls
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    语音识别

    识别中文

    $ paddlespeech asr --lang zh --input zh.wav
    
    • 1

    指定模型识别,识别英文

    $ paddlespeech  asr --lang en --model deepspeech2offline_librispeech  --input en.wav
    
    • 1

    标点恢复

    恢复文本标点,可与ASR模型配合使用

    $ paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭
    
    • 1

    声音分类

    适配多场景的开放领域声音分类工具
    基于 AudioSet 数据集 527 个类别的声音分类模型

    $ paddlespeech cls --input zh.wav
    
    • 1

    声纹提取

    工业级声纹提取工具

    $ paddlespeech vector --task spk --input zh.wav
    
    • 1

    语音翻译

    端到端英译中语音翻译工具,使用预编译的 kaldi 相关工具,只支持在 Ubuntu 系统中体验

    $ paddlespeech st --input en.wav
    
    • 1
  • 相关阅读:
    postman:Tests模块之断言
    前端基础之《ECMAScript 6(9)—集合介绍与API》
    基于JavaGUI实现的学生点名系统
    asp.net Core 中模拟微信公众号文件验证
    修改原生checkbox的样式
    P2512 [HAOI2008]糖果传递(均摊纸牌思想)
    知识图谱系列3:读论文-《中国鸟类领域知识图谱构建与应用研究》-面向知识图谱的智能服务研究(需求、管理、查询、推理)
    2020最新Java面试题
    (入门以及简介+实战)超参数寻找器hyperopt库中常见的函数或类的作用
    【软件工程之美 - 专栏笔记】35 | 版本发布:软件上线只是新的开始
  • 原文地址:https://blog.csdn.net/somken/article/details/134512878