• 语音信号处理:预处理【预加重、分帧、加窗】


    在这里插入图片描述

    一、预处理

    预加重是语音信号处理的前提,主要目的是提升语音信号中的高频分量。

    人的发生系统是从肺开始,肺作为能量源,气流通过声带,引发周期性震动(元音),能量经过咽、口腔、唇、舌, 形成最后的声音。元音能量主要集中在1KHz以下,并且以6dB/十倍频的速度下降。辅音一般不引起声带振动,频率更高。其中口唇辐射对低频影响比较小,但是对高频段影响比较大, 预加重就是为了消除这种影响,提升高频分量。

    在语音信号中,提升高频分量的目的主要是因为高频分量(即辅音)包含了更多的信息,而元音的频率普遍较低。功率谱随频率的增加而减小,其大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容忍的程度。

    总之,预加重保持信号的低频部分不变,提升信号的高频部分;而去加重衰减信号的低频部分,保持高频部分。预加重/去加重的目的都是提升信号中高频部分的能量,以补偿信道对高频部分衰减过大。

    二、分帧

    从宏观上看,语音信号是一个非平稳信号,信号(信号对应的特征及其参数)每时每刻都在变化。但是根据人体的发声机理来看,肌肉的运动过程(主要是口腔肌肉变化、唇舌的位置变化)相对于信号的变化是非常缓慢的,因此,从很短的时间段上,又可以认为语音信号时准平稳信号,即短时平稳信号。

    基于此,语音信号处理的全过程都是基于短时平稳这一

  • 相关阅读:
    C++中的观察者模式
    OpenCV学习(六)——图像算术运算(加法、融合与按位运算)
    javaIO流02:IO流原理及流的分类
    DS 顺序表--类实现(C++数据结构题)
    Linux Harbor 镜像存储路径和迁移方式
    使用docker安装RocketMQ
    破解软件的原理是什么(软件被破解公开)
    常用的git分支管理方法都在这了
    Python 爬虫之scrapy 库
    数据结构与算法之美笔记01
  • 原文地址:https://blog.csdn.net/u013250861/article/details/126274610