语音信号处理：预处理【预加重、分帧、加窗】

在这里插入图片描述

一、预处理

预加重是语音信号处理的前提，主要目的是提升语音信号中的高频分量。

人的发生系统是从肺开始，肺作为能量源，气流通过声带，引发周期性震动（元音），能量经过咽、口腔、唇、舌，形成最后的声音。元音能量主要集中在1KHz以下，并且以6dB/十倍频的速度下降。辅音一般不引起声带振动，频率更高。其中口唇辐射对低频影响比较小，但是对高频段影响比较大，预加重就是为了消除这种影响，提升高频分量。

在语音信号中，提升高频分量的目的主要是因为高频分量（即辅音）包含了更多的信息，而元音的频率普遍较低。功率谱随频率的增加而减小，其大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容忍的程度。

总之，预加重保持信号的低频部分不变，提升信号的高频部分；而去加重衰减信号的低频部分，保持高频部分。预加重/去加重的目的都是提升信号中高频部分的能量，以补偿信道对高频部分衰减过大。

二、分帧

从宏观上看，语音信号是一个非平稳信号，信号（信号对应的特征及其参数）每时每刻都在变化。但是根据人体的发声机理来看，肌肉的运动过程（主要是口腔肌肉变化、唇舌的位置变化）相对于信号的变化是非常缓慢的，因此，从很短的时间段上，又可以认为语音信号时准平稳信号，即短时平稳信号。

基于此，语音信号处理的全过程都是基于短时平稳这一

相关阅读:
C++中的观察者模式
OpenCV学习（六）——图像算术运算（加法、融合与按位运算）
javaIO流02：IO流原理及流的分类
DS 顺序表--类实现（C++数据结构题）
Linux Harbor 镜像存储路径和迁移方式
使用docker安装RocketMQ
破解软件的原理是什么(软件被破解公开)
常用的git分支管理方法都在这了
Python 爬虫之scrapy 库
数据结构与算法之美笔记01

原文地址：https://blog.csdn.net/u013250861/article/details/126274610