码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Python 音频处理以及可视化 Amplitude,MFCC,Mel Spectrogram, librosa 库


    利用python库 librosa库对于音频文件进行预处理,以及可视化操作。

    1. Load Audio Data 导入音频

    将音频文件(这里使用苹果录音文件 .m4a 格式)导入librosa,音频格式可以为其它(甚至视频文件mp4也是可以的)

    import librosa
    
    audio_data = 'Audio/1.m4a'
    y, sr = librosa.load(audio_data)
    
    print('y:', y, '\n')
    print('y shape:', np.shape(y), '\n')
    print('Sample Rate (Hz):', sr, '\n')
    print('Check Len of Audio:', np.shape(y)[0]/sr)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    返回值有两个 y 和 sr。
    y 是音频时间序列并支持多声道,
    sr 是采样率 (注意:librosa默认load使用的是22050hz的采样率)
    如果想要用固定采样率,则可以使用y, sr = librosa.load(audio_data,sr=None)表示保持原音频的采样率。或者可以规定采样率sr:y, sr = librosa.load(audio_data,sr=44100) 。

    想要获取音频的基本信息可以输入:

    print('y:', y, '\n')
    print('y shape:', np.shape(y), '\n')
    print('Sample Rate (Hz):', sr, '\n')
    print('Check Len of Audio:', np.shape(y)[0]/sr)
    
    • 1
    • 2
    • 3
    • 4

    2. Audio Visualization 音频可视化

    a) Amplitude

    音频可视化,y轴 为 Amplitude (振幅)随时间变化曲线。
    
    • 1
    import matplotlib.pyplot as plt
    import librosa.display
     
    plt.figure(figsize=(20, 5))
    librosa.display.waveplot(y, sr=sr)
    plt.xlabel('Time (samples)')
    plt.ylabel('Amplitude')
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述

    b) Amplitude to DB

    X = librosa.stft(y)
    Xdb = librosa.amplitude_to_db(abs(X))
    plt.figure(figsize=(20, 5))
    librosa.display.specshow(Xdb, sr=sr, x_axis='time', y_axis='hz')
    plt.colorbar()
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述

    c) MFCC 梅尔频率倒谱系数

    mfccs = librosa.feature.mfcc(y=y, sr=sr)
    librosa.display.specshow(mfccs, sr=sr, x_axis='time')
    
    • 1
    • 2

    在这里插入图片描述

    d) Mel Spectrogram 梅尔频谱图

    mel = librosa.feature.melspectrogram(y=y, sr=sr)
    librosa.display.specshow(mel, sr=sr, x_axis='time')
    
    • 1
    • 2

    在这里插入图片描述
    以上。

  • 相关阅读:
    软件设计不是CRUD(7):低耦合模块设计实战——组织机构模块(中)
    哪种猫罐头比较好?推荐给新手养猫的5款好口碑猫罐头!
    软件成分分析(SCA)完全指南
    代理IP与Socks5代理:跨界电商时代的网络安全与数据引擎
    DevOps实战:使用GitLab+Jenkins+Kubernetes(k8s)建立CI/CD解决方案
    在web页面音视频录制并下载到本地——MediaRecorder
    如何使用反 CSRF 令牌保护您的网站和 Web 应用程序
    java基于SpringBoot+vue的餐厅点餐外卖系统 elementui 前后端分离
    Csharp学习Linq
    什么是内网穿透?
  • 原文地址:https://blog.csdn.net/qq_41608408/article/details/128086842
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号