• 走进音视频的世界——mp3封装格式


    MP3,全称是MPEG Audio Layer3,利用人耳对高频声音信号不敏感的特性,结合心理声学模型,把时域信号转换为频域信号,并划分多个频段,对不同频段使用不同压缩率进行压缩。整体压缩率达到1:10,甚至1:12。

    一、MP3整体结构

    MP3由ID3v2、Frame、ID3v1构成。其中,Frame表示若干音频帧。如下图所示:

     二、ID3V2结构

    ID3v2由标签头、扩展头、若干标签帧组成。如下表所示:

    其中Frame ID由4个ASCII字节表示,如下图所示:

     

     常见的Frame ID描述如下:

    • TALB: 专辑,album
    • TBPM: 节拍数,beats per minute
    • TCOM: 作者,composer
    • TCON: 内容类型, content type
    • TCOP: 版权信息,copyright message
    • TIME: 制作时间,time
    • TIT1: 内容属组描述,content group description
    • TIT2: 标题/歌曲名,title/SongName
    • TLAN: 语言,language

    三、MP3帧

    MP3帧由帧头+音频数据组成。其中帧头由4个字节构成。每个字段所占bits及其描述如下:

     1、version ID

    版本ID由2个bits组成。其中Version1来自ISO/IEC 11172-3, Version2来自ISO/IEC 13818-3,如下图所示:

     2、Bitrate Index

    码率是提供索引表,根据索引下标去数据查表得到对应码率。如下图所示:

     3、Samplerate Index

    采样率与码率类似,也是通过索引下表去数组查表得到对应采样率。如下图所示:

    四、ID3v1结构

    ID3v1包括:头标识、标题、艺术家、专辑、年份、评论等。共128个字节。如下表所示:

     参考:Declared_ID3v2_frames

                mp3-tech.org

  • 相关阅读:
    rk3568环境配置和推理报错: RKNN_ERR_MALLOC_FAIL
    学习LevelDB架构的检索技术
    软件项目管理习题——软件生命周期
    结构体的声明及其初始化
    logstash 通配日期目录
    第05章_存储引擎
    我们用到的3种Mock测试方案​
    FreeRTOS学习笔记-任务通知
    《计算机网络-自顶向下方法》学习笔记
    Gmail邮箱注册情况及最新动态
  • 原文地址:https://blog.csdn.net/u011686167/article/details/126043547