摘要 :本文描述了FLV 的文件格式。 关键字 :FLV
1 简介
FLV流媒体格式是sorenson公司开发的一种视频格式,全称为Flash Video。 它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。由于其视频文件体积轻、封装播放简单等优点,使得其非常合适在网络上传输,目前主流的视频网站无一例外支持FLV流媒体格式进行视频播放。
2020年12月31日,Chrome作为最后一个宣布将不再支持使用Flash的应用程序浏览器,flv视频均无法透过Google Chrome收看,除开BiliBili、优酷等视频网站以外的视频网站均停止使用flv作为视频格式。
FLV整个文件由两部分组成Header和Body,Header描述了FLV文件的基本信息,Body存储了流数据。Body中由一个个Tag组成。
2.1 FLV Header
FLV Header长度为9个字节,前三个字节是固定的FLV
三个字符,表示当前文件的标签,第四个字节是当前文件的版本比如0或者1,第五个字节被分为了4个部分,前5个bit位作为预留,不使用的话写0;接下来的3个bit位每一位表示是否有对应的流,次序分别为音频,预留,视频,为1则表示当前文件有对应的流;最后4个字节表示当前Header的大小,一般为9如果有扩充就会变。
2.2 FLV Body
FLV Body紧跟在FLV Header之后,即FLV Header中的dataoffset
也是FLV Body的起始位置。FLV Body由一系列的Back-Pointer和Tag组成,交错存储,大概的结构如下:
Back-Pointer就是一个4字节的区域,存储前一个Tag的长度,第一个Tag没有前任,一定是0。另外,FLV的Tag包含音频、视频或脚本元数据、可选的加密元数据和 payload。最基础的为FLV Tag,还有其他的Audio Tag,Vidoe Tag, Data Tag等。
2.2.1 FLV Tag
FLV Tag也有Header+Data组成,基本结构如下:
Reserved(2 bit):用于FMS的保留字段, 值为0; Filter(1bit):指示packet是否需要预处理:
0 = 不需要预处理; 1 = packet 在渲染前需要预处理(例如解密); 未加密文件中此值为0,加密文件中此值为1; TagType(5bit):表示当前Tag的类型:
DataSize(3byte):Tag中除通用头外的长度,即Header+Data字段的长度 (等于Tag总长度 – 11,即StreamID以下的数据长度,不包含StreamID); Timestamp(3byte):当前Tag的解码时间戳 (DTS),单位是毫秒。FLV文件中第一个Tag的DTS总为0; TimestampExtended(1byte):和Timestamp字段一起构成一个32 位值, 此字段为高 8 位,单位毫秒; StreamID(3byte):总是为0; 上面的数据是一定有的,下面的数据是根据当前Tag类型或者其他一些属性来决定的:
Tag Header:
TagType为8,则为AudioTagHeader; TagType为9,则为VideoTagHeader; Filter为1,有EncryptionHeader; Filter为1,则有FilterParams; Data:
TagType为8,则为音频数据; TagType为9,则为视频数据; TagType为18,则为脚本数据。
2.2.2 Audio Tag
Audio Tag包括AudioTagHeader和AudioTagBody两部分组成。
2.2.2.1 Audio Tag Header
Audio Tag Header主要描述了音频的基本参数,比如采样率等:
SoundFormat:音频格式;
0: Linear PCM, platform endian; 1: ADPCM; 2: MP3; 3: Linear PCM, little endian; 4: Nellymoser 16-kHz mono; 5: Nellymoser 8-kHz mono; 6: Nellymoser; 7: G.711 A-law logarithmic PCM; 8: G.711 mu-law logarithmic PCM 9 = reserved; 10: AAC; 11: Speex; 14: MP3 8-Khz; 15: Device-specific sound; SoundRate:采样率,FLV支持的采样率比较有限,AAC总为3:
0: 5.5 kHz; 1: 11 kHz; 2: 22 kHz; 3: 44 kHz; SoundSize:采样位深,此参数仅适用未压缩格式,压缩格式总在内部被解码为16位:
SoundType:声道数:
AACPacketType:AAC帧类型。仅当声音格式为 10 时,存在此字段:
0: AAC sequence header; 1: AAC raw。
2.2.2.2 Audio Tag Body
音频数据段即AUDIODATA,根据是否加密可以存储加密数据即EncryptedBody或者AudioTagBody。AudioTagBody存储的数据根据当前格式不同而不同,如果是AAC即SoundFormat=10,则存储AACAUDIODATA,否则就是具体格式的数据。 AACAUDIODATA的存储结构根据是否设置AACPacketType而不同,0则存储的AudioSpecificConfig,否则直接存储AAC的数据。
2.2.3 Video Tag
Video Tag 包含 VideoTagHeader 和 VideoTagBody 两部分。
2.2.3.1 VideoTagHeader
FrameType:帧类型;
1: keyframe (for AVC, a seekable frame); 2: inter frame (for AVC, a non-seekable frame); 3: disposable inter frame (H.263 only); 4: generated keyframe (reserved for server use only); 5: video info/command frame; CodecID:编解码器ID:
1: JPEG (currently unused); 2: Sorenson H.263; 3: Screen video; 4: On2 VP6; 5: On2 VP6 with alpha channel; 6: Screen video version 2; 7: AVC; AVCPacketType:AVC帧类型只有AVC编码才有:
0: AVC sequence header; 1: AVC NALU; 2: AVC end of sequence (lower level NALU sequence ender is not required or supported); CompositionTime:PTS与DTS的时间偏移值,单位ms,记作CTS,只有编码器为AVC才有。
2.2.3.2 VideoTagBody
同AudioTagBody,区分加密和非加密。而非加密的VideoTagBody根据编解码器类型不同存储的数据不同:
FrameType == 5:UI8; CodecID == 2:H263VIDEOPACKET; CodecID == 3:SCREENVIDEOPACKET; CodecID == 4:VP6FLVVIDEOPACKET; CodecID == 5:VP6FLVALPHAVIDEOPACKET; CodecID == 6:SCREENV2VIDEOPACKET; CodecID == 7:AVCVIDEOPACKET。
2.2.4 Data Tags
数据 Tag 封装了单一方法,此方法通常在 Flash 播放器中的网络流对象上被调用。数据 Tag 包含方法名和一组参数。这部分就不详细说明了具体参考abode的标准。
3 简单查看下FLV的结构
FLV file version 1
Contains audio tags: Yes
Contains video tags: Yes
Data offset: 9
Prev tag size: 0
Tag type: 18 - Script data object
Data size: 1195
Timestamp: 0
Timestamp extended: 0
StreamID: 0
Prev tag size: 1206
Tag type: 9 - Video data
Data size: 54
Timestamp: 0
Timestamp extended: 0
StreamID: 0
Video tag:
Frame type: 1 - keyframe ( for AVC, a seekable frame)
Codec ID: 7 - AVC
AVC video tag:
AVC packet type: 0 - AVC sequence header
AVC composition time: 0
AVC nalu length: 23330847
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
参考文献