本篇文章介绍主流的两种协议 HLS 和 DASH,以及如何制作并使用支持这些协议开源的客户端库来播放视频。
HLS (HTTP Live Streaming) 是苹果公司开发的流媒体传输协议,它使用 HTTP 来传输视频,可以防止被防火墙屏蔽。现在大部分视频网站都在使用,比如优酷、腾讯视频。
它的工作原理是把整个流分成一个个小的基于 HTTP 的文件来下载,每次只下载一些。当媒体流正在播放时,客户端可以选择从许多不同的备用源中以不同的速率下载同样的资源,允许流媒体会话适应不同的数据速率。
它会生成一个.m3u8文件,其中除了包含一些元数据,还记录被分割视频的存放位置。分割的视频是.ts结尾的文件,是MPEG-2 Transport Stream容器,不过现在 HLS 也支持 fmp4。
- #EXTM3U
- #EXT-X-TARGETDURATION:10
- #EXT-X-VERSION:4
- #EXT-X-MEDIA-SEQUENCE:0
- #EXTINF:10.0,
- ad0.ts
- #EXTINF:8.0,
- ad1.ts
- #EXT-X-DISCONTINUITY
- #EXTINF:10.0,
- movieA.ts
- #EXTINF:10.0,
- movieB.ts
一个 .m3u8 文件大概长上面那样。文件中以 # 开头的字符串要么是注释,要么就是标签,标签以 #EXT 开头,大小写敏感。
EXTM3U M3U8 文件必须包含的标签,并且必须在文件的第一行
EXT-X-VERSION M3U8 文件的版本,常见的是 3(目前最高版本应该是7),版本更高支持的标签就越多
EXT-X-TARGETDURATION 指定了单个媒体文件持续时间的最大值
EXT-X-MEDIA-SEQUENCE 播放列表第一个 URL 片段文件的序列号,默认序列号从 0 开始
EXTINF 其后 URL 指定的媒体片段时长(秒)
EXT-X-DISCONTINUITY 一般用于视频流中插入广告,表示前面的片段与后面不一样,让客户端做好准备
本文福利, 免费领取C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓
制作
去网上随便下载一个视频,用 Bento4 中的 mp4info 看一下文件信息,如下:
- mp4info ./video.mp4
- ...
- Track 1:
- flags: 3 ENABLED IN-MOVIE
- id: 1
- type: Video
- duration: 30000 ms
- language: und
- media:
- sample count: 720
- timescale: 12288
- duration: 368640 (media timescale units)
- duration: 30000 (ms)
- bitrate (computed): 5860.270 Kbps
- display width: 1920.000000
- display height: 1080.000000
- frame rate (computed): 24.000
- Sample Description 0
- Coding: avc1 (H.264)
- Width: 1920
- Height: 1080
- Depth: 24
- AVC Profile: 100 (High)
- AVC Profile Compat: 0
- AVC Level: 40
- AVC NALU Length Size: 4
- AVC SPS: [67640028acd940780227e5c044000003000400000300c03c60c658]
- AVC PPS: [68ebe3cb22c0]
- Codecs String: avc1.640028
- Track 2:
- flags: 3 ENABLED IN-MOVIE
- id: 2
- type: Audio
- duration: 30022 ms
- language: und
- media:
- sample count: 1408
- timescale: 48000
- duration: 1441024 (media timescale units)
- duration: 30021 (ms)
- bitrate (computed): 192.583 Kbps
- Sample Description 0
- Coding: mp4a (MPEG-4 Audio)
- Stream Type: Audio
- Object Type: MPEG-4 Audio
- Max Bitrate: 192580
- Avg Bitrate: 192580
- Buffer Size: 0
- Codecs String: mp4a.40.2
- MPEG-4 Audio Object Type: 2 (AAC Low Complexity)
- MPEG-4 Audio Decoder Config:
- Sampling Frequency: 48000
- Channels: 6
- Sample Rate: 48000
- Sample Size: 16
- Channels: 2
可以看到这个文件为 1080p,24 fps,5860 的码率。
- ffmpeg -i ./in.mp4 \
- -vf scale=w=1280:h=720:force_original_aspect_ratio=decrease,yadif \
- -c:a aac -b:a 128k -ar 44100 -ac 2 \
- -c:v libx264 -b:v 2500k -maxrate 2675k -bufsize 3000k \
- -pix_fmt yuv420p -level 4.1 \
- -profile:v high -preset veryfast -crf 20 \
- -g 120 -keyint_min 120 \
- -sc_threshold 0 \
- -threads 0 -muxpreload 0 -muxdelay 0 \
- -hls_time 10 -hls_playlist_type vod -hls_list_size 0 \
- -f hls -hls_segment_filename '720p_%03d.ts' 720p.m3u8
运行上面命令就可以将 mp4 转换成 m3u8 格式了。
- fmpeg -hide_banner -i ./720p_000.ts # 使用 ffmepg 查看一下切片信息,可以看到信息和上面命令指定的一样
- Input #0, mpegts, from './720p_000.ts':
- Duration: 00:00:10.02, start: 0.060111, bitrate: 2095 kb/s
- Program 1
- Metadata:
- service_name : Service01
- service_provider: FFmpeg
- Stream #0:0[0x100]: Video: h264 (Main) ([27][0][0][0] / 0x001B), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], 24 fps, 24 tbr, 90k tbn, 48 tbc
- Stream #0:1[0x101](und): Audio: aac (LC) ([15][0][0][0] / 0x000F), 44100 Hz, 5.1, fltp, 134 kb/s
hls 支持自动适应码率,根据当前网络状态自动切换清晰度,我们可以制作多种不同码率的视频来让 hls 自动切换。
- ffmpeg -threads 0 -vsync 1 -i .\video.mp4 \
- -lavfi '[0] scale=854:480[ed],[0] scale=1280:720[hd],[0] scale=1920:1080[fhd]' \
- -c:v libx264 -c:a aac -b:v:0 1400k -b:a:0 128k -b:v:1 2800k -b:a:1 128k -b:v:2 5000k -b:a:2 192k \
- -map '[ed]' -map 0:a -map '[hd]' -map 0:a -map '[fhd]' -map 0:a \
- -f hls -var_stream_map 'v:0,a:0,name:480p v:1,a:1,name:720p v:2,a:2,name:1080p' \
- -master_pl_name master.m3u8 \
- -hls_time 10 -hls_playlist_type vod -hls_list_size 0 \
- -hls_segment_filename '%v_%03d.ts' %v.m3u8
为了简化,一些参数就没配置了,运行上面命令可以生成 3 种不同清晰度的 m3u8 文件,还有一个将它们合并在一起的 m3u8 文件,hls 通过两层 m3u8 来实现自适应码率。
- --- 文件:master.m3u8
- #EXTM3U
- #EXT-X-VERSION:3
- #EXT-X-STREAM-INF:BANDWIDTH=1680800,RESOLUTION=854x480,CODECS="avc1.64001e,mp4a.40.2"
- 480p.m3u8
-
- #EXT-X-STREAM-INF:BANDWIDTH=3220800,RESOLUTION=1280x720,CODECS="avc1.64001f,mp4a.40.2"
- 720p.m3u8
-
- #EXT-X-STREAM-INF:BANDWIDTH=5711200,RESOLUTION=1920x1080,CODECS="avc1.640028,mp4a.40.2"
- 1080p.m3u8
下面是不同分辨率的推荐码率。
下面是 Youtube 和 B 站上传视频推荐设置
一般视频网站都会把音频和视频分离,这样做的好处非常多,比如:
如果视频有多个不同语言的版本,那么就可以实现实时切换视频语言。
更加节约空间,比如多个不同码率的视频使用相同码率的音频。
更好的兼容性,有些设备播放包含视频和音频的文件会出现一些问题,比如没声音。
但是分量音视频也大大提高了复杂性,比如如何选择适合码率的音频和视频,还有播放时的音视频同步。
视频有 DTS(解码时间戳,诉播放器该在什么时候解码这一帧的数据)、PTS(显示时间戳,告诉播放器该在什么时候显示这一帧的数据) 。音频的播放也有 DTS、PTS 的概念,但是音频没有类似视频中 B 帧,不需要双向预测,所以音频帧的 DTS、PTS 顺序是一致的。所以需要控制视频和音频的播放,不然就会发生声画不一致。
- ffmpeg -threads 0 -vsync 1 -i .\video.mp4 \
- -lavfi '[0] scale=1280:720[hd],[0] scale=1920:1080[fhd]' \
- -c:v libx264 -c:a aac -b:v:0 2800k -b:a:0 128k -b:v:1 5000k -b:a:1 192k \
- -map '[hd]' -map 0:a -map '[fhd]' -map 0:a \
- -var_stream_map 'v:0,agroup:hd,name:video_hd a:0,agroup:hd,name:audio_hd v:1,agroup:fhd,name:video_fhd a:1,agroup:fhd,name:audio_fhd' \
- -f hls -master_pl_name master.m3u8 \
- -ar 44100 -ac 2 \
- -g 120 -keyint_min 120 -sc_threshold 0 -muxpreload 0 -muxdelay 0 \
- -hls_time 10 -hls_flags single_file -hls_playlist_type vod -hls_list_size 0 \
- -hls_segment_type fmp4 -hls_segment_filename '%v.mp4' %v.m3u8
上面命令将制作音视频分离的 HLS 文件。
- --- 文件:master.m3u8
- #EXTM3U
- #EXT-X-VERSION:7
- #EXT-X-MEDIA:TYPE=AUDIO,GROUP-ID="group_hd",NAME="audio_1",DEFAULT=YES,URI="audio_hd.m3u8"
- #EXT-X-MEDIA:TYPE=AUDIO,GROUP-ID="group_fhd",NAME="audio_3",DEFAULT=YES,URI="audio_fhd.m3u8"
- #EXT-X-STREAM-INF:BANDWIDTH=3220800,RESOLUTION=1280x720,CODECS="avc1.64001f,mp4a.40.2",AUDIO="group_hd"
- video_hd.m3u8
-
- #EXT-X-STREAM-INF:BANDWIDTH=140800,CODECS="mp4a.40.2",AUDIO="group_hd"
- audio_hd.m3u8
-
- #EXT-X-STREAM-INF:BANDWIDTH=5711200,RESOLUTION=1920x1080,CODECS="avc1.640028,mp4a.40.2",AUDIO="group_fhd"
- video_fhd.m3u8
-
- #EXT-X-STREAM-INF:BANDWIDTH=211200,CODECS="mp4a.40.2",AUDIO="group_fhd"
- audio_fhd.m3u8
-
- --- 文件:video_hd.m3u8
- #EXTM3U
- #EXT-X-VERSION:7
- #EXT-X-TARGETDURATION:10
- #EXT-X-MEDIA-SEQUENCE:0
- #EXT-X-PLAYLIST-TYPE:VOD
- #EXT-X-MAP:URI="video_hd.mp4",BYTERANGE="827@0"
- #EXTINF:10.000000,
- #EXT-X-BYTERANGE:4341047@827
- video_hd.mp4
- #EXTINF:10.000000,
- #EXT-X-BYTERANGE:2573385@4341874
- video_hd.mp4
- #EXTINF:10.000000,
- #EXT-X-BYTERANGE:4398334@6915259
- video_hd.mp4
- #EXT-X-ENDLIST
上面用 -hls_flags single_file 让 hls 使用 HTTP Range 来请求分段数据,而无需将视频切成一段段的,-hls_segment_type fmp4 使用 fmp4 而不是 ts。
本文福利, 免费领取C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓
现在我们制作好了 hls 视频,就可以在视频播放器中播放了,苹果的设备都支持 hls,所以直接设置 video 的 src 为 m3u8 文件就可以了。但是对于其他设备并不支持 hls 协议,这时候就可以使用 hls.js。 hls.js 是将 ts 容器转换成 fmp4,它需要 HTML 5 Video 和 MSE 来播放视频。
最后在 js 文件加上如下代码。
- import Hls from 'hls.js'
-
- const video = document.querySelector('video')
- const url = 'http://127.0.0.1:8001/master.m3u8'
- if (Hls.isSupported()) {
- const hls = new Hls();
- hls.loadSource(url)
- hls.attachMedia(video);
- hls.on(Hls.Events.MANIFEST_PARSED, () => {
- video.play();
- });
- } else if (video.canPlayType('application/vnd.apple.mpegurl')) {
- video.src = url
- video.addEventListener('loadedmetadata', () => {
- video.play()
- })
- }
在不支持 MSE 的情况下,就检测是否原生支持 hls,大概率是 IOS 的 Safari(没错它还不支持 MSE)。 可以看到默认请求 hd,但是发现网速很快后就动态的请求 fhd 片段。另外 hls.js 对于 fmp4 还是测试阶段,可以使用更通用的 ts 格式取代。
文件的 base url 可以通过 hls_base_url 参数指定,默认播放文件可以通过 var_stream_map 的 default:yes 设置。
上面的例子很简单,更多关于 hls.js 可以查看 官方文档。
- const player = new Player()
- const hls = new Hls();
- hls.attachMedia(player.video)
- hls.loadSource('https://test-streams.mux.dev/x36xhzz/x36xhzz.m3u8')
- player.mount(document.body)
可以看到视频 seek 和视频 buffer 都没有问题,就和使用普通视频文件一样正常播放。
基于HTTP的动态自适应流(Dynamic Adaptive Streaming over HTTP,缩写DASH,也称MPEG-DASH)是一种自适应比特率流技术,使高质量流媒体可以通过传统的HTTP网络服务器以互联网传递。 DASH 和 HLS 非常相似都是使用 manifest 描述视频信息和播放列表,然后通过 HTTP 自适应的请求合适的片段。
与 HLS 不同的是 DASH 是 国际标准,而 HLS 属于苹果公司。并且 DASH 支持任何编码,它就可以用 vp9 编码的 webm 格式视频。目前有很多大视频网站都在使用 DASH,比如 youtube、netflix、bilibili。
DASH 的索引文件是 .mpd(Media Presentation Description) 结尾的 XML 文件,具体文件内容如下。
- <?xml version="1.0"?>
- <MPD xmlns="urn:mpeg:dash:schema:mpd:2011" profiles="urn:mpeg:dash:profile:full:2011"
- minBufferTime="PT1.5S">
- <!-- Ad -->
- <Period duration="PT30S">
- <BaseURL>ad/</BaseURL>
- <AdaptationSet mimeType="video/mp2t">
- <Representation id="720p" bandwidth="3200000" width="1280" height="720">
- <BaseURL>720p.ts</BaseURL>
- <SegmentBase>
- <RepresentationIndex sourceURL="720p.sidx"/>
- </SegmentBase>
- </Representation>
- <Representation id="1080p" bandwidth="6800000" width="1920"
- height="1080">
- <BaseURL>1080p.ts</BaseURL>
- <SegmentBase>
- <RepresentationIndex sourceURL="1080p.sidx"/>
- </SegmentBase>
- </Representation>
- </AdaptationSet>
- </Period>
- <!-- Normal Content -->
- <Period duration="PT10M">
- <BaseURL>main/</BaseURL>
- <AdaptationSet mimeType="video/mp2t">
- <BaseURL>video/</BaseURL>
- <Representation id="720p" bandwidth="3200000" width="1280" height="720">
- <BaseURL>720p/</BaseURL>
- <SegmentList timescale="90000" duration="5400000">
- <RepresentationIndex sourceURL="representation-index.sidx"/>
- <SegmentURL media="segment-1.ts"/>
- <SegmentURL media="segment-2.ts"/>
- <!-- 省略 -->
- </SegmentList>
- </Representation>
- <Representation id="1080p" bandwidth="6800000" width="1920"
- height="1080">
- <BaseURL>1080/</BaseURL>
- <SegmentTemplate media="segment-$Number$.ts" timescale="90000">
- <RepresentationIndex sourceURL="representation-index.sidx"/>
- <SegmentTimeline>
- <S t="0" r="9" d="5400000"/>
- </SegmentTimeline>
- </SegmentTemplate>
- </Representation>
- </AdaptationSet>
- <AdaptationSet mimeType="audio/mp2t">
- <BaseURL>audio/</BaseURL>
- <Representation id="audio" bandwidth="128000">
- <SegmentTemplate media="segment-$Number$.ts" timescale="90000">
- <RepresentationIndex sourceURL="representation-index.sidx"/>
- <SegmentTimeline>
- <S t="0" r="9" d="5400000"/>
- </SegmentTimeline>
- </SegmentTemplate>
- </Representation>
- </AdaptationSet>
- </Period>
- </MPD>
- ffmpeg -i .\video.mp4 \
- -lavfi '[0] scale=1280:720[hd],[0] scale=1920:1080[fhd]' \
- -c:a aac -c:v libx264 -b:v:0 2800k -b:a:0 128k -b:v:1 5000k -b:a:1 192k \
- -map '[hd]' -map 0:a -map '[fhd]' -map 0:a \
- -use_timeline 1 -use_template 1 -single_file 1 \
- -single_file_name '$Bandwidth$_$RepresentationID$.$ext$' \
- -adaptation_sets "id=0,streams=v id=1,streams=a" -f dash out.mpd
- <?xml version="1.0" encoding="utf-8"?>
- <MPD xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
- xmlns="urn:mpeg:dash:schema:mpd:2011"
- xmlns:xlink="http://www.w3.org/1999/xlink"
- xsi:schemaLocation="urn:mpeg:DASH:schema:MPD:2011 http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-DASH_schema_files/DASH-MPD.xsd"
- profiles="urn:mpeg:dash:profile:isoff-live:2011"
- type="static"
- mediaPresentationDuration="PT30.0S"
- minBufferTime="PT14.5S">
- <ProgramInformation>
- </ProgramInformation>
- <Period id="0" start="PT0.0S">
- <AdaptationSet id="0" contentType="video" segmentAlignment="true" bitstreamSwitching="true" frameRate="24/1" maxWidth="1920" maxHeight="1080" par="16:9">
- <Representation id="0" mimeType="video/mp4" codecs="avc1.64001f" bandwidth="2800000" width="1280" height="720" sar="1:1">
- <BaseURL>2800000_0.mp4</BaseURL>
- <SegmentList timescale="1000000" duration="5000000" startNumber="1">
- <Initialization range="0-814" />
- <SegmentURL mediaRange="815-4481448" indexRange="815-866" />
- <!-- 省略 -->
- </SegmentList>
- </Representation>
- <Representation id="2" mimeType="video/mp4" codecs="avc1.640028" bandwidth="5000000" width="1920" height="1080" sar="1:1">
- <BaseURL>5000000_2.mp4</BaseURL>
- <SegmentList timescale="1000000" duration="5000000" startNumber="1">
- <Initialization range="0-815" />
- <SegmentURL mediaRange="816-8928627" indexRange="816-867" />
- <!-- 省略 -->
- </SegmentList>
- </Representation>
- </AdaptationSet>
- <AdaptationSet id="1" contentType="audio" segmentAlignment="true" bitstreamSwitching="true" lang="und">
- <Representation id="1" mimeType="audio/mp4" codecs="mp4a.40.2" bandwidth="128000" audioSamplingRate="48000">
- <AudioChannelConfiguration schemeIdUri="urn:mpeg:dash:23003:3:audio_channel_configuration:2011" value="6" />
- <BaseURL>128000_1.mp4</BaseURL>
- <SegmentList timescale="1000000" duration="5000000" startNumber="1">
- <Initialization range="0-744" />
- <SegmentURL mediaRange="745-83275" indexRange="745-796" />
- <!-- 省略 -->
- </SegmentList>
- </Representation>
- <Representation id="3" mimeType="audio/mp4" codecs="mp4a.40.2" bandwidth="192000" audioSamplingRate="48000">
- <AudioChannelConfiguration schemeIdUri="urn:mpeg:dash:23003:3:audio_channel_configuration:2011" value="6" />
- <BaseURL>192000_3.mp4</BaseURL>
- <SegmentList timescale="1000000" duration="5000000" startNumber="1">
- <Initialization range="0-744" />
- <SegmentURL mediaRange="745-125638" indexRange="745-796" />
- <!-- 省略 -->
- </SegmentList>
- </Representation>
- </AdaptationSet>
- </Period>
- </MPD>
在浏览器中播放可以使用 dash.js。它同样基于 MSE。
和 HLS 一样,安装 dashjs 和启动静态资源服务器。
- npm i -S dashjs # 注意不是 .js
- # 在资源文件夹下,执行下面命令
- http-server --cors -p 8001
- import dash from 'dashjs'
-
- dash
- .MediaPlayer()
- .create()
- .initialize(
- document.querySelector('video'),
- 'http://127.0.0.1:8001/out.mpd',
- true // 自动播放
- )
可以看到同样在发现网络环境不错的情况下,自动请求了高码率的片段。更多关于 dash.js 请参考 官方文档。
这篇文章介绍了 WEB 视频播放的两种主流的协议。但因为 HLS 出现的更早,更简单,有苹果公司支持等原因,现在比 DASH 更加常用,而且它们都基于 MSE,而 MSE 不支持 IE 10及以下。所以低版本浏览器可以需要降级到直接使用普通的 mp4 视频文件或使用 flash 播放。当然也有很多网站提示浏览器版本太低。
如果你对音视频开发感兴趣,觉得文章对您有帮助,别忘了点赞、收藏哦!或者对本文的一些阐述有自己的看法,有任何问题,欢迎在下方评论区讨论!
本文福利, 免费领取C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)↓↓↓↓↓↓见下面↓↓文章底部点击免费领取↓↓