• ffplay源码分析—数据结构


    1. 数据结构

    几个关键的数据结构如下:

    1.1 struct VideoState

    1. typedef struct VideoState {
    2. SDL_Thread *read_tid; // demux解复用线程
    3. AVInputFormat *iformat;
    4. int abort_request;
    5. int force_refresh;
    6. int paused;
    7. int last_paused;
    8. int queue_attachments_req;
    9. int seek_req; // 标识一次SEEK请求
    10. int seek_flags; // SEEK标志,诸如AVSEEK_FLAG_BYTE等
    11. int64_t seek_pos; // SEEK的目标位置(当前位置+增量)
    12. int64_t seek_rel; // 本次SEEK的位置增量
    13. int read_pause_return;
    14. AVFormatContext *ic;
    15. int realtime;
    16. Clock audclk; // 音频时钟
    17. Clock vidclk; // 视频时钟
    18. Clock extclk; // 外部时钟
    19. FrameQueue pictq; // 视频frame队列
    20. FrameQueue subpq; // 字幕frame队列
    21. FrameQueue sampq; // 音频frame队列
    22. Decoder auddec; // 音频解码器
    23. Decoder viddec; // 视频解码器
    24. Decoder subdec; // 字幕解码器
    25. int audio_stream; // 音频流索引
    26. int av_sync_type;
    27. double audio_clock; // 每个音频帧更新一下此值,以pts形式表示
    28. int audio_clock_serial; // 播放序列,seek可改变此值
    29. double audio_diff_cum; /* used for AV difference average computation */
    30. double audio_diff_avg_coef;
    31. double audio_diff_threshold;
    32. int audio_diff_avg_count;
    33. AVStream *audio_st; // 音频流
    34. PacketQueue audioq; // 音频packet队列
    35. int audio_hw_buf_size; // SDL音频缓冲区大小(单位字节)
    36. uint8_t *audio_buf; // 指向待播放的一帧音频数据,指向的数据区将被拷入SDL音频缓冲区。若经过重采样则指向audio_buf1,否则指向frame中的音频
    37. uint8_t *audio_buf1; // 音频重采样的输出缓冲区
    38. unsigned int audio_buf_size; /* in bytes */ // 待播放的一帧音频数据(audio_buf指向)的大小
    39. unsigned int audio_buf1_size; // 申请到的音频缓冲区audio_buf1的实际尺寸
    40. int audio_buf_index; /* in bytes */ // 当前音频帧中已拷入SDL音频缓冲区的位置索引(指向第一个待拷贝字节)
    41. int audio_write_buf_size; // 当前音频帧中尚未拷入SDL音频缓冲区的数据量,audio_buf_size = audio_buf_index + audio_write_buf_size
    42. int audio_volume; // 音量
    43. int muted; // 静音状态
    44. struct AudioParams audio_src; // 音频frame的参数
    45. #if CONFIG_AVFILTER
    46. struct AudioParams audio_filter_src;
    47. #endif
    48. struct AudioParams audio_tgt; // SDL支持的音频参数,重采样转换:audio_src->audio_tgt
    49. struct SwrContext *swr_ctx; // 音频重采样context
    50. int frame_drops_early; // 丢弃视频packet计数
    51. int frame_drops_late; // 丢弃视频frame计数
    52. enum ShowMode {
    53. SHOW_MODE_NONE = -1, SHOW_MODE_VIDEO = 0, SHOW_MODE_WAVES, SHOW_MODE_RDFT, SHOW_MODE_NB
    54. } show_mode;
    55. int16_t sample_array[SAMPLE_ARRAY_SIZE];
    56. int sample_array_index;
    57. int last_i_start;
    58. RDFTContext *rdft;
    59. int rdft_bits;
    60. FFTSample *rdft_data;
    61. int xpos;
    62. double last_vis_time;
    63. SDL_Texture *vis_texture;
    64. SDL_Texture *sub_texture;
    65. SDL_Texture *vid_texture;
    66. int subtitle_stream; // 字幕流索引
    67. AVStream *subtitle_st; // 字幕流
    68. PacketQueue subtitleq; // 字幕packet队列
    69. double frame_timer; // 记录最后一帧播放的时刻
    70. double frame_last_returned_time;
    71. double frame_last_filter_delay;
    72. int video_stream;
    73. AVStream *video_st; // 视频流
    74. PacketQueue videoq; // 视频队列
    75. double max_frame_duration; // maximum duration of a frame - above this, we consider the jump a timestamp discontinuity
    76. struct SwsContext *img_convert_ctx;
    77. struct SwsContext *sub_convert_ctx;
    78. int eof;
    79. char *filename;
    80. int width, height, xleft, ytop;
    81. int step;
    82. #if CONFIG_AVFILTER
    83. int vfilter_idx;
    84. AVFilterContext *in_video_filter; // the first filter in the video chain
    85. AVFilterContext *out_video_filter; // the last filter in the video chain
    86. AVFilterContext *in_audio_filter; // the first filter in the audio chain
    87. AVFilterContext *out_audio_filter; // the last filter in the audio chain
    88. AVFilterGraph *agraph; // audio filter graph
    89. #endif
    90. int last_video_stream, last_audio_stream, last_subtitle_stream;
    91. SDL_cond *continue_read_thread;
    92. } VideoState;

    1.2 struct Clock 

    1. typedef struct Clock {
    2. // 当前帧(待播放)显示时间戳,播放后,当前帧变成上一帧
    3. double pts; /* clock base */
    4. // 当前帧显示时间戳与当前系统时钟时间的差值
    5. double pts_drift; /* clock base minus time at which we updated the clock */
    6. // 当前时钟(如视频时钟)最后一次更新时间,也可称当前时钟时间
    7. double last_updated;
    8. // 时钟速度控制,用于控制播放速度
    9. double speed;
    10. // 播放序列,所谓播放序列就是一段连续的播放动作,一个seek操作会启动一段新的播放序列
    11. int serial; /* clock is based on a packet with this serial */
    12. // 暂停标志
    13. int paused;
    14. // 指向packet_serial
    15. int *queue_serial; /* pointer to the current packet queue serial, used for obsolete clock detection */
    16. } Clock;

    1.3 struct PacketQueue

    1. typedef struct PacketQueue {
    2. MyAVPacketList *first_pkt, *last_pkt;
    3. int nb_packets; // 队列中packet的数量
    4. int size; // 队列所占内存空间大小
    5. int64_t duration; // 队列中所有packet总的播放时长
    6. int abort_request;
    7. int serial; // 播放序列,所谓播放序列就是一段连续的播放动作,一个seek操作会启动一段新的播放序列
    8. SDL_mutex *mutex;
    9. SDL_cond *cond;
    10. } PacketQueue;

    栈(LIFO)是一种表,队列(FIFO)也是一种表。数组是表的一种实现方式,链表也是表的一种实现方式,例如FIFO既可以用数组实现,也可以用链表实现。PacketQueue是用链表实现的一个FIFO。

    1.4 struct FrameQueue

    1. typedef struct FrameQueue {
    2. Frame queue[FRAME_QUEUE_SIZE];
    3. int rindex; // 读索引。待播放时读取此帧进行播放,播放后此帧成为上一帧
    4. int windex; // 写索引
    5. int size; // 总帧数
    6. int max_size; // 队列可存储最大帧数
    7. int keep_last; // 是否保留已播放的最后一帧使能标志
    8. int rindex_shown; // 是否保留已播放的最后一帧实现手段
    9. SDL_mutex *mutex;
    10. SDL_cond *cond;
    11. PacketQueue *pktq; // 指向对应的packet_queue
    12. } FrameQueue;

    本文福利, C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg webRTC rtmp hls rtsp ffplay srs↓↓↓↓↓↓见下面↓↓文章底部点击领取↓↓

    FrameQueue是一个环形缓冲区(ring buffer),是用数组实现的一个FIFO。下面先讲一下环形缓冲区的基本原理,其示意图如下:

    环形缓冲区的一个元素被用掉后,其余元素不需要移动其存储位置。相反,一个非环形缓冲区在用掉一个元素后,其余元素需要向前搬移。换句话说,环形缓冲区适合实现FIFO,而非环形缓冲区适合实现LIFO。环形缓冲区适合于事先明确了缓冲区的最大容量的情形。扩展一个环形缓冲区的容量,需要搬移其中的数据。因此一个缓冲区如果需要经常调整其容量,用链表实现更为合适。

    环形缓冲区使用中要避免读空和写满,但空和满状态下读指针和写指针均相等,因此其实现中的关键点就是如何区分出空和满。有多种策略可以用来区分空和满的标志:

    1. 总是保持一个存储单元为空:“读指针”“写指针”时为空,“读指针”“写指针+1”时为满;
    2. 使用有效数据计数:每次读写都更新数据计数,计数等于0时为空,等于BUF_SIZE时为满;
    3. 记录最后一次操作:用一个标志记录最后一次是读还是写,在“读指针”==“写指针”时若最后一次是写,则为满状态;若最后一次是读,则为空状态。

    可以看到,FrameQueue使用上述第2种方式,使用FrameQueue.size记录环形缓冲区中元素数量,作为有效数据计数。
    ffplay中创建了三个frame_queue:音频frame_queue,视频frame_queue,字幕frame_queue。每一个frame_queue一个写端一个读端,写端位于解码线程,读端位于播放线程。
    为了叙述方便,环形缓冲区的一个元素也称作节点(或帧),将rindex称作读指针或读索引,将windex称作写指针或写索引,叫法用混用的情况,不作文字上的严格区分。

    1.4.1 初始化与销毁 

     

    1. static int frame_queue_init(FrameQueue *f, PacketQueue *pktq, int max_size, int keep_last)
    2. {
    3. int i;
    4. memset(f, 0, sizeof(FrameQueue));
    5. if (!(f->mutex = SDL_CreateMutex())) {
    6. av_log(NULL, AV_LOG_FATAL, "SDL_CreateMutex(): %s\n", SDL_GetError());
    7. return AVERROR(ENOMEM);
    8. }
    9. if (!(f->cond = SDL_CreateCond())) {
    10. av_log(NULL, AV_LOG_FATAL, "SDL_CreateCond(): %s\n", SDL_GetError());
    11. return AVERROR(ENOMEM);
    12. }
    13. f->pktq = pktq;
    14. f->max_size = FFMIN(max_size, FRAME_QUEUE_SIZE);
    15. f->keep_last = !!keep_last;
    16. for (i = 0; i < f->max_size; i++)
    17. if (!(f->queue[i].frame = av_frame_alloc()))
    18. return AVERROR(ENOMEM);
    19. return 0;
    20. }

    队列初始化函数确定了队列大小,将为队列中每一个节点的frame(f->queue[i].frame)分配内存,注意只是分配frame对象本身,而不关注frame中的数据缓冲区。frame中的数据缓冲区是AVBuffer,使用引用计数机制。
    f->max_size是队列的大小,此处值为16,细节不展开。
    f->keep_last是队列中是否保留最后一次播放的帧的标志。f->keep_last = !!keep_last是将int取值的keep_last转换为boot取值(0或1)。

    1. static void frame_queue_destory(FrameQueue *f)
    2. {
    3. int i;
    4. for (i = 0; i < f->max_size; i++) {
    5. Frame *vp = &f->queue[i];
    6. frame_queue_unref_item(vp); // 释放对vp->frame中的数据缓冲区的引用,注意不是释放frame对象本身
    7. av_frame_free(&vp->frame); // 释放vp->frame对象
    8. }
    9. SDL_DestroyMutex(f->mutex);
    10. SDL_DestroyCond(f->cond);
    11. }

    队列销毁函数对队列中的每个节点作了如下处理:

    1. frame_queue_unref_item(vp)释放本队列对vp->frame中AVBuffer的引用

    2. av_frame_free(&vp->frame)释放vp->frame对象本身

    1.4.2 写队列

    写队列的步骤是:

    1. 获取写指针(若写满则等待);

    2. 将元素写入队列;

    3. 更新写指针。 写队列涉及下列两个函数:

    1. frame_queue_peek_writable() // 获取写指针
    2. frame_queue_push() // 更新写指针

    通过实例看一下写队列的用法:

    1. static int queue_picture(VideoState *is, AVFrame *src_frame, double pts, double duration, int64_t pos, int serial)
    2. {
    3. Frame *vp;
    4. if (!(vp = frame_queue_peek_writable(&is->pictq)))
    5. return -1;
    6. vp->sar = src_frame->sample_aspect_ratio;
    7. vp->uploaded = 0;
    8. vp->width = src_frame->width;
    9. vp->height = src_frame->height;
    10. vp->format = src_frame->format;
    11. vp->pts = pts;
    12. vp->duration = duration;
    13. vp->pos = pos;
    14. vp->serial = serial;
    15. set_default_window_size(vp->width, vp->height, vp->sar);
    16. av_frame_move_ref(vp->frame, src_frame);
    17. frame_queue_push(&is->pictq);
    18. return 0;
    19. }

    上面一段代码是视频解码线程向视频frame_queue中写入一帧的代码,步骤如下:

    1. frame_queue_peek_writable(&is->pictq)向队列尾部申请一个可写的帧空间,若队列已满无空间可写,则等待
    2. av_frame_move_ref(vp->frame, src_frame)将src_frame中所有数据拷贝到vp->
      frame并复位src_frame,vp->
      frame中AVBuffer使用引用计数机制,不会执行AVBuffer的拷贝动作,仅是修改指针指向值。为避免内存泄漏,在av_frame_move_ref(dst, src)之前应先调用av_frame_unref(dst),这里没有调用,是因为frame_queue在删除一个节点时,已经释放了frame及frame中的AVBuffer。
    3. frame_queue_push(&is->pictq)此步仅将frame_queue中的写指针加1,实际的数据写入在此步之前已经完成。

    frame_queue写操作相关函数实现如下:
    frame_queue_peek_writable()

    1. static Frame *frame_queue_peek_writable(FrameQueue *f)
    2. {
    3. /* wait until we have space to put a new frame */
    4. SDL_LockMutex(f->mutex);
    5. while (f->size >= f->max_size &&
    6. !f->pktq->abort_request) {
    7. SDL_CondWait(f->cond, f->mutex);
    8. }
    9. SDL_UnlockMutex(f->mutex);
    10. if (f->pktq->abort_request)
    11. return NULL;
    12. return &f->queue[f->windex];
    13. }

    向队列尾部申请一个可写的帧空间,若无空间可写,则等待

    frame_queue_push()

    1. static void frame_queue_push(FrameQueue *f)
    2. {
    3. if (++f->windex == f->max_size)
    4. f->windex = 0;
    5. SDL_LockMutex(f->mutex);
    6. f->size++;
    7. SDL_CondSignal(f->cond);
    8. SDL_UnlockMutex(f->mutex);
    9. }

    向队列尾部压入一帧,只更新计数与写指针,因此调用此函数前应将帧数据写入队列相应位置

    本文福利, C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg webRTC rtmp hls rtsp ffplay srs↓↓↓↓↓↓见下面↓↓文章底部点击领取↓↓

    2.4.3 读队列

    写队列中,应用程序写入一个新帧后通常总是将写指针加1。而读队列中,“读取”和“更新读指针(同时删除旧帧)”二者是独立的,可以只读取而不更新读指针,也可以只更新读指针(只删除)而不读取。而且读队列引入了是否保留已显示的最后一帧的机制,导致读队列比写队列要复杂很多。

    读队列和写队列步骤是类似的,基本步骤如下:

    1. 获取读指针(若读空则等待);
    2. 读取一个节点;
    3. 更新写指针(同时删除旧节点)。
      写队列涉及如下函数:
    1. frame_queue_peek_readable() // 获取读指针(若读空则等待)
    2. frame_queue_peek() // 获取当前节点指针
    3. frame_queue_peek_next() // 获取下一节点指针
    4. frame_queue_peek_last() // 获取上一节点指针
    5. frame_queue_next() // 更新读指针(同时删除旧节点)

    通过实例看一下读队列的用法:

    1. static void video_refresh(void *opaque, double *remaining_time)
    2. {
    3. ......
    4. if (frame_queue_nb_remaining(&is->pictq) == 0) { // 所有帧已显示
    5. // nothing to do, no picture to display in the queue
    6. } else {
    7. Frame *vp, *lastvp;
    8. lastvp = frame_queue_peek_last(&is->pictq); // 上一帧:上次已显示的帧
    9. vp = frame_queue_peek(&is->pictq); // 当前帧:当前待显示的帧
    10. frame_queue_next(&is->pictq); // 删除上一帧,并更新rindex
    11. video_display(is)-->video_image_display()-->frame_queue_peek_last();
    12. }
    13. ......
    14. }

    上面一段代码是视频播放线程从视频frame_queue中读取视频帧进行显示的基本步骤,其他代码已省略,只保留了读队列部分。video_refresh()的实现详情可参考第3节。
    记lastvp为上一次已播放的帧,vp为本次待播放的帧,下图中方框中的数字表示显示序列中帧的序号(实际就是Frame.frame.display_picture_number变量值)。

    在启用keep_last机制后,rindex_shown值总是为1,rindex_shown确保了最后播放的一帧总保留在队列中。
    假设某次进入video_refresh()的时刻为T0,下次进入的时刻为T1。在T0时刻,读队列的步骤如下:

    1. rindex(图中ri)表示上一次播放的帧lastvp,本次调用video_refresh()中,lastvp会被删除,rindex会加1
    2. rindex+rindex_shown(图中ris)表示本次待播放的帧vp,本次调用video_refresh()中,vp会被读出播放
      图中已播放的帧是灰色方框,本次待播放的帧是黑色方框,其他未播放的帧是绿色方框,队列中空位置为白色方框。
      在之后的某一时刻TX,首先调用frame_queue_nb_remaining()判断是否有帧未播放,若无待播放帧,函数video_refresh()直接返回,不往下执行。
    1. /* return the number of undisplayed frames in the queue */
    2. static int frame_queue_nb_remaining(FrameQueue *f)
    3. {
    4. return f->size - f->rindex_shown;
    5. }

    rindex_shown为1时,队列中总是保留了最后一帧lastvp(灰色方框)。按照这样的设计思路,如果rindex_shown为2,队列中就会保留最后2帧。
    但keep_last机制有什么用途呢?希望知道的同学指点一下。
    注意,在TX时刻,无新帧可显示,保留的一帧是已经显示过的。那么最后一帧什么时候被清掉呢?在播放结束或用户中途取消播放时,会调用frame_queue_destory()清空播放队列。

    rindex_shown的引入增加了读队列操作的理解难度。大多数读操作函数都会用到这个变量。
    通过FrameQueue.keep_lastFrameQueue.rindex_shown两个变量实现了保留最后一次播放帧的机制。
    是否启用keep_last机制是由全局变量keep_last值决定的,在队列初始化函数frame_queue_init()中有f->keep_last = !!keep_last;,而在更新读指针函数frame_queue_next()中如果启用keep_last机制,则f->rindex_shown值为1。如果rindex_shown对理解代码造成了困扰,可以先将全局变量keep_last值赋为0,这样f->rindex_shown值为0,代码看起来会清晰很多。理解了读队列的基本方法后,再看f->rindex_shown值为1时代码是如何运行的。

    先看frame_queue_next()函数:
    frame_queue_next()

    1. static void frame_queue_next(FrameQueue *f)
    2. {
    3. if (f->keep_last && !f->rindex_shown) {
    4. f->rindex_shown = 1;
    5. return;
    6. }
    7. frame_queue_unref_item(&f->queue[f->rindex]);
    8. if (++f->rindex == f->max_size)
    9. f->rindex = 0;
    10. SDL_LockMutex(f->mutex);
    11. f->size--;
    12. SDL_CondSignal(f->cond);
    13. SDL_UnlockMutex(f->mutex);
    14. }

    三个动作:删除rindex节点(lastvp),更新f->rindexf->size

    frame_queue_peek_readable()

    1. static Frame *frame_queue_peek_readable(FrameQueue *f)
    2. {
    3. /* wait until we have a readable a new frame */
    4. SDL_LockMutex(f->mutex);
    5. while (f->size - f->rindex_shown <= 0 &&
    6. !f->pktq->abort_request) {
    7. SDL_CondWait(f->cond, f->mutex);
    8. }
    9. SDL_UnlockMutex(f->mutex);
    10. if (f->pktq->abort_request)
    11. return NULL;
    12. return &f->queue[(f->rindex + f->rindex_shown) % f->max_size];
    13. }

    从队列头部读取一帧(vp),只读取不删除,若无帧可读则等待。这个函数和frame_queue_peek()的区别仅仅是多了不可读时等待的操作。

    frame_queue_peek()

    1. static Frame *frame_queue_peek(FrameQueue *f)
    2. {
    3. return &f->queue[(f->rindex + f->rindex_shown) % f->max_size];
    4. }
    5. static Frame *frame_queue_peek_next(FrameQueue *f)
    6. {
    7. return &f->queue[(f->rindex + f->rindex_shown + 1) % f->max_size];
    8. }
    9. // 取出此帧进行播放,只读取不删除,不删除是因为此帧需要缓存下来供下一次使用。播放后,此帧变为上一帧
    10. static Frame *frame_queue_peek_last(FrameQueue *f)
    11. {
    12. return &f->queue[f->rindex];
    13. }

    从队列头部读取一帧(vp),只读取不删除。

    本文福利, C++音视频学习资料包、技术视频,内容包括(音视频开发,面试题,FFmpeg webRTC rtmp hls rtsp ffplay srs↓↓↓↓↓↓见下面↓↓文章底部点击领取↓↓

  • 相关阅读:
    解锁内存之谜:从C到Python、Java和Go的内存管理对比
    Kotlin中特性、数据类、伴生对象、顶层函数
    JavaScript面向对象学习深拷贝、浅拷贝(三)
    OpenTiny 的这些特色组件,很实用,但你应该没见过
    vue3在路由route.js中获取不到仓库pinia中store里面的值
    Adobe XD最新版号查询,如何使用?
    【实践篇MySQL执行计划详解
    Spring Framework 简介与起源
    Vue的学习补充
    队列的基本操作(数据结构)
  • 原文地址:https://blog.csdn.net/m0_60259116/article/details/126145381