V/IQA有主观质量评估(Subjective Quality Assessment,SQA)和客观质量评估(Objective Quality Assessment,OQA)两大类,SQA和OQA都有各自的优缺点和适用范围和场景,都扮演着举足轻重的作用,为了实现最公平、最公正、最标准的评估,市面上各个企业和高校都同时使用SQA和OQA评价方案。
SQA是选定一批非专家类型的受测者,在受控环境下对视频图像的主观感受来对视频的质量进行评估。由于它是人对视频图像质量主观感受的直接反应,符合视频图像服务的最终目的,是所有评估方法的基础。
参数 | 规范 |
---|---|
亮度 | 200~2000 cd/m2(具体的要适配周围环境与个人习惯),相对值 |
色彩 | 包含了色度、色调等,舒适的色彩应该保持不过于艳丽,也不过于暗淡,相对值 |
清晰度 | 以视频内容的细节辨识程度为准,相对值 |
噪声 | 高斯、柏松、椒盐,呈现白色斑点状,一般光线暗淡较严重,相对值 |
块效应 | 视频画面出现类似马赛克现象,相对值 |
振铃效应 | 画面出现水波纹残影、震荡现象,类似美图秀秀中橡皮擦拭后现象,相对值 |
呼吸效应 | 画面忽清晰忽模糊,类似拍摄镜头聚焦现象,相对值 |
饱和度 | 视频图像的色彩鲜艳程度(纯度),相对值 |
对比度 | 视频图像的暗和亮的落差值,相对值 |
其他(细节、纹理、文字等) | 人物头发、织物、几何物体边界、文字等,相对值 |
DSIS(Double Stimulus Impairment Scale)是一种双刺激评估方法,此方法中,受测者观看多个原始视频序列和对应失真视频组成的“视频对”,且每次总是先显示原始参考视频,然后显示失真视频,受测者按照一定的评分等级,对失真视频相对于参考视频的总体失真程度进行打分,常用离散5分制度。如下表:
评分 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
描述 | 非常令人讨厌的 | 令人讨厌的 | 稍微令人讨厌的 | 能察觉到但不令人讨厌 | 完全察觉不到 |
具体的过程如下图,整个过程可以看出,利用10 s来持续观看参考视频序列,中间视觉休息3 s,紧接着利用10 s持续观看受损视频序列,最后利用4~11 s对受损视频序列相较于参考视频序列的偏离程度进行打分,也有衍生版本是进行两次的观看,第一次,加深主观视觉印象,第二次才进行评分。该方法核心是找到受损视频与参考视频的差距,并只对受损视频序列进行评分。
DSCQS(Double Stimulus Continuous Quality Scale)是一种双激励评估方法,一般分为I类和II类。在该方法中,受测者观看的仍是多个原始参考视频和对应的失真视频组成的“视频对”,与DSIS方法不同的是,原始参考视频和失真视频的显示顺序是随机的,并且受测者对每个“视频对”中的两个视频的质量都进行打分,即让受测者参考每个“视频对”中的一个视频对另外一个视频的质量进行打分。该方法提供连续的评分等级,为了与5分制一致,等分成5份,如表:
评分 | 0~1 | 1~2 | 2~3 | 3~4 | 4~5 |
---|---|---|---|---|---|
描述 | 很差 | 差 | 一般 | 好 | 很好 |
具体的过程如下图,整个过程可以看出,利用10 s时间持续观看测试序列A,中间视觉休息3 s,紧接着利用10 s持续观看测试序列B,中间视觉休息3 s,之后重复第二遍,最后利用5~11s分别对两个视频进行打分。整个过程受测者无法感知到哪个是参考视频序列,哪个是受损视频序列。
DSCQS II类是DSCQS I类的衍生版本,考虑到人的大脑神经系统的记忆衰退曲线,随着时间的递增,人对过往事物的记忆也随之递减。因此,DSCQS II类方法中,将待评分的“视频对”同时放映,在屏幕上呈现出左-右或上-下结构,从而实现让受测者同时观看参考视频序列与受损视频序列,保持同样的视觉停留记忆。也采用连续5 分评分制度,如表所示。
评分 | 0~1 | 1~2 | 2~3 | 3~4 | 4~5 |
---|---|---|---|---|---|
描述 | 很差 | 差 | 一般 | 好 | 很好 |
具体的过程如图所示,整个过程可以看出,利用10s时间持续观看一组“视频对”,接着视觉休息3s,再重复利用10s时间持续观看该组“视频对”,最后利用5~11s时间进行打分。整个过程,受测者无法感知到“视频对”中具体哪个是参考视频序列,哪个是受损视频序列。
SS(Single Stimulus)是一种单激励评估方法,在此方法中,随机组合若干个原始参考视频和失真视频并独立显示每个视频,对于不同的受测者,视频序列的显示顺序也是不固定,SS更多体现无参考主观视频质量评价,SS是不重复放映选定的所有测试序列直到结束,衍生版SSMR(single stimulus with multiple repetition)是重复放映选定测试序列(但需遍历完测试序列)并每次打分。该方法评分机制比较灵活,可以采用离散的5分制度,也可以采取9、11分制度,同样也可以采用连续的5分制度。举例连续5分评分制度如表所示。
评分 | 0~1 | 1~2 | 2~3 | 3~4 | 4~5 |
---|---|---|---|---|---|
描述 | 很差 | 差 | 一般 | 好 | 很好 |
SC(stimulus comparison)是一种激励比较方法,该方法中, 同时显示两个视频图像序列,由受测者给出指标,表示两个演示之间的关系;该方法类似DSCQS II类,即要求同时显示参考序列和受损序列,但评分机制标准不同,该方法更侧重表示出二者测序序列之间的关系。一般采用7分评分制度,如表所示。
评分 | -3 | -2 | -1 | 0 | 1 | 2 | 3 |
---|---|---|---|---|---|---|---|
描述 | 甚差 | 较差 | 稍差 | 相同 | 稍好 | 较好 | 甚好 |
SSCQE(Single Stimulus Continuous Quality Evaluation)是一种单激励评估方法,与上面方面不同的是,该方法选取的测试序列持续时间较长,大约10~30min,受测者持续对测试序列进行观看并隔一段时间打一次分,最后得出统计数据,最终得分不仅考虑分值也考虑打分时间。对应的衍生版SDSCE(simultaneously double stimulus continuous evaluation,同时双激励连续评价),方法一致,只不过增加基准序列同时放映,根据基准序列对测试序列进行持续评分。一般采用连续5分评分等级,如表2-6所示,其评分结果统计样例如图所示。
评分 | 0~1 | 1~2 | 2~3 | 3~4 | 4~5 |
---|---|---|---|---|---|
描述 | 很差 | 差 | 一般 | 好 | 很好 |
SAMVIQ(Subjective Assessment Method for Video Quality evaluation)是一种测试多个场景或者算法的视频质量评价方法,在该方法中,受测者准许使用同一个片段的若干个版本,当同一个片段都评测后,再对下一个场景片段进行评分 ;各个版本根据受测者随机选择;同一时间只能放映一个版本测试序列;评分也可以中途修改,直到当前场景各个版本全部评分结束。通常采用连续的百分制评分,但是为了与传统的5分制度保持一致,通常会等分成5分制度。
评分 | 0~1 | 1~2 | 2~3 | 3~4 | 4~5 |
---|---|---|---|---|---|
描述 | 很差 | 差 | 一般 | 好 | 很好 |
具体的界面呈现形式如图所示,从图中可以看出,受测者可以随机选择“视频组”里的任意版本进行连续观看,然后利用滑条进行打分;对该版本打完分之后,进行下个版本打分,直到所有版本全部打完分进行下一个场景的评测。要注意的是,在打分过程中,可以进行反复打分,直到完全符合自己内心最真实感受。