买家视频质量指标指南
视频质量指标是设计用来预测实际观众如何衡量视频质量的算法. 这些指标用于一系列活动, 通过比较编解码器和不同的编码配置, 协助生产和生活质量体验(QoE)的监控. 在这个买家指南中, 我将识别并描述最常用的客观质量度量标准,并讨论部署它们的工具, 虽然主要用于比较编解码器和编码配置, 而不是QoE或生产监控.
立即访问我们的2019年百家乐软件手册. 立即注册免费下载整个问题!
理解视频质量指标
表1 提供最常用的视频质量指标的分类. 最左边是主观的平均意见得分(MOS),根据实际观众对视频的评分,从1到5进行计算. 而不是像其他指标那样由计算机计算出来的指标, 主观最大限度是黄金标准,因为它提供了实际主观评级的最佳预测值. 所有其他评级都不那么准确,尽管它们随着向右移动而提高.
Note that not all metrics expressed as mean opinion scores are subjective; several video quality measurement tools output objective ratings using the five-point MOS scale. 这些评级是由计算机生成的,这一事实在您浏览产品文献时应该是显而易见的, 但我想做这个区分以避免任何混淆.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/122566-Ozer-Metrics-Table-1-ORG.png)
表1. 常见的视频质量指标和相关的特征和解释. (点击查看全尺寸版本)
往下看左边的特征, Basis是度量的理论基础(ML代表机器学习). PSNR(峰值信噪比)和SSIM(结构相似度)完全基于数学算法. 这让它们变得静止不动,意味着它们不会随着时间的推移而改善. 根据SSIMplus开发者SSIMWave的说法, 机器学习对SSIMplus算法的发展做出了贡献, 因此,随着时间的推移,它已经得到了改进,并将继续这样做. 与此形成鲜明对比的是, VMAF(视频多方法评估融合)是基于机器学习增强的算法, 因此,随着时间的推移,它会得到改进,并且可以对特定内容的数据集进行更好的预测, 比如动画片频道的动画视频或者体育频道的体育视频. 这在很大程度上解释了预测价值排名的原因.
表中的所有客观度量都是“参考”度量, 这意味着它们是通过比较编码文件和源文件来计算的. 一般来说,MOS试验不需要查看源视频文件,但有些试验需要. 一般, 基于引用的度量比非引用度量更准确,后者用于不可能(无法访问源代码)或不切实际(实时编码)的应用程序中。.
评分是视频质量度量所使用的尺度,它随度量而变化. 接下来的几个特性详细介绍了如何使用和解释度量,并表示了度量在不同应用程序中的效用, 我稍后会详细说明. 例如, “无伪影”阈值是假定视频没有干扰伪影的分数, 在“伪影可能出现”的情况下,你会认为视频开始看起来很丑. 代替这个, 您可以简单地使用评级系统显示哪些细节分数与优秀相关, good, fair, poor, 视频质量差.
使VMAF特别有用的一个特性是,6个点的差异构成了一个仅可注意的差异, 一般认为,75%的观众能注意到的差异是什么. If the VMAF rating of two codecs differs by 2 points it's presumed unnoticeable; while higher is always better, 大多数观众根本不会注意到.
设备评级是对特定设备的视频质量进行评级的能力, 这反映了一个现实,即在iPhone上看起来很棒的视频在4K电视上可能看起来很糟糕. SSIMplus在这一评级中领先于数十个设备评级. VMAF有三种评级,标准、手机和最近推出的4K评级.
最后一个特征是所有权. 除了SSIMplus之外的所有指标都是开源指标, 这意味着它们可以在各种工具上使用, 包括一些免费工具,如FFmpeg.
指标汇总
以下是每个指标的简要总结.
PSNR-可能是最广泛使用的指标,但也被认为具有最低的预测值. Netflix仍在引用, 脸谱网, 和其他公司在编解码器的比较和类似的应用,但使用率正在下降.
SSIM—预测值略高于PSNR, 不太出名, 但受到一些编解码器研究人员和压缩工程师的青睐. 使用率正在下降.
SSIMplus-非常实用且备受推崇的指标,但由于专有,所以除了SSIMWave的工具之外没有其他工具,SSIMWave的起价约为995美元.
VMAF-由Netflix发明,然后开源,VMAF被广泛使用. 为计算编码阶梯上的多分辨率梯级编码的流而设计并进行了优化, VMAF是Netflix备受推崇的每个标题和每个片段编码堆栈背后的引擎. 功能非常强大,是个后起之秀.
Tools
有很多产品可以用5来计算指标 表2. 这些不是唯一的产品,但却是我最熟悉的. 如果您有此类别的产品未列出,请通过janozer@gmail与我联系.来讨论.
请注意,有一个完全独立的产品类别,来自各种公司的实时质量检查, 包括SSIMWave (SSIMPlus实时监视器)、电视频道(检查员生活)、泰克(哨兵),测量和监控视频质量,以确保持续的质量质量. 这些不是本买家指南的重点.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/122567-Ozer-Metrics-Table-2-ORG.png)
表2. 用于计算视频质量指标的工具. (点击查看全尺寸版本)
根据表2中工具的高级分类, FFmpeg是一种生成考试成绩的免费方式, 但显然缺乏可视化等对理解指标至关重要的功能. 来解释, 当你使用客观指标时,你至少要关心两个分数, 平均值和最低帧值.
Why? 如果比较用CBR和VBR编码的视频,总体得分通常比较接近. 然而, CBR视频可能有短暂的补丁,其中质量下降足以损害体验的质量. FFmpeg提供了一个单一的分数,没有最低分数的可见性,所以你在黑暗中. 与此形成鲜明对比的是, 莫斯科大学视频质量测量工具(VQMT)允许您输出任何数量的“坏帧”来识别问题, 而所有其他提供可视化,允许您查看值在视频持续时间内如何变化, 哪个VQMT也一样.
你可以在 图1 来自SSIMWave VOD监视器,该监视器跟踪使用不同标题编码技术编码的多个视频的质量. 正如你所看到的,一些视频有质量明显下降的区域. 在SSIMWave工具中, 您可以单击任何图形值的任何位置,并从任何测试视频中查看该帧. 这使您能够识别潜在的问题区域,并验证问题是否确实存在. 底线是,如果你认真对待你的文件比较,你需要一个具有GUI和可视化的工具.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/122569-Ozer-Metrics-Fig1-ORG.png)
图1. SSIMWave的VOD监控工具提供了非常灵活的结果可视化. (点击查看全尺寸版本)
除了FFmpeg之外,这些工具大致分为三类. VQMT和VideoQuest是单用户桌面工具,主要用于实验, 而SSIMWave VOD监视器是基于centos的多用户实验和生产监视器. Hybrik是我们唯一的云入口,这意味着几乎无限的大批量生产. 研究表2中的特性将有助于明确这些区别,我将在本讨论的最后对每个产品进行总结.
在操作范式方面, VQMT和VideoQuest可以用类似的命令行操作将两个编码文件与GUI中的单个源文件进行比较. SSIMwave和Hybrik工具都可以在GUI中将多个文件与单个文件进行比较, 加速操作, 使用Hybrik,你可以从多个文件中下载结果的CSV文件, 简化导入和分析. 与此形成鲜明对比的是, 与VQMT, VideoQuest, 和视频点播监视器, 你必须从单个CSV文件中复制和粘贴单个分数, 这很无聊, 耗费时间, 容易出错.
除了, VQMT和VideoQuest在指定的操作系统上运行,主要是单人工具. 与此形成鲜明对比的是, SSIMWave VOD监视器在CentOS上运行,具有基于浏览器的GUI,任何可以访问CentOS计算机的计算机都可以访问该GUI, 而Hybrik是一个SaaS web应用程序,任何有浏览器和连接的人都可以访问. 而VQMT和VideoQuest都提供批处理操作, SSIMWave和Hybrik可以由REST API驱动,因此结果可以很容易地集成到生产环境中.
交叉分辨率指的是比较单一源文件的多个分辨率的能力, 当您测量编码阶梯中所有文件的质量时,哪种情况比较常见. 使用VQMT和VideoQuest, 首先必须将低分辨率文件转换为与源文件相同分辨率的YUV文件, 哪一种既耗时又需要大量磁盘空间. 与此形成鲜明对比的是, SSIMWave和Hybrik不需要这个,所以你可以比较360p文件和1080p源,而无需事先转换. SSIMWave更进一步,能够比较具有不同帧率的文件, 比如30fps 720p版本的文件和1080p60主机.
VideoQuest和SSIMWave也可以自动对齐源和编码版本的文件, 当编码器在视频开始时添加或删除一帧时,哪个变得至关重要, 令人沮丧的频繁事件. With VQMT, you have to adjust this manually; 与Hybrik it's not possible at all.
指标是不言自明的,我们在上面讨论了输出“坏帧”的能力. 与文件相关的信息与工具可以从文件中收集的其他非度量相关数据相关. 举个例子, eard VideoQuest的一个特别优势是能够显示中显示的框架和文件信息 图2. 具体地说, 能够在底部GOP中查看帧类型并知道所比较的帧都是大小相同的P帧是很棒的. 其他未显示的屏幕显示了与测试文件相关的更多比较数据, 允许深入的比较和分析,这在任何其他工具中都是不可能的.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/122570-VideoQuest-ORG.png)
图2. VideoQuest提供显示大量重要的文件相关数据.
我们在上面介绍了结果可视化屏幕和设备评级. 输出是指分析完成后评分信息的传递方式. 单文件输出意味着20个不同的打开、复制和粘贴操作,以记录20个不同的分数. 在这方面, 与Hybrik, 您可以将无限数量的文件输出到单个CSV中, 在一些复杂的分析中,它可以节省数小时的工作.
我将把特征表数据合成为以下与产品相关的操作.
Ffmpeg-只适用于那些买不起其他工具的人.
VQMT-易于使用和快速与一个伟大的可视化工具, 广泛的度量选择和优秀的命令行实用程序. 如果您希望进行多个文件比较,VQMT是一个很好的工具.
VideoQuest-在可用性方面落后于VQMT,但提供了出色的文件相关数据和观看和比较视频的强大能力. 一个很好的深度文件比较工具.
SSIMWave VOD监视器-唯一的工具与SSIMplus度量,但不支持VMAF. 出色的多文件可视化, 业界领先的设备支持, 以及强大的大容量和多用户功能. VOD Monitor也有独特的指标, 比如感知保真度度量, 排除源视频中的视觉缺陷来对编码结果进行评分, 加权平均指数, 哪一种方法能让你将视频的质量差异纳入最终评级. 总的来说,这是一个深入、强大和高度可用的工具.
Hybrik -视频分析是Hybrik云编码平台的一大特色, 不是一个单独的产品, 这是令人沮丧的,因为对于大多数用户来说,购买仅用于分析的功能太贵了. Hybrik提供了一系列可靠的指标和QC工具(参见 图3), 而云操作允许Hybrik处理比你在一台电脑上处理的文件多得多的文件. 对于长文件和/或高分辨率文件的大容量处理,Hybrik是无可匹敌的.
![](http://dzceab466r34n.cloudfront.net/Images/ArticleImages/InlineImages/122571-Hybrik-ORG.png)
图3. Hybrik的指标和QC工具.
请注意,VQMT和VideoQuest都提供试用版,您可以从SSIMWave请求一个. 我建议将此作为您感兴趣的任何工具的第一步.
本文首次发表于2019年流媒体欧洲行业资料手册.]
立即访问我们的2019年百家乐软件手册. 立即注册免费下载整个问题!
相关文章
平均分数可能具有欺骗性, 因此,请确保您使用的工具可以更准确地评估您的视频质量
2020年2月10日
超过100,000名创作者使用Patreon来经营他们的创意业务, 品牌可以利用这个平台的热情和百家乐软件. 以下是如何在Patreon上取得成功的方法.
11月6日2019
移动运营商使用下载速度来提升其网络的视频质量, 但视频下载速度和流媒体视频质量并不总是相关的.
10月14日2019
运行视频质量测量任务有很长的路要走,也有更短的路要走. 正如我们的专栏作家学到的,学习一个更有效的系统永远不会太晚.
2019年5月14日
论坛媒体的罗伯·狄龙和普罗米修斯.在2018年流媒体西部OTT领导力峰会上,电视的Abe Gottesman讨论了有效解释和使用来自多个来源的数据所面临的挑战.
3月13日2019
流媒体学习中心的1月时在他在2018年流媒体西部的演讲片段中列出了编码评估的客观质量指标的基础知识.
2019年2月27日
Comcast技术解决方案架构师Ribal Najjar讨论了如何在QoE和QoS指标之间实现共性,以提供“超级强大”的数据集.
10月11日2018
Citrix首席架构师Josh Gray在流媒体东2018的这个剪辑中解释了视频如何实现更高灵敏度的指标分析.
2018年9月17日
城市规划师Ariel Viera说, USGA的斯科特·利普斯基, 和哥伦比亚广播公司体育广播的达蒙·阿门多拉拉在2018年东流媒体直播峰会上讨论了衡量观众参与度的最有效方法.
2018年7月12日
提及的公司及供应商