-->
为五月的纽约流媒体保留座位吧. Register Now!

It's Time to Retire PSNR

Article Featured Image

Vi实际上,所有视频质量指标的专家都认为峰值信噪比(PSNR)指标不能很好地预测主观质量. Yet, PSNR比较包含在几乎所有的编解码器比较中, 最近在优秀的IEEE白皮书中, "客观与主观评价VVC、HEVC和AV1的比较.“是时候让PSNR退休了,至少对于这些类型的分析来说是这样. 

当我开始回顾时,我再次想起了PSNR的糟糕表现 ITU- t Rec新视频质量指标的测试结果. P.1204. Taking a step back, 百家乐软件app最新版下载使用视频质量指标的原因是为了帮助做出编码决策,从而提高主观质量. For this reason, 对于任何指标来说,最关键的性能特征是它预测人眼对同一视频的评价有多准确. 

为了评估这一点,研究人员汇编了视频数据库和来自多个观众的主观评分. 然后,他们用度量标准对分数进行评分,并将这些分数与同一视频的主观分数进行比较. You can see three such comparisons in the graphic; on the left for P.1204.3、中间为PSNR,右边为 视频多方法评估融合(VMAF). In all three, the 纵轴表示主观评分的结果, 而横轴是度量分数. 

如果度量分数与主观评分完全匹配, 你会看到一条实线,从左下角到右上方. 没有一个度量是完美的,所以你永远不会看到一条实线. However, 这条线周围的数据点越密集, 预测越准确. Looking at the graphs, P.1204.3 is the 最准确,VMAF次之,PSNR次之 least by far. 你可以看到一个类似的图表 SSIMPLUS.

图形中的模式由每个数据集的Pearson相关系数(PCC)验证. 简而言之,PCC测量两个变量:X和Y之间的线性相关性. 根据Statistics Solutions,“如果系数值在±0之间.50 and ± 1, 那么我们就说这是一个很强的相关性." So 尽管PSNR图看起来是随机的, 数学家会说这种相关性很强. 然而,当VMAF、SSIMPLUS和P等更准确的指标出现时.1204是可用的,PSNR作为质量的衡量是浪费时间和空间. 

有趣的是,PSNR有一个“煤矿里的金丝雀”实用程序,它可以识别VMAF的黑客方法. That is, 像预编码锐化和对比度调整这样的黑客技术可以使VMAF分数飙升, 但也会将PSNR分数发送到地板上. 如果你看到VMAF分数过高, 你应该运行一个快速的PSNR测试来验证入侵. 然而,就连这种使用也在逐渐减少,因为Netflix最近推出了一款 no-hacking model 所有编解码器测试人员都应该探索.

Keep your eye out for more on P.1204.3, 哪一种“无参考”指标可以在不将编码文件与源文件进行比较的情况下计算分数. 这使得它比全参考指标(如PSNR和VMAF)方便得多. If P.1204.3找到了像FFmpeg和莫斯科国立大学视频质量测量工具这样的工具, 这将为从编解码器比较中去掉PSNR提供更大的理由.

Streaming Covers
Free
for qualified subscribers
Subscribe Now Current Issue Past Issues
Related Articles

如何选择视频质量指标

Jan Ozer讨论了三个关键目标质量度量工具的优缺点, SSIMplus, and Hybrik (Dolby).

当涉及到视频质量测量,平均不会削减它

平均分数可能具有欺骗性, 因此,请确保您使用的工具可以更准确地评估您的视频质量

视频:如何测量图像质量

泰克应用工程师Andrew Scott在流媒体西部2018年的演讲中讨论了图像质量测量的客观和主观方法和工具.