That is to organize a sufficient number of people to listen to the tested audio and score the samples, and finally evaluate the audio quality according to the score.

优点：

主观测试是音频评价的金标准，最符合人们的实际听觉。

[En]

Subjective testing is the golden criterion of audio evaluation, which is most in line with people’s actual sense of hearing.

缺点：

主观评估既费时又费力，不一定是最经济的选择。

[En]

Subjective evaluation is time-consuming and laborious, and is not necessarily the most economical option.

客观测试

通过给定数学公式计算音频质量评价指标，比如SNR、频谱差异等。结合计算结果拟合一个主观分数。

一. 音频主观评价方法

ITU(国际电信联盟)，联合国下属一个专门机构，负责电信、通话等相关标准等制定。比较有公信力的组织包括 ITU-R （无线电通信组） 和ITU-T （远程通信标准化组织）。这两个组织为了统一国际音频质量评价指标，制定了一系列的主、客观评价方法。

MUSHRA

介绍

（Multi-Stimulus Test with Hidden Reference and Anchor，多激励隐藏参考基准测试方法）属于 ITU-R BS.1534 中的推荐测试方法。它最早被用于流媒体与通信的相关编码的主观评价，现在也被广泛应用于心理声学相关研究中的音质主观评价。

MUSHRA 的分数是 0 到 100 分，按照从高到低的听感描述，如表 1 所示：

为了确保测试的有效性，我们需要注意以下四点：

[En]

In order to ensure the effectiveness of the test, we need to pay attention to the following four points:

参考的标准音频和被测试音频间隔测试，连续重复 4 次；（防止误判）
音频源采用 15～20s；（防止测试者产生听音疲劳）
一次完整的测试时间不应超过 15～20min；（防止测试者产生听音疲劳）
测试成员：专家成员最少 10 人，非专家 20 人。（使得标准不过于严苛更能符合大众的听音习惯）

特点：

其测试的特点主要是 在测试语料中混入无损音源作为参考（上限），全损音源作为锚点（下限），通过双盲听测试，对待测音源和隐藏参考音源与锚点进行主观评分。

MUSHRA 方法的测试面比较广，可以用于编 / 解码器，语音合成，甚至是耳机测评。

应用MUSHRA例子：

REF是无损音频，采样位深8bit记位8bit_lal_REF, Anchor35是锚点，其他为不同语音合成算法。

常用的主观评价指标：

MUSHRA方法
ITU-T P.800《语音质量的主观评价方法》，也就是我们常说的 MOS（Mean Option Scores，平均意见分）
ITU-T P.830《电话和宽带数字语音编码器的主观评价方法》
ITU-T P.805《对话质量的主观评价》
ITU-R 主观评价标准中的 ITU-R BS.1116 《音频系统中小损伤主观评价方法》
ITU-R BS.1285 《音频系统中小损伤主观评价的预选方法》

ITU官网： 国际电联：致力于连通世界

主观评价的缺点：测试员太少、测试员不规范等都会带来测试错误。

[En]

Subjective evaluation shortcomings: too few testers, non-standard testers and so on will bring test errors.

二. 音频客观评价方法

客观评价包括参考评价和非参考评价。

[En]

Objective evaluation includes reference evaluation and non-reference evaluation.

有参考评价：

除了给定的测试音频之外，您还需要提供参考音频作为基准。通过计算测试音频和参考音频之间的差值来拟合音频的主观分数。

[En]

In addition to the given test audio, you also need to give the reference audio as a benchmark. The subjective score of the audio is fitted by calculating the difference between the test audio and the reference audio.

PESQ与POLQA

在 2001 年，ITU-T P.862 标准定义了有参考客观评价算法PESQ（Perceptual Evaluation of Speech Quality，语音质量感知评价），该算法主要用来评估 窄带（8kHz 采样率）及宽带（16kHz 采样率）下的编、解码损伤。该算法在过去的二十年中，被广泛的应用于通信质量的评定。已开源。

2011 年，P.863 标准定义了一套更全面、更准确的有参考客观评价POLQA。相比 PESQ，POLQA 可评估的带宽更广，对噪声信号和延时的鲁棒性更好，其语音质量评分也更接近于主观的评分。需要购买百万元的专门设备和授权才能使用。

PESQ的算法步骤：

时间对齐：目的消除系统延迟的影响。

听觉变换：将音频信号转化为频谱信号。

差异处理：逐帧处理

取时间平均得到PESQ分数。如对齐错误可再次对齐。

PESQ 的分数范围在 0～4.5 分，一般音质比较好的编／解码器，比如 64kbps 比特率的 OPUS 编解码器，可以达到 4.5 分，而分数越低则代表音质越差。比如 OPUS 的码率降到 6kbps 那 PESQ 可能就只有不到 3 的分数。

note：

PESQ 最多只能评价 16kHz 采样率的音频。如果要评价一个采样率比较高的音频信号，比如 音乐信号，POLQA 会比较合适。POLQA 最高可以支持 48kHz 采样率的全带音频的客观质量评价。但购买一套 POLQA 设备的价格都是百万级的，为了方便使用，你还可以考虑一下使用例如 ViSQOL 等开源算法，也可以支持 48kHz 的音频采样率。

无参考评价：

不需要参考音频，评分是基于音频的频谱能量分布和连续性。

[En]

There is no need to refer to the audio, and the score is based on the spectrum energy distribution and continuity of the audio.

适用场景：

例如，当制作互联网电话时，只接收经过编码/解码并通过网络传输的音频信号，并且没有远程输入信号。暂时只能使用无参考音质评估方法。

[En]

For example, when making an Internet phone, only the audio signal that has been encoded / decoded and transmitted over the network is received, and * there is no remote input signal. * No reference audio quality evaluation method can only be used at this time.

不需要参考信号，仅通过分析输入信号本身或参数即可获得质量分数。

[En]

No reference signal is needed, and a quality score can be obtained only through the analysis of the input signal itself or parameters.

比较著名的无参考客观评价方法：

IT U-T P.563

2004 年提出，主要是面向窄带语音的质量评估

ANIQUE+

2006 年提出，也是面向窄带语音，其评分准确度据作者称超过了 PESQ，不过 PESQ 的测量不能反应网络的延时、丢包等，并不能完美适用于如今基于互联网传输的实时互动场景。

E-model

于 2003 年提出，不同于上述两种方法，这是一个基于 VoIP 链路参数的损伤定量标准，不会直接基于信号域进行分析。

ITU-T P.1201

ITU-T P.1201 系列于 2012 年提出，对于音频部分，该标准也不对音频信号直接进行分析，而是基于网络状态和信号状态对通信质量进行评分。

三. 小结：

客观测试目前只能测量音频的损伤程度，比如我们平时在选择编解码器时不知道选择什么类型、多少码率，这时不妨跑一下 PESQ 或者 VisQol 看一下分数。

然而，对于一些主观测试类型，如音乐感、耳机效果等，我们仍然需要依靠主观测试。主观测试可以通过众包等方式进行分发。

[En]

However, for some subjective test types, such as music sense, headphone effect and so on, we still need to rely on subjective test. Subjective tests can be distributed by crowdsourcing and other ways.

针对这种分发式的主观测试，最近的 ITU-T P.808 也有详细的测试流程和方法。

Original: https://blog.csdn.net/qq_36533552/article/details/125487419
Author: 咕噜咕噜day
Title: 04｜主观与客观评价音频质量

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/514989/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

86 R k-means，层次，EM聚类介绍

R k-means，层次，EM聚类 1什么是客户分群 * 什么是分群? 为什么要分群? 2 聚类分析方法论 * 客户分群的算法 3 样本间距离定义 4 层次聚类分析方法论 * 层次…

人工智能 2023年7月18日
0078
pandas从身份证中取得生日，转为日期

df[‘份证号码’].str[6:14] 取df表中的’公民身份证号码’列的全部数据，转换为字符串str类型，再截取第6+1到14+1(不含)个字符 110000 10001231…

人工智能 2023年7月7日
0093
[CG从零开始] 3. 安装 pyassimp 库加载模型文件

assimp 是一个开源的模型加载库，支持非常多的格式，还有许多语言的 binding，这里我们选用 assimp 的 python 的 binding 来加载模型文件。不过社区主…

人工智能 2023年6月4日
0096
【图像聚类】基于matlab GUI K-means算法图像聚类【含Matlab源码 1787期】

⛄一、图像分割简介 0 引言图像分割技术是图像分析和模式识别的重要内容, 已广泛地应用于计算机视觉、目标跟踪、遥感图像、生物医学图像等领域, 至今仍是热门的研究课题之一。图像分割…

人工智能 2023年5月31日
00100
脉冲神经网络：MATLAB实现脉冲神经网络(Spiking Neural Network，SNN) 用于图像分类（提供MATLAB代码）

一、脉冲神经网络脉冲神经网络 (Spiking Neural Network，SNN) ，是第三代神经网络。其旨在弥合神经科学和机器学习之间的差距，使用最拟合生物神经元机制的模型…

人工智能 2023年7月13日
0097
【基于知识图谱的前后端（vue+django）分离的问答系统的设计与实现（二）：前端搭建与插件配置】

基于知识图谱的前后端（vue3+django）分离的问答系统的设计与实现基于知识图谱的前后端（vue3+django）分离的问答系统的设计与实现（一）：总体介绍基于知识图谱的前后…

人工智能 2023年6月1日
00120
使用spss做各种相关性分析的方法和步骤

目录数据类型相关性分析的方法用spss操作卡方检测 Eta检测皮尔逊(Pesrson)检测 Spearman(斯皮尔曼) 数据类型先说明spss里的三种数据类型, 可以…

人工智能 2023年7月16日
0070
bert4keras加载BERT模型并获取文本字向量、句向量CLS

bert4keras加载BERT模型并获取文本字向量、句向量CLS 环境依赖 tensorflow2.3+ bert4keras 开源BERT模型下载 BERT模型https://…

人工智能 2023年5月23日
00105
SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！文章目录阅读前请看一…

人工智能 2023年7月29日
0086
Win10下CUDA版OpenCV的编译过程

1.编译环境 1）系统环境：Win10( i7-8700 CPU, 16GB RAM)+RTX 2070+VS2017 Enterprise+CUDA 11.6+cuDNN v8….

人工智能 2023年7月28日
00107
Python – matplotlib – 如何探索两个变量间关系？

文章目录一、序言二、实战演示 * 1. 直方图 2. 箱型图和小提琴图 3. 散点图三、结语一、序言随着各种组学技术的发展，一个样本可能对应成千上万个变量，现阶段研究往往…

人工智能 2023年7月16日
0071
机器学习——朴素贝叶斯分类

一贝叶斯原理 1.1贝叶斯原理产生背景：贝叶斯原理是英国数学家托马斯·贝叶斯提出的，他写的一篇关于归纳推理的论文直接影响了接下来两个多世纪的统计学，是科学史上著名的论文之一。贝…

人工智能 2023年6月16日
0067
天猫订单数据综合分析

一、项目介绍本项目通过对天猫成交数据的探索，通过python对数据预处理，整个项目分为项目目的的确定、数据的预处理、对数据的分析和项目总结这五个部分。（本项目参考凹凸数据）二、…

人工智能 2023年6月11日
00109
【Python入门教程】第73篇写入CSV文件

本篇我们介绍如何使用 Python 内置的 csv 模块将数据写入 CSV 文件。写入 CSV 文件在 Python 代码中写入 CSV 文件的步骤如下：首先，使用内置的 o…

人工智能 2023年7月5日
00100
【教程】标注工具Labelimg的安装与使用

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月10日
0066
图神经网络（11）— 在知识图谱上推理

目录预测单跳查询（one-hop queries）预测路径查询（path queries） Traversing Knowledge Graphs in Vector Spac…

人工智能 2023年6月1日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

04｜主观与客观评价音频质量

MUSHRA

介绍

特点：

应用MUSHRA例子：

常用的主观评价指标：

有参考评价：

PESQ与POLQA

PESQ的算法步骤：

note：

无参考评价：

适用场景：

比较著名的无参考客观评价方法：

大家都在看