[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)

独立向量分析(IVA)理论上可以避免在频域独立分量分析中出现的排列模糊,方法是在保留每个源的不同频率单元之间的依赖关系之前使用多变量源。基于辅助函数的独立向量分析(AuxIVA)是一种稳定且快速更新的IVA算法,不包含任何调整参数。因此,本文采用一种特殊的多元广义高斯分布源先验来推导AuxIVA算法,该算法可以利用四阶关系来更好地保持语音信号不同频率单元之间的相关性。实验结果表明,该算法提高了分离性能。

独立分量分析(ICA)是盲源分离(BSS)问题的核心工具[1][2]。最著名的BSS问题是鸡尾酒会问题[3][4],在这个问题中,必须从混合声音中选择一个说话者。在真实的室内环境中,由于混响的影响,它成为卷积盲源分离(CBSS)问题。因此,由于计算复杂性[1],时域方法并不合适。因此,提出了频域方法来解决CBSS问题[5]。然而,为了获得分离结果,需要解决BSS固有的排列问题。人们提出了许多利用源的位置或光谱结构来解决排列问题的方法,但所有这些方法都需要后处理来解决问题.

独立矢量分析(IVA)被提出用于解决频域盲源分离(FD-BSS)问题。理论上,在保留每个源的不同频率单元之间的依赖关系之前,使用多变量源可以避免排列模糊[7][8][9]。因此,IVA可以在无需后处理的情况下解决收敛过程中的排列问题。近年来,人们提出了不同的改良IVA方法。为了提高收敛速度,提出了一种自适应步长IVA方法[10]。快速固定点IVA方法采用牛顿更新法,以获得IVA的快速收敛形式[11]。引入视频信息,形成基于音频视频的IVA方法[12]。2011年,基于辅助函数的独立向量分析(AuxIVA)被提出,这是一种稳定且快速的IVA算法。通过使用辅助函数技术,AuxIVA可以保证成本函数的单调下降,而无需调整步长等参数.

源先验对所有IVA方法都很重要,因为它用于推导非线性映射函数,用于保持不同频率单元之间的依赖性。对于原始IVA算法,采用多元拉普拉斯分布作为源先验[8]。然而,它并不是来源先验的唯一形式;仍然需要一种能够更好地保持不同频率单元之间关系的改进的源先验。本文采用广义多元高斯分布作为源先验,它可以在得分函数中保留四阶项。然后,推导了基于该特定源先验的AuxIVA算法。所提出的方法将被证明能更好地保持不同频率之间的关系,从而提高分离性能。

本文的结构如下:第二节分析了先验知识的具体来源。在第3节中,我们推导了具有源先验的AuxIVA算法,并讨论了该源先验的优点。然后,在第4节中,实验结果证实了所提出方法的优点。最后,在第5节中得出结论。

卷积盲源分离问题由以下公式描述:

[En]

The problem of convolution blind source separation is described by the following formula:

[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
x(k)是观测信号,s(k)是源信号,y(k)是估计的源信号。H(k)是混合信号,W(k)是解混矩阵。

在传统的CBSS方法中,源先验普遍采用标量拉普拉斯分布。然而,所得到的非线性评分函数是一个单变量函数,不能保留每个源的不同频率区间之间的相关性。在[8]中,IVA利用依赖的多变量拉普拉斯分布作为先验源。本文采用一种特殊的多元分布作为源先验,它可以写成:

[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
然后,由于傅里叶基的正交性,协方差矩阵被假定为对角矩阵,这意味着每个频率bin样本是相互不相关的。此外,如果源信号均值和方差为零,则源先验为
[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
这种新的信源先验可以看作是形状参数为2拍3的多元广义高斯分布,原来的多元拉普拉斯分布也属于这一类,形状参数为1。对于多元广义高斯分布,形状参数越小,尾部越重。因此,信源具有较重的尾部,在分离非平稳信号方面具有优势。
[En]

This new source prior can be regarded as a multivariate generalized Gaussian distribution with a shape parameter of 2 beat 3, and the original multivariate Laplace distribution also belongs to this category, with a shape parameter of 1. For multivariate generalized Gaussian distribution, the smaller the shape parameter is, the heavier the tail is. Therefore, the source has a heavy tail and has an advantage in separating non-stationary signals.

辅助函数技术由期望最大化算法发展而来,避免了步长调优[14]。在辅助函数技术中,设计了一个用于优化的辅助函数。辅助函数不是最小化代价函数,而是根据辅助变量最小化辅助函数。辅助函数技术可以保证代价函数的单调减小,从而提供了有效的迭代更新规则[13]。AuxIVA的对比度函数来自于源先验[14]。对于原始的IVA算法

[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
对于提出的源先验:
[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
该更新规则包括辅助变量更新和混合矩阵更新两部分。总而言之,更新规则如下
[En]

The update rule includes two parts: auxiliary variable update and mixing matrix update. In summary, the update rules are as follows

[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)
[论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)

这种四阶信息的使用在原始的AuxIVA中很少被强调。我们将展示语音信号固有的二阶信息和四阶信息的比较。我们从TIMIT数据库[15]中选择一个特定的语音信号”si10390.wav”,采样频率为8 kHz, DFT长度为1024。图1是协方差矩阵的一部分,对应于低频箱。由于能量有限,在高频箱中很难观测到任何信息。我们可以看到二阶信息主要分布在对角线上。这是因为傅里叶变换是一个正交基变换。

Original: https://blog.csdn.net/weixin_43749411/article/details/124557274
Author: 叶夏隐
Title: [论文阅读] 基于辅助函数的IVA(使用源先验的四阶关系)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/525093/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球