广东录播声学回声抵消算法

更新时间：2025-08-18 点击次数：2

黑色这条线是标准NLMS算法的回声抑制比。我们可以看到，NLMS算法在收敛之后，回声抑制比只能到10个分贝左右，相对比较低。而双耦合算法在收敛之后，可以达到25个分贝以上，也就是说它比NLMS算法多15个分贝，这个优势是很明显的。接下来我们再看第二个示例，针对弱非线性失真的情况，左边是语谱，右边是回声抑制比。我们评估单讲性能的主要指标是回声抑制比和收敛速度。首先看一下NLMS算法，它在收敛之后，大概可以抑制22~25个分贝。这个算法的收敛速度很慢，大概经过100多帧之后才会进入到相对收敛的状态。再来看一下双耦合算法，在稳定之后，可以抑制35~40个分贝，比NLMS算法大概提升15~20个分贝的回声抑制比。同时它还有一个很明显的优势：收敛速度很快，几乎是回声到了之后，他瞬间就进入到收敛状态。接下来这个是针对不同手机机型的回声抑制比的比较。红色是双耦合算法，蓝色是NLMS算法，从这组数据里面，我们可以看到双耦合算法比NLMS算法普遍提升了大概10个分贝以上的回声抑制比，具有比较大的优势。再进入双讲测试场景。我首先介绍一下测试的示例，这组数据是一个视频会议的数据，左边这个是原始的麦克信号语谱，右边这个是回声参考信号语谱。

非线性声学回声消除技术。广东录播声学回声抵消算法

这样会带来一个新的问题：按照Widrow的自适应滤波理论，滤波器的长度越长，其收敛速度越慢，同时权噪声越大，进而导致强混响下回声消除不够理想。第二个问题是延时跳变问题。在实时音视频通话领域，延时跳变是一个比较普遍的问题。主要现象是麦克端采集的信号和回声参考信号之间的时延关系会发生跳变，每次跳变之后就需要重新对齐信号，就会漏一些回声出来。第三个问题是啸叫问题。啸叫的检测和啸叫的抑制是公认的在回声领域的经典难题。还有双讲问题。双讲是评估回声消除算法性能的一个重要指标，当然也是很难处理的一个问题，因为双讲很容易导致滤波器系数发散。综合以上这些维度我们可以看到，非线性的声学回声消除是一个很有挑战的研究方向。双耦合声学回声消除算法这个是我们团队提出来的一种算法，它的主要特点是，在构建滤波器模型的过程中结合了非线性声学回声的一些特性，因此它在抑制非线性回声方面，也体现出固有的优势。1.非线性声学回声系统建模,继续回到前面的这个声学回声路径。我们对这个模型进行了简化。我们将左边的喇叭端用一个传递函数Wn来表示，假设它的是非线性的回声路径传递函数；同时我们将喇叭右边，就是麦克端，统一用Wl来表示。

广东录播声学回声抵消算法非线性声学回声消除的技术难点。

我们还希望它在一个短时的观测时间窗的尺度里面也是比较好的，即局部比较好，所以在数学期望内部，我们又对误差进行了短时积分。这个优化准则跟传统的线性自适应滤波器是有本质区别的，因为传统的线性自适应滤波器基于小均方误差准则，它只是在统计意义上比较好，没有局部比较好约束。首先来求解这里的Wl，就是线性滤波器。主要求解方法是，假设Wn就是非线性滤波器是比较好解，把这个比较好解代入到前面的优化方程里，就会得到上面简化之后的优化目标函数。在这个地方，我们又做了一些先验假设，假设非线性的滤波器的一阶统计量和二阶统计量都等于0，我们就可以把上面的优化问题进一步简化，就得到我们非常熟悉的方程，就是Wiener-Hopf方程。这个结果告诉我们，线性滤波器的比较好解跟传统的自适应滤波器的比较好解是一致的，都是Wiener-Hopf方程的理论比较好解。所以我们就可以采用一些现有的比较成熟的算法，比如NLMS算法、RLS算法，对它进行迭代求解。这就是Wl的设计。接下来再看看Wn的设计。Wn的设计跟Wl的设计是类似的，也是需要将优化之后的线性滤波器，代入到开始的优化问题里，可以把前面的优化问题简化成下面的方程。接下来进行一系列的变量替换之后。

对麦克接收到的声学信号进行调制，而这种振动本质上是一种随机的、非线性的振动，所以它必然会带来非线性失真。3.手机声学特性调研,我们之前针对市面上主要的手机机型做过一次调研，主要调查声学特性。结果我们很惊讶地发现，市面上超过半数的手机机型，声学特性不够理想，对应这里面的“较差”和“极差”这两档。我们平时用手机开外音玩游戏，或者语音通话时，经常会出现漏回声问题和双讲剪切问题，就与手机声学特性不佳有直接联系。当然这组数据只是针对手机这种电子产品，市面上类似于手机这样的电子产品还有很多，它们应该也有类似的问题。这组数据告诉我们，非线性失真问题在我们生活中的电子产品里是一个普遍存在的问题，我相信对这个问题的研究将会是一个很有价值也很有意义的方向。4.非线性声学回声消除技术研究现状我之前在IEEE的数字图书馆里搜索了“声学回声消除”的相关文献，一共找到了3402篇，其中有会议论文，还有期刊、杂志、书等。我用同样的方法搜索了“非线声学回声消除”，结果只找到了254篇文献，不到前面文献的1/10，这意味着非线性声学回声消除技术在整个声学回声消除领域是一个相对比较冷的研究方向。既然这个方向很有价值也很有意义。

声学回声消除应用技术。

也能够更清楚地看到这里面可能存在的回授现象。部分工程师在调试远程会议系统时也许遇到过啸叫，那可不一定是本地系统没调好所造成的，你会发现，关掉终端一切非常正常。为什么绝大多数的远程系统没有啸叫呢？这还得感谢您还不算非常质量的网络。我们常说，距离产生延时，而在模拟音频大举转向数字音频、网络音频的，网络信号的延迟也为音频领域赋予了新的现象，尤其应用在远程会议这样的音频传输系统当中，它能将一次次回授剥离成一次次听似回声的现象，这就是网络音频回声。通常由A地发出的声源A在几乎不经过延迟处理的本地系统中，通过A地音箱扩声；而其经过网络终端编码送向远端时，除了考虑A地的上传时间X，还得考虑B地的下载时间Y。在这样一个架构在Internet网络传输环境中的声音，其到达B地扩声音箱出来的信号则是A+X+Y。经B地本地话筒拾取后的该信号，再由B地的上传网速（时间）Z、A地的下载时间W传送回A地扩声音箱，其表现出的信号则会出现一次A信号，及一次赋予了（X+Y+Z+W）时间的A信号。假设A地—B地传输时间总和为200ms，B地—A地传输时间总和为200ms，则信号的一去一回。体现在A扩声音箱中至少会存在A和A+400ms的信号，若反馈信号电平足够强。则再被话筒拾取。

TWS耳机异音，底噪，回声测试难点。广东录播声学回声抵消算法

声学回声，表现为收发环路的隔离度不好，其根本原因就是耳机在装配时麦克风与喇叭的密封隔离没做好。广东录播声学回声抵消算法

WebRTCAEC算法中开辟了可存储250个block大缓冲区，每个block的长度PART_LEN=64个样本点，能够保存的1s的数据，这也是理论上的大延时能够估计的范围，够用了。我们用610ms延时的数据测试(启用大延时调整需要设置delay_agnostic_enabled=1)：我们还是设置默认延时为240ms，刚开始还是调整了-60个block，随后大延时调整接入之后有调整了-88个block，一共调整(60+88)*4=592ms，之后线性滤波器固定index=4，表示剩余延时剩余16ms，符合预期。③线性滤波器延时估计是固定延时调整和大延时调整之后，滤波器对当前远近端延时的直接反馈。前两者调整不当会造成延时过小甚至非因果，或延时过大超出滤波器覆盖能力，导致无法收敛的回声。因此前两者在调整的过程中需要结合滤波器的能力，确保剩余延时在滤波器能够覆盖的范围之内，即使延时小范围抖动，线性部分也能自适应调整。总结与优化方向WebRTCAEC存在的问题：（1）线性部分收敛时间较慢，固定步长的NLMS算法对线性部分回声的估计欠佳；（2）线性部分滤波器阶数默认为32阶，默认覆盖延时132ms，对移动端延时较大设备支持不是很好，大延时检测部分介入较慢。广东录播声学回声抵消算法

深圳鱼亮科技有限公司是一家有着雄厚实力背景、信誉可靠、励精图治、展望未来、有梦想有目标，有组织有体系的公司，坚持于带领员工在未来的道路上大放光明，携手共画蓝图，在广东省等地区的通信产品行业中积累了大批忠诚的客户粉丝源，也收获了良好的用户口碑，为公司的发展奠定的良好的行业基础，也希望未来公司能成为行业的翘楚，努力为行业领域的发展奉献出自己的一份力量，我们相信精益求精的工作态度和不断的完善创新理念以及自强不息，斗志昂扬的的企业精神将引领深圳鱼亮科技供应和您一起携手步入辉煌，共创佳绩，一直以来，公司贯彻执行科学管理、创新发展、诚实守信的方针，员工精诚努力，协同奋取，以品质、服务来赢得市场，我们一直在路上！

上一篇：上海耐磨卷筒电缆批发厂家
下一篇：黄山A90PS热解析仪TVOC检测