数据网络中的回声消除技术

2019-11-03 09:03:14

字体：大中小

来源：转载

供稿：网友

Octasic公司

　　互联网在全球的普及导致了创新和应用的爆炸性发展。这个趋势还将继续（主要由消费需求推动），因此电信运营商注定要在数据通信占主导的现代网络基础设施中支持话音业务。

　　尽管数据通信现在已经超过了话音业务，服务提供商的主要收入仍然来自传统的话音业务。为了保护这个收入来源，电信运营商必须保持当前话音业务的质量，并且创建支持各种新型数据业务的网络。下一代网络需要在这些新型业务到来时，能够利用这些业务的优点。

　　话音业务在无线、有线、电路交换以及分组交换网络中，均至关重要，而话音质量作为一个保持因素，是一项基本要求。

　　什么是回声？

　　回声是由于声波反射导致的声音重复。在电信网络中，如果说话人听到自己讲话的延迟后的声音，则存在回声问题。

　　呼叫者是否听到回声，依赖于电路中网络延迟的程度和回声幅度（音量）。端到端延迟（也称为"等待时间"）是最重要的因素，它是从呼叫的一端产生声音到声音被另一端接收所经历的时间。往返延迟是回声反射所花费的时间，它大约是端到端延迟的两倍。

　　如果往返延迟超过10毫秒(ms)，则人耳就会注意到回声的存在，因而导致话音质量下降。

　　回声源

　　在电信网络中存在两种类型的回声：电气回声和声学回声。

　　电气回声

　　电气回声是由于模拟本地环中的阻抗不匹配造成的。举例来说，如果使用了混合规格的电线，或者存在未使用的分接头和负载线圈（用于延长信号传输距离的装置），则会产生电气回声。在公共交换电话网(PSTN)中，电气回声主要是由于转换器造成的。

　　转换器将2线本地环分接成两对独立的线。一对用于发送路径，另一对用于接收路径。转换器传递了大部分信号。但是，2线环路与4线设备之间的差别导致了接收信号的一小部分"泄漏"到发送路径上。由于远端在接收信号的同时又返回了一部分信号，因此说话者听到自己说话的回声。

　　电气回声在本地呼叫上不成为问题，这是因为相对较短的路径不会产生严重的时间延迟。

　　在今天的数字网络中，2线分接成4线的位置通常也是模/数转换的位置。无论转换器或者模/数转换是在同一台设备还是两台不同设备中进行，2线－4线转换造成阻抗不匹配，因而导致回声。

　　声学回声

　　声学回声也称为"多径回声"，它是由电话机扬声器与话筒之间的声学耦合问题导致的。在无线电话和有线电话，或者在扬声器电话的免提设备中都会出现这种回声。这些问题是由低质量的电话听筒、周围环境中的回声（例如在汽车、旅馆或工厂中）或者电话听筒串话造成的。

　　回声传播时间

　　如前面所讨论的，当话音电路的往返延迟大于20ms时，就会产生回声问题。在PSTN中，大部分延迟是由传输媒介的传播时间导致的，传输媒介也就是长途中继线中的传输设备和传输器件。这个延迟被称为"网络延迟"或"传播延迟"。

　　传输系统的速度是决定是否能感觉到回声的重要因素。这就是在本地PSTN呼叫中通常听不到回声的原因，尽管实际上本地呼叫确实存在由于转换器和其他因素导致的电气回声。

　　在分组网络话音的情况下，还有其他几种重要延迟（除了网络延迟之外）来源，包括：处理延迟（例如分组、压缩/解压等）、交换/路由选择延迟以及缓存延迟。由于存在这些附加的延迟来源，在电路交换网络中可能听不到的回声在等效的分组网络中会引人注意。因此，电路交换网络与分组网络之间的连接需要进行高质量的回声消除。

　　什么是回声消除？

　　回声消除器是一种在来自远端的信号在本地端设备发出回声后检测并消除其回声的装置。

　　在电路交换长途网络中，回声消除器位于与长途网络连接的大城市中心局。这些回声消除器消除由长途网络延迟造成的明显的电气回声。

　　当话音呼叫延迟超过可接受的界限（例如在一个长途呼叫中），电信运营商将在呼叫的两端提供两个回声消除器。每个消除器保护远端，防止其接收到在本地端产生并且通过网络返回的任何回声。

　　回声消除器"指向"回声源（转换器）的方向，并且远离从该回声消除器的工作中受益的一端。

　　回声消除器包含三个主要功能组件：

　　· 自适应滤波器 (AF)

　　· 非线性处理器 (NLP)

　　· 音调检测器

　　自适应滤波器由一个回声估计器和一个减法器构成。回声估计器监视接收路径并动态构建一个针对回声产生线路的数学模型。这个线路模型与接收路径上的话音流进行卷积。这样得到一个回声的估计值，并被输入给减法器。这就从发送路径线路中减去了回声的线性部分。当通过自适应滤波器建立一个线路估计时，回声消除器就"收敛"于回声。

　　图2描述了电路交换网络中一个典型的数字式回声消除器。当来自远端的话音通过其接收路径（从Rin 到 Rout）时，回声消除器监视该话音。它使用这些信息估计回声，并从发送路径（从Sin 到 Sout）中减去这个估计值。

　　回声控制需要具备对回声传播时间（反射持续时间）的判断能力以及处理不同回声长度的能力。尾部的长度主要依赖于回声消除器与回声发生点（称为"回声点"）之间信号传输的端到端延迟，以及回声传播时间。剩余回声是信号通过自适应滤波器后残留的回声。

　　非线性处理器计算剩余回声，除去所有低于某个阈值的信号，并且用听起来如同没有回声的原始背景噪声的仿真背景噪声替代这些信号。

　　回声消除器还包含一个音调检测器，它使得用户设备可以使用特定音调关闭回声消除器。举例来说，在数据和传真传输过程中必须关闭回声消除功能。大家熟悉的在调制解调器开始连接时出现的高音调告诉回声消除器在该通信流中停止工作。

　　回声消除遇到的难题

　　设备必须解决下列难题才能进行稳固的回声消除：避免发散、处理含混话音(double talk)、防止削波以及避免烦人的背景噪声改变。

　　避免发散。发散是自适应滤波器的问题，如果在使用数学算法时没有找到合适的线路模型解决方案，就会出现发散。

　　在特定的线路条件下，某些算法可能发散以至于破坏信号，甚至在线路中添加回声。好的回声消除器能够在几乎所有线路条件下避免发散。

　　处理双方同时说话。典型的通话是双向的。聆听者通过说"是的，我明白了"、"啊，嗯，是吗？"等向说话者表示同意或者不同意。在实际通话中，双方经常会同时说话或者互相插话。这种情形就叫做"含混话音"。

　　处理含混话音使其听起来很自然是一个技术难题。回声消除器必须能够完成下列操作：

　　· 区别含混话音和背景噪声。精确的分辨需要高性能的回声消除。

　　· 选择不更新线路模型以避免发散。这要求使用最后一个线路模型（正好在含混话音开始前一刻）来近似含混话音期间的线路模型。

　　· 在含混话音检测、处理和返回常规处理模式（即没有含混话音）三者之间进行平滑过渡。过渡不平滑将导致话音断断续续。

　　防止削波。在一次电话通话过程中，如果话音的某部分被错误地抹掉（通常是单词的第一个或最后一个音节），则发生了削波。削波是由于非线性处理器(NLP)不精确导致的。具体地说，是由于NLP没有在正确的时间起始和停止。通常，NLP不能足够快速地响应从本地端进入的话音。它用背景噪声替代一部分话音，因而导致通话难以理解。当NLP用剩余回声扰乱一个句子末尾的话音电平衰减时，也会产生相同的结果。

　　避免烦人的背景噪声改变。必须适当处理背景噪声，才能使电话通话听起来自然。这意味着回声消除器必须精确地工作并且迅速反应，以便构造出能准确匹配正在执行回声消除一端环境的背景噪声。当一个人在说话时，他听到的是NLP生成的仿真背景噪声。当他停止说话而另一个人说话时，则他听到的是话音中"真实的"背景噪声。二者之间的任何差别都会分散通话者的注意力。

　　Octasic的高级回声处理器

　　Octasic OCT6100系列回声消除器协处理器解决了上述所有技术难题。具体来说，该协处理器采用了一种独特的确定性算法，该算法能以可靠和确定的方式提供极佳的质量。

　　另一方面，当前市场上的大多数回声消除器采用同一个算法（使用时间超过了25年）。该算法是递归的，它将前一次计算的线路模型和当前信号输入到一个连续更新的线路模型中。在这个方法中，估计器在每次迭代中使用输入信号的互相关系来更新其线路模型。该过程是借助可变增益完成的，用新信号的互相关系替代旧线路模型的一部分。如果增益选择错误，则回声估计器/减法器可能无法消除所有回声或者更糟--它可能在线路中加入烦人的声音。在极端情况下，该算法还可能发散，严重破坏回声消除器的功能并使得通话无法进行。

　　Octasic的OCT6100系列由于具有实现方法上的优势（例如廉价的存储器和更强大的处理能力），采用了一种基于"最小二乘"(LS)算法的专利方法。最小二乘算法不选择增益，它对所有给定输入信号集只使用一个解决方案，该解决方案将回声能量减为最小。这个算法能确保更快速、更准确的收敛，因此成就了更稳固的回声消除，包括改进的含混话音处理和背景噪声处理。

　　
摘自《电子设计技术》

上一篇：新一代的网络安全协议—IPv6

下一篇：实现理想的3G基础传输网