Подавление и подавление эха - Echo suppression and cancellation

Подавление эха и подавление эха - это методы, используемые в телефонии для улучшения качества голоса, предотвращая создание эха или удаляя его после того, как он уже присутствует. Помимо улучшения субъективного качества звука, подавление эха увеличивает пропускную способность, достигаемую за счет подавления тишины , предотвращая распространение эха по телекоммуникационной сети . Подавители эха были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций.

Методы подавления и подавления эха обычно называются подавлением акустического эха ( AES ) и подавлением акустического эха ( AEC ), реже - подавлением линейного эха ( LEC ). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки от громкоговорителя, отражаемые и записываемые микрофоном, которые могут существенно меняться со временем) и линейное эхо ( электрические импульсы, вызванные, например, связью между передающим и принимающим проводами, рассогласованием импеданса, электрическими отражениями и т. д., которые варьируются намного меньше, чем акустическое эхо). Однако на практике для обработки всех типов эха используются одни и те же методы, поэтому акустический компенсатор эха может подавлять линейное эхо, а также акустическое эхо. В частности, AEC обычно используется для обозначения эхоподавителей в целом, независимо от того, предназначены ли они для акустического эха, линейного эха или того и другого.

Хотя эхоподавители и эхоподавители имеют схожие цели - не дать говорящему человеку услышать эхо собственного голоса, - методы, которые они используют, различны:

  • Подавители эха работают, обнаруживая речевой сигнал, идущий в одном направлении по цепи, а затем заглушают или ослабляют сигнал в другом направлении. Обычно подавитель эха на дальнем конце цепи делает это приглушение, когда обнаруживает голос, исходящий от ближнего конца цепи. Это приглушение не позволяет говорящему слышать собственный голос, возвращающийся с дальнего конца.
  • Подавление эха включает в себя сначала распознавание первоначально переданного сигнала, который повторно появляется с некоторой задержкой в ​​переданном или принятом сигнале. Как только эхо распознано, его можно удалить, вычтя его из переданного или принятого сигнала. Этот метод обычно реализуется в цифровом виде с использованием процессора цифровых сигналов или программного обеспечения, хотя он также может быть реализован в аналоговых схемах.

Стандарты ITU G.168 и P.340 описывают требования и тесты для компенсаторов эха в цифровых приложениях и приложениях PSTN , соответственно.

История

В телефонии эхо - это отраженная копия голоса, услышанная через некоторое время. Если задержка довольно значительная (более нескольких сотен миллисекунд), это считается раздражающим. Если задержка очень мала (10 миллисекунд или меньше), это явление называется самопрослушиванием . Если задержка немного больше, около 50 миллисекунд, люди не смогут услышать эхо как отдельный звук, а вместо этого услышат эффект хоруса .

На заре телекоммуникаций подавление эха использовалось, чтобы уменьшить нежелательный характер эха для пользователей. Один человек говорит, а другой слушает, и они говорят взад и вперед. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу двигаться вперед. В обратном канале он устанавливает ослабление, чтобы заблокировать или подавить любой сигнал, исходя из предположения, что сигнал является эхом. Хотя подавитель эффективно справляется с эхом, этот подход приводит к ряду проблем, которые могут расстраивать обе стороны вызова.

  • Двусторонний разговор : в разговоре вполне нормально, когда обе стороны говорят одновременно, по крайней мере, кратко. Поскольку каждый подавитель эха затем будет обнаруживать энергию голоса, исходящую от дальнего конца цепи, эффект обычно заключается в том, что потери вносятся сразу в обоих направлениях, эффективно блокируя обе стороны. Чтобы предотвратить это, подавители эха могут быть настроены на обнаружение голосовой активности из динамика на ближнем конце и невозможность внесения потерь (или внесения меньших потерь), когда говорят как динамик на ближнем, так и на дальнем конце. Это, конечно, временно устраняет основной эффект наличия подавителя эха.
  • Отсечение: поскольку подавитель эха попеременно вставляет и удаляет потери, часто возникает небольшая задержка, когда новый говорящий начинает говорить, что приводит к отсечению первого слога из речи этого говорящего.
  • Мертвая установка: если абонент на дальнем конце вызова находится в шумной среде, динамик на ближнем конце будет слышать этот фоновый шум, пока говорящий на дальнем конце говорит, но подавитель эха подавит этот фоновый шум, когда ближайший динамик будет слышать этот фоновый шум. -конечный динамик начинает говорить. Внезапное отсутствие фонового шума создает у ближнего пользователя впечатление, что линия оборвалась.

В ответ на это Bell Labs разработала теорию эхоподавителя в начале 1960-х, что привело к созданию лабораторных эхоподавителей в конце 1960-х и коммерческих эхоподавителей в 1980-х. Компенсатор эха работает, генерируя оценку эха из сигнала говорящего и вычитая эту оценку из обратного пути. Этот метод требует адаптивного фильтра для генерации сигнала, достаточно точного для эффективного подавления эхо-сигнала, при этом эхо-сигнал может отличаться от исходного из-за различных видов ухудшения на этом пути. С момента изобретения AT&T Bell Labs алгоритмы эхоподавления были улучшены и отточены. Как и все процессы подавления эха, эти первые алгоритмы были разработаны, чтобы предвидеть сигнал, который неизбежно снова войдет в тракт передачи, и нейтрализовать его.

Быстрый прогресс в цифровой обработке сигналов позволил уменьшить размеры эхоподавителей и сделать их более экономичными. В 1990-х годах эхоподавители были впервые реализованы в голосовых коммутаторахDMS-250 компании Northern Telecom ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхоподавители можно было надежно включать и выключать для каждого вызова, устраняя необходимость в отдельных группах соединительных линий для голосовых вызовов и вызовов данных. Сегодняшняя телефонная технология часто использует эхоподавители в небольших или портативных устройствах связи через программный голосовой движок , который обеспечивает подавление либо акустического эха, либо остаточного эха, создаваемого системой шлюза ТфОП на дальнем конце; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.

Операция

Адаптивный эхоподавитель для телефонной сети. Функция H , гибридного преобразователя , заключается в маршрутизации входящей речи с дальнего конца x k на местный телефон и маршрутизации речи с телефона на дальний конец. Однако гибрид никогда не бывает идеальным, поэтому его выходной сигнал d k содержит как желаемую речь с местного телефона, так и отфильтрованную речь с дальнего конца. Компенсатор эха - это адаптивный фильтр f k , который пытается минимизировать сигнал ошибки ε k путем фильтрации входящей речи на дальнем конце в реплику y k речи на дальнем конце, которая просачивается через гибрид. После завершения адаптации сигнал ошибки состоит в основном из речи с местного телефона.

Процесс эхоподавления работает следующим образом:

  1. В систему доставляется сигнал с дальнего конца.
  2. Воспроизводится сигнал на дальнем конце.
  3. Сигнал на дальнем конце фильтруется и задерживается, чтобы напоминать сигнал на ближнем конце.
  4. Отфильтрованный сигнал на дальнем конце вычитается из сигнала на ближнем конце.
  5. Результирующий сигнал представляет звуки, присутствующие в комнате, за исключением любого прямого или реверберированного звука.

Основная задача для компенсатора эха - определить характер фильтрации, которая будет применяться к сигналу на дальнем конце, чтобы он напоминал результирующий сигнал на ближнем конце. Фильтр - это, по сути, модель динамика, микрофона и акустических характеристик комнаты. Эхоподавители должны быть адаптивными, поскольку характеристики динамика и микрофона на ближнем конце, как правило, заранее неизвестны. Акустические характеристики комнаты ближнего конца также обычно не известны заранее и могут измениться (например, если микрофон перемещается относительно динамика, или если люди ходят по комнате, вызывая изменения в акустических отражениях). Используя сигнал на дальнем конце в качестве стимула, современные системы используют адаптивный фильтр и могут сходиться от подавления без подавления до подавления 55 дБ примерно за 200 мс.

До недавнего времени эхоподавление применялось только к полосе пропускания голоса телефонных цепей. PSTN называет частоты передачи от 300 Гц до 3 кГц, диапазон, необходимый для разборчивости речи человека. Видеоконференцсвязь - это одна из областей, в которой используется звук с полной полосой пропускания. В этом случае для эхоподавления используются специализированные продукты.

Поскольку подавление эха имеет известные ограничения, в идеальной ситуации будет использоваться только подавление эха. Однако этого недостаточно для многих приложений, особенно для программных телефонов в сетях с большой задержкой и низкой пропускной способностью. Здесь эхоподавление и подавление могут работать вместе для достижения приемлемой производительности.

Количественная оценка эха

Эхо измеряется как эхо-возвратные потери (ERL). Это соотношение, выраженное вдецибелах, между оригиналом и его эхом. Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательный означает, что эхо сильнее, чем исходный сигнал, который, если его не отметить, вызоветзвуковую обратную связь.

Эффективность компенсатора эха измеряется в увеличении потерь на отражение эха (ERLE), которое представляет собой величину дополнительных потерь сигнала, применяемых компенсатором эха. Большинство эхоподавителей могут применять ERLE от 18 до 35 дБ.

Полная потеря сигнала эха (ACOM) является суммой ERL и ERLE.

Текущее использование

Источники эха встречаются в повседневной среде, например:

  • Автомобильные телефонные системы громкой связи
  • Стандартный телефон или мобильный телефон в режиме громкой связи
  • Выделенные автономные спикерфоны
  • Установлены системы конференц-зала с потолочными колонками и микрофонами на столе.
  • Физическая связь, при которой колебания динамика передаются микрофону через корпус трубки.

В некоторых из этих случаев звук из динамика попадает в микрофон почти без изменений. Трудности с подавлением эха связаны с изменением исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение разных частот с разной силой.

Внедрение AEC требует инженерных знаний и быстрого процессора, обычно в виде процессора цифровых сигналов (DSP). Эта стоимость обработки может быть очень высокой, однако многие встроенные системы имеют полнофункциональную AEC.

Интеллектуальные динамики и интерактивные системы голосового ответа , которые принимают речь для ввода, используют AEC во время воспроизведения речевых подсказок, чтобы система распознавания речи не могла ошибочно распознать отраженные подсказки и другой вывод.

Модемы

Стандартные телефонные линии используют одну и ту же пару проводов для отправки и приема звука, что приводит к тому, что небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, разговаривающих по телефону, поскольку дает говорящему сигнал о том, что их голос проходит через систему. Однако этот отраженный сигнал вызывает проблемы для модема, который не может отличить сигнал от удаленного модема от эха собственного сигнала.

По этой причине более ранние модемы коммутируемого доступа разделяли частоты сигналов, так что устройства на обоих концах использовали разные тона, позволяя каждому игнорировать любые сигналы в частотном диапазоне, который он использовал для передачи. Однако это уменьшило доступную для обеих сторон полосу пропускания.

Эхоподавление смягчило эту проблему. В течение периода установления вызова и согласования оба модема отправляют серию уникальных тональных сигналов, а затем ожидают их возвращения через телефонную систему. Они измеряют общее время задержки, а затем настраивают линию задержки на тот же период. Как только соединение установлено, они отправляют свои сигналы в телефонные линии как обычно, но также и в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом от линии задержки, что нейтрализует эхо. Это позволяло обоим модемам использовать весь доступный спектр, удваивая возможную скорость.

Эхоподавление также применяется многими операторами связи к самой линии и может вызывать повреждение данных, а не улучшать сигнал. Некоторые телефонные коммутаторы или преобразователи (например, аналоговые терминальные адаптеры) отключить подавление эха или подавление эха , когда они обнаруживают 2100 или 2225 Гц ответа тона , связанные с такими вызовами, в соответствии с ITU-T рекомендации G.164 или G.165 .

Модемы ISDN и DSL, работающие на частотах выше речевого диапазона по стандартным телефонным проводам с витой парой, также используют автоматическое эхоподавление для одновременной двунаправленной передачи данных. Вычислительная сложность при реализации адаптивного фильтра значительно снижается по сравнению с подавлением речевого эха, поскольку передаваемый сигнал является цифровым битовым потоком. Вместо операции умножения и сложения для каждого крана в фильтре требуется только сложение. ОЗУ таблица поиска на основе схемы подавления эха устраняет даже операция сложения, просто обращаясь к памяти с усеченной передачи битового потока для получения оценки эхо - сигнала. С развитием полупроводниковой технологии подавление эха в настоящее время обычно реализуется с помощью технологий цифрового сигнального процессора (DSP).

Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость в эхоподавлении. На более высоких частотах, выходящих за пределы исходной конструкции телефонных кабелей, наблюдается значительное искажение затухания из-за перемычек и неполного согласования импеданса . Часто возникают глубокие узкие промежутки между частотами, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.

Смотрите также

Рекомендации

Внешние ссылки