Для обеспечения качественной передачи речевых сигналов в IP-телефонии необходима их следующая обработка.
1. Устранение всех нежелательных компонентов из входного аудиосигнала. После оцифровки речи необходимо удалить эхо из динамика в микрофон, комнатное эхо и непрерывный фоновый шум (например, шум от вентиляторов), а также отфильтровать шумы переменного тока на низких частотах звукового спектра.
Рис. 5.5. Схема обеспечения качества IP-телефонии |
Эффективное эхоподавление и уменьшение шумов абсолютно необходимо в любой конфигурации с «открытым микрофоном» и с громкоговорителем на базе персонального компьютера (ПК) для традиционной и IP-телефонии. Эти функции все в большей мере реализуются аудиокомпонентами ПК, так что сама система IP-телефонии может их и не иметь. Шлюзам IP-телефонии требуется выполнять меньший объем предварительной обработки, нежели конечным решениям, потому что УАТС и телефонная сеть обеспечивают фильтрацию и уменьшение шумов.
2. Подавление пауз в речи; распознавание остаточного фонового шума (внешних шумов) и кодирование для восстановление на дальнем конце; то же самое для опознаваемых сигналов. Паузы лучше всего полностью подавлять на ближнем конце. Для сохранения окружающих звуков необходимо смоделировать фоновые шумы, чтобы система на дальнем конце могла восстановить их для слушателя. Сигналы многочастотного набора номера DTMF и другие сигналы можно заменить на короткие коды для восстановления на дальнем конце (или для непосредственной обработки). Возможные проблемы: из-за того, что функция подавления пауз активизируется, когда громкость речи становится ниже определенного порога, некоторые системы обрезают начала и концы слов (в периоды нарастания и снижения энергии речи).
3. Сжатие голосовых данных. Сжать оцифрованный голос можно разными способами. В идеале решения, используемые для IP-телефонии, должны быть достаточно быстрыми для выполнения на недорогих цифровых сигнальных процессорах DSP, сохранять качество речи и давать на выходе небольшие массивы данных.