Интернет магазин китайских планшетных компьютеров



Компьютеры - Voice Activity Detection

01 мая 2011


Оглавление:
1. Voice Activity Detection
2. Недостатки и метод их устранения



VAD, а также Silence Suppression — обнаружение голосовой активности во входном акустическом сигнале для отделения активной речи от фонового шума или тишины. Голос, интерпретированный как шум, может порождать «вырезки» из разговора. Фон, интерпретируемый как голос, приводит к снижению эффективности компрессии.

Преимущества и использование

При оцифровке голоса, фрагменты сигнала, классифицируемые как активная речь, могут в дальнейшем кодироваться и сжиматься любым аудиокодеком при использовании в ПО для различения в кодируемой речи человеческого голоса и фонового шума.

Использование механизма VAD позволяет экономить на передаче данных по каналу связи, так как перерыв в речи не оцифровывается и не кодируется и таким образом «пустые» пакеты с тишиной не передаются по сети. Это очень важно для пакетной передачи, так как кроме самих данных каждый протокол всех уровней модели OSI дописывает свою собственную служебную информацию в каждый пакет с данными. В результате размер пакета значительно вырастает. Таким образом исключение «пустых» пакетов с мелкими шумами - простой способ экономить трафик и, как следствие, увеличить пропускную способность канала. По этой причине механизм VAD довольно часто применяется наряду с различными кодеками эффективного сжатия в IP-телефонии.



Просмотров: 1997


<<< Silent Speech Interfaces
Голосовое управление >>>