Интернет магазин китайских планшетных компьютеров |
|
Компьютеры - Silent Speech Interfaces11 мая 2011Silent Speech Interfaces системы обработки речи, базирующиеся на получении и обработке речевых сигналов на ранней стадии артикулирования. В прошлом десятилетии работа автоматических систем обработки речи, в том числе распознавание речи, текста, перевода и синтеза речи значительно улучшилась. Это привело к использованию речи и речевых технологий в широком спектре услуг, таких как информационно-поисковые системы, call-центры, голосовое управление мобильными телефонами и автомобильными навигационными системами, транскрайберы и персональные переводчики, а также к применению речевых технологий в области безопасности. Тем не менее речевые интерфейсы, базирующиеся на традиционных акустических речевых сигналах, все еще имеют ряд существенных ограничений. Во-первых, акустические сигналы, передаваемые через воздух, подвержены искажениям из-за шумов. Надежных систем обработки речи, которые бы безукоризненно функционировали в переполненных ресторанах, аэропортах и других общественных местах, несмотря на титанические усилия, по-прежнему не видно. Во-вторых, традиционные речевые интерфейсы требуют чётко и внятно произносимой речи, что имеет два основных недостатка: в общественном месте она ставит под угрозу конфиденциальность сообщения и, второе, беспокоит окружающих. Услуги, которые требуют доступа, поиска и передачи частной или конфиденциальной информации, такой, как PIN-коды, пароли особенно уязвимы. Недавно для решения этой проблемы были предложены Интерфейсы Безмолвного Доступа, которые позволяют пользователям совершать коммуникацию, говоря «безмолвно», то есть без произнесения каких-либо звуков. Это осуществляется путем получения речевых сигналов на ранних этапах человеческой артикуляции, а именно до того, как речь появится в воздухе; после этого артикуляционные сигналы передаются системе для дальнейшей обработки и интерпретации. В связи с этим новым подходом Интерфейсы Безмолвного Доступа обладают потенциалом для преодоления основных недостатков сегодняшних традиционных речевых интерфейсов, таких как, а) ограничение надежности распознавания речевого сигнала при наличии фонового шума, б) отсутствие надежности при передаче частной и конфиденциальной информации и в) беспокойство окружающих. Кроме того, SSI могли бы стать альтернативой для людей с недостатками речи, такими, как, например, ларингэктомия, а также для пожилых или ослабленных людей, которые не могут говорить достаточно громко, четко и разборчиво. Интерфейсы Безмолвного Доступа имеют очень недавнюю историю. Chan и др. доказали, что миоэлектрический сигнал от артикуляционных лицевых мышц содержит достаточно информации, чтобы точно различать небольшой набор слов. Эти слова распознаются, даже когда их произносят негромко, то есть при отсутствии звукового сигнала. Последние работы свидетельствуют о том, что распознавание фонемных единиц на основе электромиографических единиц открывают путь для распознавания обширных словарных баз. Также совсем недавно появились исследования, позволяющие с помощью ультразвуковых и оптических изображений разработать Интерфейс Безмолвного Доступа, основанный на движениях языка и губ. Системы SSI, позволяющие преобразовывать «бурчание» в речевой сигнал, преимущественно разрабатываются в Японии. В Соединенных Штатах DARPA финансирует исследования активности голосовой щели для использования датчиков в шумных условиях.
Просмотров: 1940
|