Интернет магазин китайских планшетных компьютеров



Компьютеры - Контент-фильтр - Принцип работы

22 января 2011


Оглавление:
1. Контент-фильтр
2. Принцип работы
3. Критика



Часто фильтрация проходит на уровне запросов по протоколу HTTP. Для этого URL запрошенного сайта сверяется с чёрным списком с помощью регулярных выражений. Такие списки необходимо регулярно обновлять, защита с их помощью считается малоэффективной. Более продвинутыми являются методы распознавания образов и обработки естественного языка. Для классификации сайтов по разным признакам текст запрашиваемой страницы анализируется на количество разных ключевых слов. Эти и другие свойства текста используются для вычисления вероятности попадания в опасную категорию. Если эта вероятность превышает заданный уровень, доступ к странице блокируется.

Самые простые программы позволяют ввести слова, поиск которых будет вести система вручную. Самые сложные устройства уже имеют большой словарь и предполагают уже готовую базу ссылок, которые уже классифицированы. Как правило, к сложным устройствам производители обеспечивают периодическое обновление базы ссылок. Те веб-сайты, которые не были распознаны автоматически, просматривает человек и присваивает категорию сайта вручную.

Очевидное требование к программам ограничения доступа — быстродействие классификации.



Просмотров: 2605


<<< Война браузеров