Интернет магазин китайских планшетных компьютеров |
|
Компьютеры - Контент-фильтр - Принцип работы22 января 2011Оглавление: 1. Контент-фильтр 2. Принцип работы 3. Критика Часто фильтрация проходит на уровне запросов по протоколу HTTP. Для этого URL запрошенного сайта сверяется с чёрным списком с помощью регулярных выражений. Такие списки необходимо регулярно обновлять, защита с их помощью считается малоэффективной. Более продвинутыми являются методы распознавания образов и обработки естественного языка. Для классификации сайтов по разным признакам текст запрашиваемой страницы анализируется на количество разных ключевых слов. Эти и другие свойства текста используются для вычисления вероятности попадания в опасную категорию. Если эта вероятность превышает заданный уровень, доступ к странице блокируется. Самые простые программы позволяют ввести слова, поиск которых будет вести система вручную. Самые сложные устройства уже имеют большой словарь и предполагают уже готовую базу ссылок, которые уже классифицированы. Как правило, к сложным устройствам производители обеспечивают периодическое обновление базы ссылок. Те веб-сайты, которые не были распознаны автоматически, просматривает человек и присваивает категорию сайта вручную. Очевидное требование к программам ограничения доступа быстродействие классификации. Просмотров: 2605
|