Интернет магазин китайских планшетных компьютеров



Компьютеры - Синонимайзер - Проблема создания качественного синонимайзера

22 января 2011


Оглавление:
1. Синонимайзер
2. Проблема создания качественного синонимайзера



На сегодняшний день не было разработано ни одного синонимайзера, обрабатывающего русскоязычный текст так же хорошо, как и человек. Главные проблемы в создании качественного синонимайзера связаны со следующим:

  • подбор синонимов должен зависеть от контекста фразы;
  • русский язык не ставит жестких рамок касательно последовательности слов в предложении, что затрудняет синтаксический анализ;
  • чтобы синонимизированный текст читался легко, при работе синонимайзера должен учитываться закон Зипфа.

Дополнительная обработка

Статьи, полученные путем генерирования при помощи синонимайзера требуют обязательной дальнейшей обработки программами для пакетного сравнения текстов. В процессе обработки полученные тексты сравниваются между собой, после чего отбираются наиболее уникальные варианты. Материалы с малой долей уникальности не пригодны для дальнейшего использования.



Просмотров: 5095


<<< Системы управления библиографической информацией