Интернет магазин китайских планшетных компьютеров



Компьютеры - OCRopus

25 апреля 2011


Оглавление:
1. OCRopus
2. История развития




OCR-система на базе не так давно открытого распознающего ядра — tesseract Программный пакет для распознавания текста, развивающийся по принципам Open Source и распространяющееся под Apache License 2.0. По задумке разработчиков, с помощью OCRopus станет возможным определять текстовое содержимое на цифровых изображениях и переводить его в обычный текстовый формат для дальнейшего редактирования. Помимо печатного текста, программа сможет распознавать и рукописные материалы. По состоянию на альфа-релиз, OCRopus использует язык моделирования код из другого проекта поддерживаемого Google OpenFST. OCRopus в настоящее время доступна только для Linux, но существуют сборки и для Debian GNU/Hurd и Debian GNU/kFreeBSD.

Использование

В настоящее время OCRopus использует только интерфейс командной строки, принимая указания на входные изображения с текстом, и выводя данные в формате hOCR. Если необходим более точный контроль, можно указать в командной строке команды для выполнения конкретных операций.



Просмотров: 1623


<<< OCFS
Openbox >>>