Установка Тессеракта-OCR на CentOS 6

Я пытаюсь установить Tesseract-OCR на моем сервере, однако, когда я устанавливаю все, что я считаю правильным РЕПО. Когда я пытаюсь установить его, пакет не найден

Я попытался добавить rpmforge, но безрезультатно. Любые идеи от кого-то, кто делал раньше или знаком с добавлением и поиском через репозитории?

7 ответов


Я использовал эту инструкцию и работал правильно в Centos

установить Tesseract OCR libs из источников в Centos

  1. Leptonica скачать и Teseract источников:

    $ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
    $ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

  2. настройка, компиляция, установка libs:

    $ tar xzvf лептоника-1.69.смола.gz
    $ CD с leptonica-1.69
    $ ./формировать $ делать $ sudo make install

    $ tar xzf Тессеракт-ocr-3.02.02.смола.gz $ компакт-диск Тессеракт-3.01 $ ./autogen.sh $ ./формировать $ делать $ установка $ судо команду ldconfig

  3. скачать языки (английский) и скопировать в папку tessdata:

    $ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
    $ tar xzf tesseract-ocr-3.02.анг.смола.gz
    $ sudo cp tesseract-ocr/ tessdata /*/usr/local/share / tessdata

и наслаждаться этим ;)


рекомендую попробовать установить из RPM здесь: http://pkgs.org/download/tesseract Существует также несколько зависимостей: libpng-devel, libjpeg-devel, libtiff-devel, zlib и leptonica. Последние 2 также можно найти на сайте RPM


это сработало для меня:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

tesseract не находится в репозитории epel, но в репозитории epel-testing по умолчанию не активируется.


Я написал сценарий bash для установки Tesseract 3.05 на Centos 7. Это извлекает и устанавливает все зависимости, а также устанавливает языковые файлы для английского, хинди, Бенгальского и тайского языков.

код доступен на GitHub

https://github.com/EisenVault/install-tesseract-redhat-centos

надеюсь, что это помогает.


установить Tesseract OCR libs из источников (обновлено по состоянию на 14 июля 2018)

Leptonica скачать и Teseract источников:

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

настройка, компиляция, установка Leptonica:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install

настройка, компиляция, установка Тессеракт:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig

Скачать файл:

я загружаю файл на английском языке(англ.traineddata) здесь. Вы можете увидеть полный список языковых файлов здесь и загрузить в соответствии с вашими потребностями. https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302

скачать языки (английский) и скопировать в папку tessdata:

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

теперь ваш Tesseract OCR установлен и готов к использовать! Пример:

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

наслаждайтесь!!!


Введите описание изображения здесь

yum install --nogpgcheck Тессеракт

после установки для проверки введите следующую команду: tesseract --version


Я закончил переход на Ubuntu. Tesseract поддерживается красиво и устанавливается без проблем.

apt-get install tesseract-ocr