Установка Тессеракта-OCR на CentOS 6
Я пытаюсь установить Tesseract-OCR на моем сервере, однако, когда я устанавливаю все, что я считаю правильным РЕПО. Когда я пытаюсь установить его, пакет не найден
Я попытался добавить rpmforge, но безрезультатно. Любые идеи от кого-то, кто делал раньше или знаком с добавлением и поиском через репозитории?
7 ответов
Я использовал эту инструкцию и работал правильно в Centos
установить Tesseract OCR libs из источников в Centos
-
Leptonica скачать и Teseract источников:
$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz -
настройка, компиляция, установка libs:
$ tar xzvf лептоника-1.69.смола.gz
$ CD с leptonica-1.69
$ ./формировать $ делать $ sudo make install$ tar xzf Тессеракт-ocr-3.02.02.смола.gz $ компакт-диск Тессеракт-3.01 $ ./autogen.sh $ ./формировать $ делать $ установка $ судо команду ldconfig
-
скачать языки (английский) и скопировать в папку tessdata:
$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.анг.смола.gz
$ sudo cp tesseract-ocr/ tessdata /*/usr/local/share / tessdata
и наслаждаться этим ;)
рекомендую попробовать установить из RPM здесь: http://pkgs.org/download/tesseract Существует также несколько зависимостей: libpng-devel, libjpeg-devel, libtiff-devel, zlib и leptonica. Последние 2 также можно найти на сайте RPM
это сработало для меня:
/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch
tesseract не находится в репозитории epel, но в репозитории epel-testing по умолчанию не активируется.
Я написал сценарий bash для установки Tesseract 3.05 на Centos 7. Это извлекает и устанавливает все зависимости, а также устанавливает языковые файлы для английского, хинди, Бенгальского и тайского языков.
код доступен на GitHub
https://github.com/EisenVault/install-tesseract-redhat-centos
надеюсь, что это помогает.
установить Tesseract OCR libs из источников (обновлено по состоянию на 14 июля 2018)
Leptonica скачать и Teseract источников:
$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz
настройка, компиляция, установка Leptonica:
$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install
настройка, компиляция, установка Тессеракт:
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig
Скачать файл:
я загружаю файл на английском языке(англ.traineddata) здесь. Вы можете увидеть полный список языковых файлов здесь и загрузить в соответствии с вашими потребностями. https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302
скачать языки (английский) и скопировать в папку tessdata:
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
теперь ваш Tesseract OCR установлен и готов к использовать! Пример:
$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng
наслаждайтесь!!!
Введите описание изображения здесь
yum install --nogpgcheck Тессеракт
после установки для проверки введите следующую команду: tesseract --version
Я закончил переход на Ubuntu. Tesseract поддерживается красиво и устанавливается без проблем.
apt-get install tesseract-ocr