JAVA OCR API с открытым исходным кодом на eclipse [закрыто]
Я ничего не понимаю в OCR. Мне просто нужно (если это вообще возможно), чтобы получить .jar для импорта в Eclipse, который я могу дать изображение (.формат BMP. ,размолвка. ,jpeg) для ввода, и он выводит мне строку с текстовым содержимым изображения. Это не капчи или почерк, просто простая "фотография" некоторых букв.
решения с открытым исходным кодом приветствуются. Я видел такие проекты, как Tess4j или JavaOCR, но они немного сложны в обработке : (
У кого есть предложение?
Update: я обнаружил, что AspriseOCR очень прост в использовании. Просто импортируйте .Jar в путь сборки и вызова метода. Неплохо! Но... Я не могу использовать его в своих проектах! Знаете ли вы какую-либо библиотеку, такую же простую, как Asprise (мне не нужно ничего компилировать или иметь какой-либо тип обучения: просто импортируйте, и все!!)
2 ответов
насколько я знаю, нет собственных SDK с открытым исходным кодом Java OCR. Есть API-интерфейсы Java которых обернуть вызовы на собственные интерфейсы, например, для одной из самых популярных открытым исходным кодом распознавания двигателей - Тессеракт (http://groups.google.com/group/tesseract-ocr/) - есть некоторые Java-фантики, как tesjeract (http://code.google.com/p/tesjeract/) или Tess4J (http://tess4j.sf.net/). Это может сработать для вас, но это довольно сложно в настройке и требует разработка изображений-предварительная обработка и обучение шрифтам на вашей стороне.
еще одним решением может стать облачный сервис. Для подключения к интернету требуется приложение конечного пользователя, но оно не зависит от выбора языка программирования и ограничений ресурсов. Взгляните на http://ocrsdk.com, это облачный OCR SDK, который позволяет загружать изображение через веб-API и возвращает вам данные OCRed. Этот веб-API на основе OCR SDK не является бесплатным, что может быть не подходит для вас, но я все еще рекомендую вам попробовать его (у него есть бесплатная пробная версия), поскольку его цена действительно доступна по сравнению с корпоративными решениями, в то время как она обеспечивает точность OCR на уровне предприятия, что намного лучше, чем с открытым исходным кодом. Вы также можете найти полезным это Java codesample в github. Disclamer: я работаю @ ABBYY.