Распознавание рукописного текста php

Я думаю о создании определенной веб-системы. Он включает в себя много разных (случайных) людей, загружающих отсканированные документы того, что они написали.

есть ли способ преобразования этих рукописных текстов в машинный текст с открытым исходным кодом PHP?

Я нашел это вопрос но хотел бы знать, способен ли он распознавать много случайных и разных людей?

есть ли у кого-нибудь опыт работы в этой области?

3 ответов


см. связанный вопрос на SO: распознавание почерка с помощью простого обучения

распознавание почерка на основе изображений также известно как автономное распознавание почерка.

Если рукописные символы всегда заглавная буква, стиль почтового отделения, он может быть обработан интеллектуальное распознавание символов (ICR), который основан на изображениях.

разница между off-line (на основе изображений) и on-line (real-time) распознавание заключается в том, что последнее требует от вас записывать временную метку (положение и скорость) каждого штриха по мере его записи.

движок распознавания на основе изображений может обрабатывать он-лайн данные путем преобразования временных штрихов в изображение. Напротив, он-лайн механизм распознавания не может обрабатывать входы на основе изображений. Таким образом, он-лайн распознавание технически проще и доступны проекты с открытым исходным кодом.

несколько Статьи Википедии содержат списки поставщиков программного обеспечения OCR / ICR:

пример on-line механизма распознавания рукописного текста (с открытым исходным кодом):


Я сделал ocr из php с помощью tesseract-ocr

http://code.google.com/p/tesseract-ocr/

результаты были не так велики, и я сомневаюсь, что он поддерживает почерк но мне было бы интересно посмотреть, что сделали другие


Это невозможно, так как рукописное письмо слишком сильно отличается от того, что компьютерная программа может найти шаблон для распознавания текста. Вы можете попробовать с OCR, в идеале с библиотекой, которая хорошо взаимодействует с PHP, например, через оболочку для стартера. См.Ocrad-GNU OCR.