Распознавание чисел в изображениях

Я искал ресурсы для распознавания чисел в изображениях в интернете. Я нашел много ссылок, предоставляющих много ресурсов по этой теме. Но, к сожалению, это больше запутывает, чем помогает, я не знаю, с чего начать.

У меня есть изображение с 5 номерами в нем, без помех (без капчи или чего-то подобного). Цифры черные на белом фоне, написаны стандартным шрифтом.

моим первым шагом было разделить числа. Алгоритм I в настоящее время использование довольно просто, он просто проверяет, является ли столбец полностью белым и, следовательно, пробелом. Затем он обрезает каждый символ, так что вокруг него нет белой границы. Это работает довольно хорошо.

но теперь я застрял с фактическим признанием количество. Я не знаю, как лучше угадать правильный. Я не думаю, что прямое сравнение с шрифтом-хорошая идея, потому что, если цифры только немного отличаются, это больше не будет работать.

может кто-нибудь дать мне подсказка о том, как это делается?

Это не имеет значения для вопроса, но я буду реализовывать это на C# или Java. Я нашел несколько библиотек, которые сделают эту работу, но я хотел бы реализовать ее сам, чтобы узнать что-то.

1 ответов


Почему бы не посмотреть на использование движка OCR с открытым исходным кодом, такого как Tesseract?

http://code.google.com/p/tesseract-ocr/

обертка C# для Тессеракта

http://www.pixel-technology.com/freeware/tessnet2/

Java-оболочка для Tesseract

http://sourceforge.net/projects/tessocrinjava/

в то время как вы не можете использовать сторонняя библиотека как реализация его самостоятельно, есть огромный объем работы, которая идет только на интеграцию стороннего инструмента. Имейте в виду также, что то, что может показаться простым (распознавание числа 5 против числа 6), часто очень сложно; мы говорим о тысячах и тысячах строк сложного кода. По крайней мере, посмотрите на исходный код tesseract, и это даст вам хороший повод использовать стороннюю библиотеку.

вот еще один так вопрос, который даст вам некоторые идеи о задействованных алгоритмах hte: https://stackoverflow.com/questions/850717/what-are-some-popular-ocr-algorithms