Tesseract: как запустить tesseract с несколькими языками один раз
Я должен проанализировать изображение, которое содержит как английские, так и японские тексты. Когда я запускаю tesseract по умолчанию (eng), некоторые японские символы теряются. В противном случае, если я запускаю tesseract с японским (-l jpn), некоторые английские символы теряются (e.p. Email). Как я могу запустить один процесс, который распознает как английские, так и японские символы. Спасибо.
1 ответов
поскольку tesseract 3.02 можно указать несколько языков для параметра-l.
- l lang язык для использования. Если значение none не указано, предполагается английский язык. Можно указать несколько языков, разделенных символами "плюс". Tesseract использует 3-символьные коды языка ISO 639-2.
пример:
tesseract myscan.png out -l deu+eng