Tesseract: как запустить tesseract с несколькими языками один раз

Я должен проанализировать изображение, которое содержит как английские, так и японские тексты. Когда я запускаю tesseract по умолчанию (eng), некоторые японские символы теряются. В противном случае, если я запускаю tesseract с японским (-l jpn), некоторые английские символы теряются (e.p. Email). Как я могу запустить один процесс, который распознает как английские, так и японские символы. Спасибо.

1 ответов


поскольку tesseract 3.02 можно указать несколько языков для параметра-l.

- l lang язык для использования. Если значение none не указано, предполагается английский язык. Можно указать несколько языков, разделенных символами "плюс". Tesseract использует 3-символьные коды языка ISO 639-2.

пример:

tesseract myscan.png out -l deu+eng