Проблема шрифта на машине Ubuntu при разборе PDF-файла

У меня есть приложение на моем Ubuntu 14.04.х машина. Это приложение выполняет интеллектуальный анализ текста в PDF-файлах. Я подозреваю,что он использует Apache Tika и т. д...

проблема в том, что во время процесса чтения я получаю следующее предупреждение:

2015-09-10 14:15:35 [WARN] FontManager Font not found: CourierNewPSMT
2015-09-10 14:15:36 [WARN] FontManager Font not found: CourierNewPSMT
2015-09-10 14:19:33 [WARN] FontManager Font not found: Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
......

Как я могу получить эти шрифты на моей машине? Или это какой-то Java lib, который мне не хватает для шрифтов?

1 ответов


Я бы сделал трехэтапный подход, чтобы исправить эту проблему.

  1. Проанализируйте, какие файлы ищутся и не найдены с помощью strace
  2. используйте apt-file для поиска пакета, предоставляющего эти файлы
  3. установить недостающий пакет

1.) Установите strace, если он еще не установлен sudo apt-get install strace

проверьте, какие файлы используются вашим приложением:

$> strace <your app> 2>&1 | grep open

вы можете дополнительно фильтровать это для ENOENT ошибки:

$> strace <your app> 2>&1 | grep open | grep ENOENT

теперь вы должны знать, какие файлы отсутствуют.

2.) Проверьте, какой пакет предоставляет этот файл. (dpkg-S работает только для уже установленных пакетов)

su
apt-get install apt-file
apt-file update
apt-file search <filename>

3.) установить этот пакет с помощью apt-get install <package>

у меня нет Ubuntu здесь, но шрифты MS обычно доступны в пакете под названием "mscorefont" или аналогичном.