Преобразование TIFF в ТЕКСТ или индексирование файлов TIFF на основе текстового содержимого

У меня есть пара тысяч файлов Tiff, каждый из которых представляет собой многостраничный текстовый документ. Я хотел бы иметь возможность искать содержимое этих файлов и упорядочивать/индексировать их на основе определенной информации, такой как имя, город, округ, штат, улица, почтовый индекс и т.д. Цель состоит в том, чтобы найти соответствующие файлы на основе поисковых запросов. Например, если бы я искал "Дойл, Боб" И "Округ Ориндж", все файлы, содержащие эти термины, были бы извлечены. У меня есть компьютеры с Windows и linux доступно, но оно не обязательно должно быть кроссплатформенным.

Что вы предлагаете?