Преобразование файлов CHM в CSV или SQL [закрыто]

Я ищу, чтобы создать приложение Facebook, и данные, которые я хочу использовать, недоступны, кроме как в формате CHM.

можно ли конвертировать CHM-файлы в CSV или SQL? У нас есть какие-то инструменты для этого?

Спасибо за помощь как всегда.

2 ответов


кстати, вы должны указать язык (английский, арабский...) в котором вы хотите построить этот набор данных, так как это влияет как на выбор источников книг, так и на утилиты преобразования.

идентификация источников контента данных:
Интересно, что и для всех [интерактивных] онлайн Hadeeth Search инструменты например, на
сборник мусульманских текстов CRCC сайт (оригинал от MSA West, но как-то не доступен/работает на сайте MSA больше), кажется, нет никаких скачать-able версия базы данных!
Есть несколько онлайн-версий самих книг, в частности популярные, которые вы упоминаете, но вам нужно будет проанализировать и проиндексировать их должным образом, чтобы сохранить ссылки и т. д. Кроме того, возвращаясь "назад" к книгам, вы должны были бы рассказать их сами.

что касается преобразования CHM файлы...
Там нет открытого исходного кода или бесплатной программы, о которой я знаю, но shareware ABC Amber CHM converter (c. $25.00), по-видимому, является золотым стандартом для этой цели.
У меня было только мимолетное воздействие этого программного обеспечения пару лет назад, для одноразовой работы преобразования, подобной той, которую вы планируете. Янтарный конвертер "сделал трюк"; к счастью, базовая структура страниц справки выявила большую регулярность, которая позволила относительно прямая табуляция в поля CSV / database.
ABC Amber converter поддерживает многие языки, включая арабский (но я использовал его только для английского языка).


существует известный с открытым исходным кодом * nix lib под названием libchm, на котором основано большинство *Nix CHM viewers. Он поставляется с инструментом для распаковки .chm к своему .HTML-оригиналы (из которых вам затем придется конвертировать таблицы html .csv)

Lazarus / Free Pascal также имеет библиотеки, которые даже могут писать, но afaik не готов сделать инструмент "компилятор chm".