Преобразование html в doc в java
Я хотел бы преобразовать документ html или xhtml (желательно со стилями) в Microsoft .док и / или .формат docx.
кажется, есть много примеров для этого, но я не нашел полезных примеров для преобразования в форматы документов ms.
может ли кто-нибудь указать мне api или привести пример для этого, пожалуйста
большое спасибо
5 ответов
docx4j 2.8.0 поддерживает преобразование документов и фрагментов XHTML в содержимое docx. Раскрытие информации: я написал часть кода.
еще одним решением было бы использовать jodconverter который кажется базовым преобразованием html в doc... он не претендует делать это хорошо хотя
Я попробовал docjx4j API 2.8.1, и он работает как чудо. Она ConvertinXHTMLinFile и она отлично работает. Если кто хочет код я запостил.
вот ссылка, которая помогла мне : ConvertInXHTMLFile
для работы с документами Microsoft вам, вероятно, придется более глубоко взглянуть на библиотека POI Apache.
тем не менее создание .файлы doc со стилем из (X)HTML требуют некоторых усилий.
Я потратил немного времени на изучение docx4j. Кажется, это хорошие способы создания html-документов из docx, но я ничего не вижу для другого пути.
на данный момент это все еще выглядит как самый простой метод, поскольку он просто работает с объектами jaxb (я думаю).