Преобразование html в doc в java

Я хотел бы преобразовать документ html или xhtml (желательно со стилями) в Microsoft .док и / или .формат docx.

кажется, есть много примеров для этого, но я не нашел полезных примеров для преобразования в форматы документов ms.

может ли кто-нибудь указать мне api или привести пример для этого, пожалуйста

большое спасибо

5 ответов


docx4j 2.8.0 поддерживает преобразование документов и фрагментов XHTML в содержимое docx. Раскрытие информации: я написал часть кода.


еще одним решением было бы использовать jodconverter который кажется базовым преобразованием html в doc... он не претендует делать это хорошо хотя


Я попробовал docjx4j API 2.8.1, и он работает как чудо. Она ConvertinXHTMLinFile и она отлично работает. Если кто хочет код я запостил.

вот ссылка, которая помогла мне : ConvertInXHTMLFile


для работы с документами Microsoft вам, вероятно, придется более глубоко взглянуть на библиотека POI Apache.

тем не менее создание .файлы doc со стилем из (X)HTML требуют некоторых усилий.


Я потратил немного времени на изучение docx4j. Кажется, это хорошие способы создания html-документов из docx, но я ничего не вижу для другого пути.

на данный момент это все еще выглядит как самый простой метод, поскольку он просто работает с объектами jaxb (я думаю).