Преобразование документа Word в XSL-FO

Я использую Microsoft Word 2007. Я хотел бы преобразовать документ Word в XSL-FO. В сети есть некоторые подсказки, но только для RenderX. Есть ли такой инструмент для Apache FOP?

5 ответов


RenderX есть набор бесплатных таблицы стилей XSLT для преобразования документов Microsoft WordprocessingML в XSL FO (XSLFO)

эти общедоступные таблицы стилей можно использовать для преобразования документов Microsoft WordprocessingML в XSL FO (XSLFO)

вам не нужно использовать сгенерированный XSL-FO с RenderX. Вы можете запустить их для получения вывода XSL-FO и рендеринга в любом движке XSL-FO (включая Apache ХЛЫЩ.)

Antennahouse также Таблица Стилей WordMLToFO, но это не бесплатно ($200)


docx4j использует FOP для создания PDF-файлов из docx.

XSLT находится в здесь, но вы можете предпочесть начать с это веб-приложение, которое может испускать XSLFO из загруженного docx.

Он использует функции расширения для выполнения тяжелой жизни, поэтому он действительно работает только как часть docx4j, но это легко доступно и лицензировано ASLv2.

да, RenderX их http://www.renderx.com/tools/word2fo.html но лицензия ограничительный, а версия 20070227 направлена на Word 2003 WordML (может быть, есть более новый? его давно не смотрел)


Word может сделать это самостоятельно. Вот инструкции Microsoft: http://msdn.microsoft.com/en-us/library/office/aa537167%28v=office.11%29.aspx#officewordwordmltoxsl-fo_creatinganxslfodocumentfromword

вот ссылка для загрузки необходимого XSL-Word2FO.элемент xsl: http://www.microsoft.com/en-us/download/details.aspx?id=16876


Если вы хотите поддержку DOCX (Word 2007), вы должны распаковать файл и объединить отдельные ресурсы, чтобы использовать таблицы стилей. И это половина проблемы, потому что в последний раз, когда я проверял, были серьезные ограничения в таблицах стилей, такие как обработка стилей/тем, продолжение разделов и так далее. Если вы можете себе это позволить, реклама DOCX в PDF engine может быть то, что вам нужно. Важно помнить, что прохождение через XSL-FO действительно невозможно поскольку XSL-FO не поддерживает вкладки, плотную обертку текста вокруг изображений или других функций Word.


Я создал некоторое время назад инструмент отчетности, который изменяет RenderX XSLT, который первоначально преобразует wordML 2003 в XSLFO, чтобы сделать wordML 2003 - > XSLT, который позже объединяется с XML-данными для создания xslfo с шаблоном + данными. Необходимо создать шаблон в word, затем импортировать сгенерированный XSLT в веб-приложение и запустить запрос, который генерирует XML и объединяет его с предоставленным шаблон.

https://github.com/juanmf/neatReports

документация

https://github.com/juanmf/neatReports/blob/master/doc/HowToReport.pdf