Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > XML, XSL > Ищу оптимизатор файлов DOCX (document.xml) |
Автор: tishaishii 29.9.2015, 20:41 | ||||
Файл для примера во вложении. Если откроете файл DOCX, то увидите привычные плэйсхолдеры, куда парсером должны подставляться данные. DOCX - это тот же ZIP-архив, который можно разорхивировать. В word/document.xml находится разметка документа. Конечно, такую разметку сразу парсить нельзя. Вот ищу программу-оптимизатор для DOCX или какие-то идеи. Так как в вариантах вроде:
MS Word явно занимается словоблудием. Этот вариант явно (глазами видно) можно преобразовать в:
И это самый простой вариант. Может быть, кто-то уже занимался этим вопросом? |
Автор: diadiavova 2.10.2015, 20:38 |
Ворд вполне сгодится. Он сохраняет документ в куче разных форматов, например можно сохранить как вебстраницу с фильтром и получится вполне понятный HTML-документ. Можно также открыть документ в оупенофисе и сохранить в XML уже другого формата, он более понятен, да и там можно XML-фильтр написать и преобразовать как надо. Все, конечно, зависит от задачи, но если нужен просто понятный формат, то это вполне подойдет. |