Как преобразовать HTML файл в слово?
У меня есть требование, когда мне нужно сохранять документы HTML в памяти в виде файлов Word.DOC.
Может ли кто-нибудь дать мне некоторые ссылки как на закрытые, так и на библиотеки с открытым исходным кодом, которые я могу использовать для этого?
Кроме того, я должен отредактировать этот вопрос, чтобы добавить язык, который я использую, чтобы сузить выбор.
Спасибо!
Ответы
Ответ 1
Попробуйте использовать pandoc
pandoc -f html -t docx -o output.docx input.html
Если формат ввода или вывода не указан явно, pandoc попытается угадать его из расширений входных и выходных имен файлов.
- руководство pandoc
Таким образом, вы даже можете использовать
pandoc -o output.docx input.html
Ответ 2
как раз мимо этого на голове вашей php-страницы. прежде чем любой код на этом должен быть верхним кодом.
<?php
header("Content-Type: application/vnd.ms-word");
header("Expires: 0");
header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
header("content-disposition: attachment;filename=Hawala.doc");
?>
это преобразует все html в MSWORD, теперь вы можете настроить его в соответствии с требованиями вашего клиента.
Ответ 3
Хорошим вариантом является использование API, такого как Docverter. Docverter позволит вам конвертировать HTML в PDF или DOCX с помощью API.
Ответ 4
При этом мне было проще:
- Посетите страницу в веб-браузере
- Сохраните страницу с помощью веб-браузера с расширением .htm(и, возможно, папкой с файлами поддержки).
- Запустите Word и откройте сохраненный htmfile (Word откроет его правильно)
- Внесите необходимые изменения.
- Выберите "Сохранить как", а затем выберите расширение, которое вы хотели бы использовать doc, docx и т.д.
Ответ 5
Другие альтернативы просто переименования файла в .doc.....
http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word(office.11).aspx
Вот хорошее место для начала. Вы также можете попробовать использовать этот Office Open XML.
http://www.ecma-international.org/publications/standards/Ecma-376.htm