Загрузить веб-страницу и зависимости, включая css-изображения
Часто мне нужно загрузить веб-страницу, а затем отредактировать ее в автономном режиме.
Я попробовал несколько инструментов, а основной функции, которой они не хватает, является загрузка изображений, на которые ссылаются в файлах CSS.
Есть ли инструмент (для Linux), который будет загружать все, чтобы веб-страница отображалась в том же автономном режиме (исключая AJAX)?
Ответы
Ответ 1
wget --page-requisites http://example.com/your/page.html
Эта опция заставляет Wget загружать все файлы, необходимые для правильного отображения данной html-страницы. Это включает в себя такие вещи, как встроенные изображения, звуки и ссылочные таблицы стилей.
РЕДАКТ: медитер прав: фондовый wget не анализирует и не загружает изображения css. Существует, однако, патч, который добавляет эту функцию: [1, 2]дел >
ОБНОВЛЕНИЕ: патч, упомянутый выше был объединен с wget 1.12, выпущенным 22 сентября 2009 года:
** Added support for CSS. This includes:
- Parsing links from CSS files, and from CSS content found in HTML
style tags and attributes.
- Supporting conversion of links found within CSS content, when
--convert-links is specified.
- Ensuring that CSS files end in the ".css" filename extension,
when --convert-links is specified.
Ответ 2
Это можно сделать через Firefox, см. эту форму
- Щелкните правой кнопкой мыши
- Просмотр информации о странице
- Выберите вкладку мультимедиа
- Выделите все файлы
- Сохранить как
Ссылка - http://www.webdeveloper.com/forum/showthread.php?t=212610
Ответ 3
wget - отличный выбор для вас. Просто для получения дополнительной информации, версия wget на окнах в это время отсутствует официальная версия gnu для версии wget версии 1.12. Текущая версия - 1.11
wget version 1.11 не может загружать изображения/шрифты в css файлы. К счастью, вы можете найти сборку 1.14 с этой страницы. Он исправил эти проблемы.
http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html
Ответ 4
Я столкнулся с той же проблемой на днях, работая с клиентом. Другим инструментом, который работает очень хорошо, является HTTrack. Программное обеспечение доступно в режиме командной строки для обоих окон и Linux. Для Linux они предварительно создали пакеты для большинства наиболее распространенных операционных систем, найденных здесь
В моих целях он работал лучше, чем wget с некоторыми добавленными функциями/переключателями, которые фиксируют ссылки внутри html файла.
Ответ 5
Текущая версия Opera (12) позволяет сохранить страницу как "HTML с изображениями".
Таким образом, Opera также загружает изображения, на которые ссылаются в файлах CSS, и соответственно адаптирует URL-адреса изображений в CSS.
Ответ 6
В Firefox:
Файл- > Сохранить страницу как- > веб-страницу, заполните
Сохраняет все javascript и изображения и css. Больше ничего не требуется:)
Ответ 7
wget