Выходной документ и заголовки Wget в STDOUT
Я пытаюсь вывести тело документа и его заголовки в stdout с помощью wget wget -S -O - http://google.com
но он показывает только html docment.
Спасибо
UPD:
Работал над этим wget --save-headers --output-document - http://google.com
wget --version
показывает GNU Wget 1.11.4 Изменен Red Hat
Ответы
Ответ 1
Попробуйте следующее: никаких дополнительных заголовков
wget -qO- www.google.com
Обратите внимание на конечный -
. Это часть обычного аргумента команды для -O
для выхода в файл, но поскольку мы не используем >
для прямого доступа к файлу, он выходит в оболочку. Вы можете использовать -qO-
или -qO -
.
Ответ 2
wget -S -O - http://google.com
работает как ожидалось для меня, но с оговоркой: заголовки считаются отладочной информацией, и поэтому они отправляются на стандартную ошибку, а не на стандартный вывод. Если вы перенаправляете стандартный вывод в файл или другой процесс, вы получите только содержимое документа.
Вы можете попробовать перенаправить стандартную ошибку на стандартный вывод в качестве возможного решения. Например, в bash
:
$ wget -q -S -O - 2>&1 | grep ...
или
$ wget -q -S -O - 1>wget.txt 2>&1
Параметр -q
подавляет индикатор выполнения и некоторые другие досадно частые части вывода wget
.
Ответ 3
Он работает здесь:
$ wget -S -O - http://google.com
HTTP request sent, awaiting response...
HTTP/1.1 301 Moved Permanently
Location: http://www.google.com/
Content-Type: text/html; charset=UTF-8
Date: Sat, 25 Aug 2012 10:15:38 GMT
Expires: Mon, 24 Sep 2012 10:15:38 GMT
Cache-Control: public, max-age=2592000
Server: gws
Content-Length: 219
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Location: http://www.google.com/ [following]
--2012-08-25 12:20:29-- http://www.google.com/
Resolving www.google.com (www.google.com)... 173.194.69.99, 173.194.69.104, 173.194.69.106, ...
...skipped a few more redirections ...
[<=> ] 0 --.-K/s
<!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop="image" content="/images/google_favicon_128.png"><ti
... skipped ...
возможно, вам нужно обновить wget (~$ wget --version
GNU Wget 1.14 built on linux-gnu.
)
Ответ 4
Это не сработает:
wget -q -S -O - google.com 1>wget.txt 2>&1
так как перенаправления оцениваются справа налево, это отправляет html в wget.txt и заголовок в STDOUT:
wget -q -S -O - google.com 2>&1 1>wget.txt
Ответ 5
Это сработало для меня для печати ответа с заголовком:
wget --server-response http://www.example.com/