webdevqa.jp.net

STDOUTへの出力ドキュメントとヘッダーの取得

wget -S -O - http://google.comによるwgetを使用して、ドキュメント本文とそのヘッダーを標準出力に出力しようとしています。

ただし、htmlドキュメントのみが表示されます。

ありがとう

UPD:

これを働いたwget --save-headers --output-document - http://google.com

wget --versionはGNU Wget 1.11.4 Red Hat変更を表示します

89
user1239398

以下を試してください、余分なヘッダーはありません

wget -qO- www.google.com

末尾の-に注意してください。これは、-Oがファイルに出力するための通常のコマンド引数の一部ですが、>を使用してファイルに送信しないため、シェルに出力されます。 -qO-または-qO -を使用できます。

144
Joseph Lust

wget -S -O - http://google.comは期待どおりに動作します。but警告付き:ヘッダーはデバッグ情報と見なされ、標準ではなく標準エラーに送信されます出力。標準出力をファイルまたは別のプロセスにリダイレクトする場合、ドキュメントのコンテンツのみを取得します。

可能な解決策として、標準エラーを標準出力にリダイレクトしてみてください。たとえば、bashの場合:

$ wget -q -S -O - 2>&1 | grep ...

または

$ wget -q -S -O - 1>wget.txt 2>&1

-qオプションは、wget出力のプログレスバーやその他のいらいらする部分を抑制します。

41
thkala

ここで動作します:

    $ wget -S -O - http://google.com
HTTP request sent, awaiting response... 
  HTTP/1.1 301 Moved Permanently
  Location: http://www.google.com/
  Content-Type: text/html; charset=UTF-8
  Date: Sat, 25 Aug 2012 10:15:38 GMT
  Expires: Mon, 24 Sep 2012 10:15:38 GMT
  Cache-Control: public, max-age=2592000
  Server: gws
  Content-Length: 219
  X-XSS-Protection: 1; mode=block
  X-Frame-Options: SAMEORIGIN
Location: http://www.google.com/ [following]
--2012-08-25 12:20:29--  http://www.google.com/
Resolving www.google.com (www.google.com)... 173.194.69.99, 173.194.69.104, 173.194.69.106, ...

  ...skipped a few more redirections ...

    [<=>                                                                                                                                     ] 0           --.-K/s              
<!doctype html><html itemscope="itemscope" itemtype="http://schema.org/WebPage"><head><meta itemprop="image" content="/images/google_favicon_128.png"><ti 

... skipped ...

おそらく、wgetを更新する必要があります(~$ wget --version GNU Wget 1.14 built on linux-gnu.

18
BeniBela

これは機能しません:

wget -q -S -O - google.com 1>wget.txt 2>&1

リダイレクトは右から左に評価されるため、これによりhtmlがwget.txtに送信され、ヘッダーがSTDOUTに送信されます。

wget -q -S -O - google.com 2>&1 1>wget.txt
2
maniac_on_moon

これはヘッダー付きの応答を印刷するために私のために働いた:

wget --server-response http://www.example.com/
1
Abhishek saharn