Wget命令参数及使用

GNU Wget 1.11.2,非互动式档案下载工具。
用法: wget [选项]... [URL]...

长选项必须用的参数在使用短选项时也是必须的。

�⒍�:
  -V,  --version           显示 Wget 版本并离开
  -h,  --help              印出这段说明文字
  -b,  --background        �⒍�后进入背景作业
  -e,  --execute=指令      执行 ‘.wgetrc’ 形式的指令

纪录讯息及输入档案:
  -o,  --output-file=档案    将纪录讯息写入<档案>中
  -a,  --append-output=档案  将纪录讯息加入<档案>末端
  -d,  --debug               印出侦错讯息
  -q,  --quiet               安静模式 (不输出讯息)
  -v,  --verbose             详细输出模式 (预设使用这个模式)
  -nv, --non-verbose         关闭详细输出模式,但不�⒂冒簿材J�
  -i,  --input-file=档案     下载从档案中找到的 URL
  -F,  --force-html          以 HTML 方式处理输入档
  -B,  --base=URL            使用 -F -i file 选项时,在相对链结前加入 URL

下载:
  -t,  --tries=次数              设定重试次数 (0 表示无限)
       --retry-connrefused       即使连线被拒仍然会不断尝试
  -O   --output-document=档案    将资料写入指定档案中
  -nc, --no-clobber              不覆写已经存在的档案
  -c,  --continue                继续下载已下载了一部份的档案
       --progress=方式           选择下载进度的表示方式
  -N,  --timestamping           除非远端档案比较新,否则不下载远端档案
  -S,  --server-response         显示伺服器回应讯息
       --spider                  不下载任何资料
  -T,  --timeout=秒数            指定所有时限�橥�一数值
       --dns-timeout=秒数        指定 DNS 查找主机的时限
       --connect-timeout=秒数    指定连线时限
       --read-timeout=秒数       指定读取资料的时限
  -w,  --wait=秒数               每次下载档案之前等待指定秒数
       --waitretry=秒数          每次重覆尝试前稍等一段时间 (由 1 秒至指
                                 定秒数不等)
       --random-wait             每次下载之前随机地指定等待的时间
       --no-proxy                禁止使用代理伺服器
  -Q,  --quota=大小              设定下载资料的限额大小
       --bind-address=位址       使用本机的指定位址 (主机名称或 IP) 进行连线
       --limit-rate=速率         限制下载速率
       --no-dns-cache            不记忆 DNS 查找主机的资料
       --restrict-file-names=OS  只使用作业系统能够接受的字元作�榈蛋缸衷�
       --ignore-case             ignore case when matching files/directories.
  -4,  --inet4-only              只会连接 IPv4 地址
  -6,  --inet6-only              只会连接 IPv6 地址
       --prefer-family=FAMILY    优先�裼弥付ǖ奈恢犯袷剑�可以是 IPv6、IPv4
                                 或者 none
       --user=用户               指定 ftp 和 http 用户名称
       --password=PASS           指定 ftp 和 http 密码

目录:
  -nd  --no-directories           不建立目录
  -x,  --force-directories        强制建立目录
  -nH, --no-host-directories      不建立含有远端主机名称的目录
       --protocol-directories     在目录中加上通讯协定名称
  -P,  --directory-prefix=名称    储存档案前先建立指定名称的目录
       --cut-dirs=数目            忽略远端目录中指定<数目>的目录层

HTTP 选项:
       --http-user=用户        指定 HTTP 用户名称
       --http-passwd=密码      指定 HTTP 密码
       --no-cache              不使用伺服器中的快取记忆资料
  -E,  --html-extension        将所有 HTML 文件加上 “.html” 延伸档名
       --ignore-length         忽略 ‘Content-Length’ 标头栏位
       --header=字串           在连线资料标头中加入指定字串
       --max-redirect          maximum redirections allowed per page.
       --proxy-user=用户       设定代理伺服器用户名称
       --proxy-password=密码   设定代理伺服器密码
       --referer=URL           在 HTTP 请求中包括 ‘Referer: URL’ 标头
       --save-headers          将 HTTP 连线资料标头存档
  -U,  --user-agent=AGENT      宣称�� AGENT 而不是 Wget/VERSION
       --no-http-keep-alive    不使用 HTTP keep-alive (持久性连线)
       --no-cookies            不使用 cookie
       --load-cookies=档案     程式�⒍�时由指定档案载入 cookie
       --save-cookies=档案     程式结束后将 cookie 储存至指定档案
       --keep-session-cookies  会载入和储存暂时性的 cookie
       --post-data=字串        使用 POST 方式送出字串
       --post-file=档案        使用 POST 方式送出档案内容
       --content-disposition   honor the Content-Disposition header when
                               choosing local file names (EXPERIMENTAL).
       --auth-no-challenge     Send Basic HTTP authentication information
                               without first waiting for the server's
                               challenge.

HTTPS (SSL/TLS) 选项:
       --secure-protocol=PR     选择安全通讯协定,可以使用 auto, SSLv2, 
                                SSLv3 或 TLSv1
       --no-check-certificate   不检验伺服器的凭证
       --certificate=档案       指定用户端的凭证档案名称
       --certificate-type=类型  用户端凭证的类型,可以是 PEM 或 DER
       --private-key=档案       指定私钥档案
       --private-key-type=类型  私钥的类型,可以是 PEM 或 DER
       --ca-certificate=档案    载有凭证管理中心 (CA) 签章的档案
       --ca-directory=目录      载有凭证管理中心 (CA) 签章的目录
       --random-file=档案       作�� SSL 随机数�a生程序 (PRNG) 的来源数据档案
       --egd-file=档案          �a生随机数据的 EGD socket 档案名称

FTP 选项:
       --ftp-user=用户         指定 FTP 用户名称
       --ftp-password=密码     设定 FTP 密码
       --no-remove-listing     不删除 ‘.listing’ 档案
       --no-glob               不展开有万用字元的 FTP 档名
       --no-passive-ftp        不使用「被动」传输模式
       --retr-symlinks         在递�模式中,下载链结指示的目标档案 
                               (不包括目录)
       --preserve-permissions  沿用远端档案的权限

递�下载:
  -r,  --recursive          递�下载
  -l,  --level=数字         最大搜寻深度 (inf 或 0 表示无限)
       --delete-after       删除下载后的档案
  -k,  --convert-links      将下载后的 HTML 的链结转换�楸镜氐蛋�
  -K,  --backup-converted   将档案 X 转换前先备份�� X.orig
  -m,  --mirror             相等於 -N -r -l inf --no-remove-listing 选项
  -p,  --page-requisites    下载所有显示网页所需的档案,例如图片等
       --strict-comments    用严格方式 (SGML) 处理 HTML 注释。

递�下载时有关接受/拒绝的选项:
  -A,  --accept=清单               接受的档案样式,以逗号分隔
  -R,  --reject=清单               排除的档案样式,以逗号分隔
  -D,  --domains=清单              接受的网域,以逗号分隔
       --exclude-domains=清单      排除的网域,以逗号分隔
       --follow-ftp                跟随 HTML 文件中的 FTP 链结
       --follow-tags=清单          会跟随的 HTML 标�`,以逗号分隔
  -G,  --ignore-tags=清单          会忽略的 HTML 标�`,以逗号分隔
  -H,  --span-hosts                递�模式中可进入其它主机
  -L,  --relative                  只跟随相对链结
  -I,  --include-directories=清单  �时赶略氐哪柯�
  -X,  --exclude-directories=清单  �时概懦�的目录
  -np, --no-parent                 不进入上层的目录

请将错误报告或建议寄给 <[email protected]>。


砍站范例说明:
只抓取http://www.example.com/data/之下的资料,不抓example.com以外的外部连结,也不抓/data/目录之外的档案。

程式码: [选择]
# wget \
    --recursive \
    --no-clobber \
    --page-requisites \
    --html-extension \
    --convert-links \
    --restrict-file-names=windows \
    --domains example.com \
    --no-parent \
    www.example.com/data/


你可能感兴趣的:(linux,shell)