GNU Wget 1.11.2,非互动式档案下载工具。
用法: wget [选项]... [URL]...
长选项必须用的参数在使用短选项时也是必须的。
啟动:
-V, --version 显示 Wget 版本并离开
-h, --help 印出这段说明文字
-b, --background 啟动后进入背景作业
-e, --execute=指令 执行 ‘.wgetrc’ 形式的指令
纪录讯息及输入档案:
-o, --output-file=档案 将纪录讯息写入<档案>中
-a, --append-output=档案 将纪录讯息加入<档案>末端
-d, --debug 印出侦错讯息
-q, --quiet 安静模式 (不输出讯息)
-v, --verbose 详细输出模式 (预设使用这个模式)
-nv, --non-verbose 关闭详细输出模式,但不啟用安静模式
-i, --input-file=档案 下载从档案中找到的 URL
-F, --force-html 以 HTML 方式处理输入档
-B, --base=URL 使用 -F -i file 选项时,在相对链结前加入 URL
下载:
-t, --tries=次数 设定重试次数 (0 表示无限)
--retry-connrefused 即使连线被拒仍然会不断尝试
-O --output-document=档案 将资料写入指定档案中
-nc, --no-clobber 不覆写已经存在的档案
-c, --continue 继续下载已下载了一部份的档案
--progress=方式 选择下载进度的表示方式
-N, --timestamping 除非远端档案比较新,否则不下载远端档案
-S, --server-response 显示伺服器回应讯息
--spider 不下载任何资料
-T, --timeout=秒数 指定所有时限為同一数值
--dns-timeout=秒数 指定 DNS 查找主机的时限
--connect-timeout=秒数 指定连线时限
--read-timeout=秒数 指定读取资料的时限
-w, --wait=秒数 每次下载档案之前等待指定秒数
--waitretry=秒数 每次重覆尝试前稍等一段时间 (由 1 秒至指
定秒数不等)
--random-wait 每次下载之前随机地指定等待的时间
--no-proxy 禁止使用代理伺服器
-Q, --quota=大小 设定下载资料的限额大小
--bind-address=位址 使用本机的指定位址 (主机名称或 IP) 进行连线
--limit-rate=速率 限制下载速率
--no-dns-cache 不记忆 DNS 查找主机的资料
--restrict-file-names=OS 只使用作业系统能够接受的字元作為档案字元
--ignore-case ignore case when matching files/directories.
-4, --inet4-only 只会连接 IPv4 地址
-6, --inet6-only 只会连接 IPv6 地址
--prefer-family=FAMILY 优先採用指定的位址格式,可以是 IPv6、IPv4
或者 none
--user=用户 指定 ftp 和 http 用户名称
--password=PASS 指定 ftp 和 http 密码
目录:
-nd --no-directories 不建立目录
-x, --force-directories 强制建立目录
-nH, --no-host-directories 不建立含有远端主机名称的目录
--protocol-directories 在目录中加上通讯协定名称
-P, --directory-prefix=名称 储存档案前先建立指定名称的目录
--cut-dirs=数目 忽略远端目录中指定<数目>的目录层
HTTP 选项:
--http-user=用户 指定 HTTP 用户名称
--http-passwd=密码 指定 HTTP 密码
--no-cache 不使用伺服器中的快取记忆资料
-E, --html-extension 将所有 HTML 文件加上 “.html” 延伸档名
--ignore-length 忽略 ‘Content-Length’ 标头栏位
--header=字串 在连线资料标头中加入指定字串
--max-redirect maximum redirections allowed per page.
--proxy-user=用户 设定代理伺服器用户名称
--proxy-password=密码 设定代理伺服器密码
--referer=URL 在 HTTP 请求中包括 ‘Referer: URL’ 标头
--save-headers 将 HTTP 连线资料标头存档
-U, --user-agent=AGENT 宣称為 AGENT 而不是 Wget/VERSION
--no-http-keep-alive 不使用 HTTP keep-alive (持久性连线)
--no-cookies 不使用 cookie
--load-cookies=档案 程式啟动时由指定档案载入 cookie
--save-cookies=档案 程式结束后将 cookie 储存至指定档案
--keep-session-cookies 会载入和储存暂时性的 cookie
--post-data=字串 使用 POST 方式送出字串
--post-file=档案 使用 POST 方式送出档案内容
--content-disposition honor the Content-Disposition header when
choosing local file names (EXPERIMENTAL).
--auth-no-challenge Send Basic HTTP authentication information
without first waiting for the server's
challenge.
HTTPS (SSL/TLS) 选项:
--secure-protocol=PR 选择安全通讯协定,可以使用 auto, SSLv2,
SSLv3 或 TLSv1
--no-check-certificate 不检验伺服器的凭证
--certificate=档案 指定用户端的凭证档案名称
--certificate-type=类型 用户端凭证的类型,可以是 PEM 或 DER
--private-key=档案 指定私钥档案
--private-key-type=类型 私钥的类型,可以是 PEM 或 DER
--ca-certificate=档案 载有凭证管理中心 (CA) 签章的档案
--ca-directory=目录 载有凭证管理中心 (CA) 签章的目录
--random-file=档案 作為 SSL 随机数產生程序 (PRNG) 的来源数据档案
--egd-file=档案 產生随机数据的 EGD socket 档案名称
FTP 选项:
--ftp-user=用户 指定 FTP 用户名称
--ftp-password=密码 设定 FTP 密码
--no-remove-listing 不删除 ‘.listing’ 档案
--no-glob 不展开有万用字元的 FTP 档名
--no-passive-ftp 不使用「被动」传输模式
--retr-symlinks 在递迴模式中,下载链结指示的目标档案
(不包括目录)
--preserve-permissions 沿用远端档案的权限
递迴下载:
-r, --recursive 递迴下载
-l, --level=数字 最大搜寻深度 (inf 或 0 表示无限)
--delete-after 删除下载后的档案
-k, --convert-links 将下载后的 HTML 的链结转换為本地档案
-K, --backup-converted 将档案 X 转换前先备份為 X.orig
-m, --mirror 相等於 -N -r -l inf --no-remove-listing 选项
-p, --page-requisites 下载所有显示网页所需的档案,例如图片等
--strict-comments 用严格方式 (SGML) 处理 HTML 注释。
递迴下载时有关接受/拒绝的选项:
-A, --accept=清单 接受的档案样式,以逗号分隔
-R, --reject=清单 排除的档案样式,以逗号分隔
-D, --domains=清单 接受的网域,以逗号分隔
--exclude-domains=清单 排除的网域,以逗号分隔
--follow-ftp 跟随 HTML 文件中的 FTP 链结
--follow-tags=清单 会跟随的 HTML 标籤,以逗号分隔
-G, --ignore-tags=清单 会忽略的 HTML 标籤,以逗号分隔
-H, --span-hosts 递迴模式中可进入其它主机
-L, --relative 只跟随相对链结
-I, --include-directories=清单 準备下载的目录
-X, --exclude-directories=清单 準备排除的目录
-np, --no-parent 不进入上层的目录
请将错误报告或建议寄给
砍站范例说明:
只抓取http://www.example.com/data/之下的资料,不抓example.com以外的外部连结,也不抓/data/目录之外的档案。
程式码: [选择]
# wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains example.com \
--no-parent \
www.example.com/data/