wget离线下载文档

备忘,以免每次使用都要搜索。
参见:http://www.truevue.org/linux/wget-download-website

wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains jersey.java.net \
     --no-parent \
          https://jersey.java.net/documentation/latest/index.html

    --recursive: 下载整个网站
    --domains jersey.java.net: 不要下载指定域名之外的网页。
    --no-parent: 仅下载html/文件夹下的网页。
    --page-requisites: 现在网页包括的所有内容(images, CSS and so on).
    --html-extension: 将网页保存为html文件。
    --convert-links: 将连接转换为本地连接
    --restrict-file-names=windows: 文件名保存为windows格式。
    --no-clobber: 不要覆盖已有文件,在下载中断后继续下载。

如果是https,有时会出错,此时加参数:--no-check-certificate

你可能感兴趣的:(wget离线下载文档)