from : http://my.oschina.net/davehe/blog/102036
curl支持包括http,https,ftp在内的众多协议,它还支持POST,cookie,认证,从指定偏移处下载部分文件,参照页,用户代理字符串,扩展头部,限速,文件大小限制,进度条等特性。
1.访问http页面内容,通常将下载文件输出到stdout,将进度信息输出到stderr,要想避免显示进度信息,使用--silent,-o用来将下载的数据写入指定名称的文件中.如果需要在下载过程中显示如#的进度条,用--progress代替--silent
1
2
3
4
5
6
7
8
9
10
11
12
|
[email protected]:curl
# curl http://www.163.com/index.html -o index.html
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
0 0 0 0 0 0 0 0 --:--:-- --:--:-- --:--:-- 0
100 465k 0 465k 0 0 374k 0 --:--:-- 0:00:01 --:--:-- 415k
[email protected]:curl
#
[email protected]:curl
# curl http://www.163.com/index.html -o index1.html --progress
######################################################################## 100.0%
######################################################################## 100.0%
[email protected]:curl
# curl http://www.163.com/index.html -o index.html --silent
[email protected]:curl
# ls
index1.html index.html
|
2.只打印响应头部信息(不包括数据部分)
只打印响应头部(response header) 有助于进行各种检查或统计,例如,要求无须下载整个页面内容就能够检验某个页面是否能够打开,那么我们只用读取http响应头部就能够知道这个页面是否可用。
检查HTTP头部的一个用例就是在下载之前先查看文件大小,我们可以在下载之前,通过检查HTTP头部中的Content-Length参数来得知文件的长度,同样还可以从头部检索出其他一些有用的参数,last-modified参数能告诉我们远程文件最后的改动时间
通过-I或--head就可以只打印HTTP头部信息,而无须下载远程文件。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
[email protected]:curl
# curl -I http://www.163.com
HTTP
/1
.1 200 OK
Expires: Mon, 14 Jan 2013 03:53:33 GMT
Date: Mon, 14 Jan 2013 03:52:13 GMT
Server: nginx
Content-Type: text
/html
; charset=GBK
Transfer-Encoding: chunked
Vary: Accept-Encoding,User-Agent,Accept
Cache-Control: max-age=80
Age: 66
X-Via: 1.1 jssq185:88 (Cdn Cache Server V2.0), 1.1 zjfy81:8361 (Cdn Cache Server V2.0)
Connection: keep-alive
[email protected]:curl
# curl -I http://www.sina.com
HTTP
/1
.0 301 Moved Permanently
Date: Mon, 14 Jan 2013 03:11:55 GMT
Server: Apache
Location: http:
//www
.sina.com.cn/
Cache-Control: max-age=3600
Expires: Mon, 14 Jan 2013 04:11:55 GMT
Vary: Accept-Encoding
Content-Length: 231
Content-Type: text
/html
; charset=iso-8859-1
Age: 2491
X-Cache: HIT from sh201-20.sina.com.cn
Connection: close
[email protected]:curl
# curl --head http://www.taobao.com
HTTP
/1
.1 200 OK
Server: Tengine
Date: Mon, 14 Jan 2013 03:53:37 GMT
Content-Type: text
/html
; charset=gbk
Connection: keep-alive
Vary: Accept-Encoding
Expires: Mon, 14 Jan 2013 04:53:37 GMT
Cache-Control: max-age=3600
|
3.指定客户端.
有些网络资源首先需要判断用户使用的是什么浏览器,符合标准了才能够下载或者浏览,。此时curl可以把自己“伪装”成任何其他浏览器:
1
2
3
4
5
6
7
|
[email protected]:curl
# curl http://www.test.com
[email protected]:apache2
#tail -f www.test.com_access.com
10.1.1.200 - - [14
/Jan/2013
:00:33:59 +0800]
"GET / HTTP/1.1"
200 54646
"-"
"curl/7.18.2 (x86_64-pc-linux-gnu) libcurl/7.18.2 OpenSSL/0.9.8g zlib/1.2.3.3 libidn/1.8 libssh2/0.18"
[email protected]:curl
# curl -A "Mozilla/6.0 (compatible; MSIE 5.01; Windows NT 5.0)" http://www.test.com
[email protected]:apache2
#tail -f www.test.com_access.com
10.1.1.200 - - [14
/Jan/2013
:00:36:45 +0800]
"GET / HTTP/1.1"
200 54499
"-"
"Mozilla/6.0 (compatible; MSIE 6.01; Windows NT 6.0)"
|
-A ""该选项可以指定客户端类型,服务器通过该选项判断用户应用的平台及浏览器信息,上面这个指令表示curl伪装成了windows机器.
4.用curl进行认证
登录某些页面或ftp需要先进行认证,输入用户名和密码。curl的这个选项可以直接处理这类操作,用指定的账号和密码进行登录认证。后面的选项指定代理的用户名和密码,这样便可以直接用这个代理访问网页了.-x选项为http指定代理及端口,如果不指定端口,默认为1080
1
|
curl -U user:password -x 201.36.208.19:3128 http:
//www
.
test
.com
|
5.断点续传
-C提供断点续传功能,如果未指定offset,或者直接用"-C -",则curl会自己分析该从什么位置开始续传。
1
|
[email protected]:curl
# curl -C - http://www.sina.com
|
6.限定curl可占用的带宽
1
|
[email protected]:curl
# curl http://www.baidu.com --limit-rate 20k
|
7.分块下载
-r选项指定下载字节的范围,常应用于分块下载文件。range的表示方式有多种,如100-500,则指定从100开始的400个字节数据;-500表示 最后的500个字节;5000-表示从第5000个字节开始的所有字节;另外还可以同时指定多个字节块,中间用","分开.
1
2
|
[email protected]:curl
# curl -r 0-1024 http://www.test.com/a.zip
[email protected]:curl
# curl -r 1025- http://www.test.com/a.zip
|
先下1M,然后再下剩下的部分
8.curl上传
用POST方法向服务器提交数据。这时的URL是看不到的,因此需要使用-d参数来抓取这个页面
1
|
url -d
"action=add&name=davehe"
-d
"id=1"
http:
//10
.1.1.200
/example
.php
|
如果使用了-F参数,这个命令的实质是将本地的文件用POST上传到服务器。-F参数以name=value的方式来指定参数内容,如果值是一个文件,则需要以name=@file的方式来指定。
1
|
curl -F
"filename=@/dave/test.tar.gz"
http:
//10
.1.1.200
/example
.php
|
8.测试参数
测试连接www.163.com需要多少时间
1
2
|
[email protected]:curl
# curl -o /dev/null -s -w %{time_connect}:%{time_starttransfer}:%{time_total} www.163.com
0.013:0.022:0.089
|
1
2
|
[email protected]:curl
# curl -o /dev/null -s -w %{size_header} http://www.163.com
368
|
其他常用常用http变量
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
http_code:http返回类似404,200,500等
time_total:总相应时间
time_namelookup:域名解析时间
time_connect:连接到目标地址耗费的时间
time_pretransfer:从执行到开始传输文件的时间间隔
time_starttransfer:从执行到开始传输文件的时间间隔
size_download:下载网页或文件大小
size_upload:上传文件大小
size_header:响应头
size_request:发送请求参数大小
speed_download:传输速度
speed_upload:平均上传速度
content_type:下载文件类型.
|
curl非常强大,除了学习参数之外,还要深刻理解http的各种协议与URL的各个语法。