用途说明

curl命令是一个功能强大的网络工具,它能够通过http、ftp等方式下载文件,也能够上传文件。其实curl远不止前面所说的那些功能,大家可以通过man curl阅读手册页获取更多的信息。类似的工具还有wget。

curl命令使用了libcurl库来实现,libcurl库常用在C程序中用来处理HTTP请求,curlpp是libcurl的一个C++封装,这几个东西可以用在抓取网页、网络监控等方面的开发,而curl命令可以帮助来解决开发过程中遇到的问题。

常用参数

curl命令参数很多,这里只列出我曾经用过、特别是在shell脚本中用到过的那些。

-v/--verbose 小写的v参数,用于打印更多信息,包括发送的请求信息,这在调试脚本是特别有用。

-m/--max-time 指定处理的最大时长

-H/--header

指定请求头参数

-s/--slient 减少输出的信息,比如进度

--connect-timeout 指定尝试连接的最大时长

-x/--proxy 指定代理服务器地址和端口,端口默认为1080

-T/--upload-file 指定上传文件路径

-o/--output 指定输出文件名称

-d/--data/--data-ascii 指定POST的内容

--retry 指定重试次数

-e/--referer 指定引用地址

-I/--head 仅返回头部信息,使用HEAD请求

使用示例 示例一 获取指定网页

[root@jfht ~]# curl http://www.sunrisecorp.net/







<br>欢迎您 - 上海腾一 <br>

插播一下广告:上海腾一信息技术有限公司是一家致力于通信工程、电子商务和电信增值业务的公司,请访问官方网址: http://www.sunrisecorp.net/ 。

此处省略掉网页内容 。


[root@jfht ~]#

示例二 查看响应头信息

[root@jfht ~]# curl -I http://www.sunrisecorp.net/
HTTP/1.1 200 OK
Server: Apache-Coyote/1.1
Accept-Ranges: bytes
ETag: W/"17801-1285643951000"
Last-Modified: Tue, 28 Sep 2010 03:19:11 GMT
Content-Type: text/html
Content-Length: 17801
Date: Tue, 12 Oct 2010 12:49:20 GMT
[root@jfht ~]#

示例三 检查网页是否可正常访问

以下是一个tomcat监控脚本的部分内容。

Bash代码

  1. # usage: check_once   
  2. # 使用curl检查网页是否可以正常访问,如果不能访问就重启tomcat。  
  3. check_once()  
  4. {  
  5.         echo  
  6.         echo "$(date)  Tomcat check once"
  7.         # 2008.08.21 -I/--head -s/--silent  
  8.         #if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/; then  
  9.         # 2010.02.16 add 200 OK test  
  10.         if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/$2 | grep -q '200 OK';  
  11. then  
  12.                 echo "$(date)  Tomcat maybe OK"
  13.         else  
  14.                 echo "$(date)  Tomcat maybe FAULT"
  15.                 restart  
  16.         fi  
  17. }  
  18. # usage: check_loop   
  19. # 每隔一分钟检查一次网页是否正常  
  20. check_loop()  
  21. {  
  22.         while true;  
  23.         do  
  24.                 sleep 60
  25.                 check_once $1 $2 >> $CATALINA_HOME/logs/check.$(date +%Y-%m-%d).log  
  26.         done  
  27. }  
  28. # usage: monitor   
  29. # 对path指定的本机网页进行监控  
  30. # 2008.06.26
  31. # 2010.09.20 add path parameter  
  32. monitor()  
  33. {  
  34.         PORT=80
  35.         if grep 'Connector port="80"' $CATALINA_HOME/conf/server.xml; then  
  36.                 PORT=80
  37.         elif grep 'Connector port="8080"' $CATALINA_HOME/conf/server.xml; then  
  38.                 PORT=8080
  39.         else  
  40.                 echo "Cannot detect server port for Tomcat"
  41.                 return 12
  42.         fi  
  43.         echo "Tomcat server port is $PORT"
  44.         if status; then  
  45.                 check_loop $PORT "$1" &  
  46.                 #check_loop $PORT "$1"
  47.         fi  
  48. }  
# usage: check_once # 使用curl检查网页是否可以正常访问,如果不能访问就重启tomcat。 check_once() { echo echo "$(date) Tomcat check once" # 2008.08.21 -I/--head -s/--silent #if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/; then # 2010.02.16 add 200 OK test if curl -s -I --connect-timeout 5 --max-time 10 http://localhost:$1/$2 | grep -q '200 OK'; then echo "$(date) Tomcat maybe OK" else echo "$(date) Tomcat maybe FAULT" restart fi } # usage: check_loop # 每隔一分钟检查一次网页是否正常 check_loop() { while true; do sleep 60 check_once $1 $2 >> $CATALINA_HOME/logs/check.$(date +%Y-%m-%d).log done } # usage: monitor # 对path指定的本机网页进行监控 # 2008.06.26 # 2010.09.20 add path parameter monitor() { PORT=80 if grep 'Connector port="80"' $CATALINA_HOME/conf/server.xml; then PORT=80 elif grep 'Connector port="8080"' $CATALINA_HOME/conf/server.xml; then PORT=8080 else echo "Cannot detect server port for Tomcat" return 12 fi echo "Tomcat server port is $PORT" if status; then check_loop $PORT "$1" & #check_loop $PORT "$1" fi } 

这个脚本的执行方式是 monitor ,比如monitor main/index.html。下面是执行时输出的日志信息片段。

2010年 10月 09日 星期六 15:20:38 CST  Tomcat check once
2010年 10月 09日 星期六 15:20:46 CST  Tomcat maybe OK
2010年 10月 09日 星期六 15:21:46 CST  Tomcat check once
2010年 10月 09日 星期六 15:21:57 CST  Tomcat maybe FAULT
Tomcat is now running, not stopped: 0
Tomcat is now running, not stopped: 1
Tomcat is now running, not stopped: 2
Tomcat is now running, not stopped: 3
Tomcat is now running, not stopped: 4
Tomcat is now running, not stopped: 5
Tomcat is now running, not stopped: 6
Tomcat is now running, not stopped: 7
Tomcat is now running, not stopped: 8
Tomcat is now running, not stopped: 9
Tomcat killed use SIGKILL
Tomcat stopped
      Starting tomcat
2010年 10月 09日 星期六 15:23:09 CST  Tomcat check once
2010年 10月 09日 星期六 15:23:09 CST  Tomcat maybe OK
2010年 10月 09日 星期六 15:24:09 CST  Tomcat check once
2010年 10月 09日 星期六 15:24:09 CST  Tomcat maybe OK

示例四 另一个检查网页是否正常的脚本

Bash代码

  1. # 要检查的网页地址  
  2. URL="http://www.sunrisecorp.net/"
  3. # usage:   
  4. curlit()  
  5. {  
  6.         curl --connect-timeout 15 --max-time 30 --head --silent "$URL" | grep 'HTTP/1.1 200 OK'
  7. }  
  8. # 只有MIN_ALARM次访问失败时才告警  
  9. MIN_ALARM=10
  10. #   
  11. doit()  
  12. {  
  13.     echo "===== $(now) ====="
  14.     if ! curlit; then  
  15.             echo "$(now)  bbdx nss access failed"
  16.             N=1
  17.             if [ -e curlit_error ]; then  
  18.                     N="$(cat curlit_error)"
  19.                     N=$[N+1]  
  20.             fi  
  21.             echo "$(now)  N=$N"
  22.             echo $N >curlit_error  
  23.             if [ "$N" == "$MIN_ALARM" ]; then  
  24.                     echo "$(now)  do notify"
  25.                     touch curlit_error  
  26.                     notify_curlit_error  
  27.             fi  
  28.     else  
  29.             if [ -e curlit_error ]; then  
  30.                     echo "$(now)  recovered"
  31.                     N=$(cat curlit_error)  
  32.                     echo "$(now)  N=$N"
  33.                     rm -f curlit_error  
  34.                     if [ "$N" -ge "$MIN_ALARM" ]; then  
  35.                             notify_curlit_recovered  
  36.                     fi  
  37.             fi  
  38.     fi  
  39. }  
  40. doit >>log/curlit.log 2>&1
# 要检查的网页地址 URL="http://www.sunrisecorp.net/" # usage: curlit() { curl --connect-timeout 15 --max-time 30 --head --silent "$URL" | grep 'HTTP/1.1 200 OK' } # 只有MIN_ALARM次访问失败时才告警 MIN_ALARM=10 # doit() { echo "===== $(now) =====" if ! curlit; then echo "$(now) bbdx nss access failed" N=1 if [ -e curlit_error ]; then N="$(cat curlit_error)" N=$[N+1] fi echo "$(now) N=$N" echo $N >curlit_error if [ "$N" == "$MIN_ALARM" ]; then echo "$(now) do notify" touch curlit_error notify_curlit_error fi else if [ -e curlit_error ]; then echo "$(now) recovered" N=$(cat curlit_error) echo "$(now) N=$N" rm -f curlit_error if [ "$N" -ge "$MIN_ALARM" ]; then notify_curlit_recovered fi fi fi } doit >>log/curlit.log 2>&1  示例五 使用HttpPost上传数据

一个用于http post的脚本。

Bash代码

  1. #!/bin/sh  
  2. MS=1350514xxxx  
  3. TM=$(date +"%Y%m%d%H%M%S")  
  4. DT=$(date +"%Y%m%d")  
  5. cat <<EOF >reqtmp.xml  
  6.   
  7.   
  8.         QZT  
  9.         BOSS  
  10.         T5100001  
  11.         0  
  12.         $TM  
  13.           
  14.         $TM  
  15.         $DT  
  16.         0  
  17.           
  18.                
  19.                         <BizProcReq>  
  20.                                 01  
  21.                                 $MS  
  22.                                 14  
  23.                                 1419  
  24.                                 01  
  25.                                 51  
  26.                                 $TM  
  27.                                 27  
  28.                                   
  29.                                         510001  
  30.                                   
  31.                           
  32.                 ]]>  
  33.           
  34.   
  35. EOF  
  36. cat reqtmp.xml  
  37. URL="http://10.32.140.230:7092/fcgi-bin/UIG_NEWINT"
  38. curl --verbose --upload-file reqtmp.xml  --header "Content-Type: text/xml" "$URL" --output rsptmp.xml  
  39. cat rsptmp.xml 
#!/bin/sh MS=1350514xxxx TM=$(date +"%Y%m%d%H%M%S") DT=$(date +"%Y%m%d") cat <<EOF >reqtmp.xml QZT BOSS T5100001 0 $TM $TM $DT 0 01 $MS 14 1419 01 51 $TM 27 510001 ]]> EOF cat reqtmp.xml URL="http://10.32.140.230:7092/fcgi-bin/UIG_NEWINT" curl --verbose --upload-file reqtmp.xml --header "Content-Type: text/xml" "$URL" --output rsptmp.xml cat rsptmp.xml 示例六 使用proxy的脚本

Bash代码

  1. # usage: do_sync_once   
  2. do_sync_once()  
  3. {  
  4.         mobile=$1
  5.         codes=$2
  6.         area_id=$3
  7.         opening=$4
  8. curl --silent --max-time 60 --proxy http://10.32.187.170:8080 "http://host/boss/sync.jsp?seq=1251747862492&mobile=$mobile&serviceCodes=$codes&areaId=$area_id&opening=$opening"
# usage: do_sync_once do_sync_once() { mobile=$1 codes=$2 area_id=$3 opening=$4   curl --silent --max-time 60 --proxy http://10.32.187.170:8080 "http://host/boss/sync.jsp?seq=1251747862492&mobile=$mobile&serviceCodes=$codes&areaId=$area_id&opening=$opening" } 示例七 使用Google AJAX Search API进行搜索

Bash代码

  1. # usage: google_search   
  2. # Google搜索  
  3. google_search()  
  4. {  
  5.         REF="http://codingstandards.javaeye.com/"
  6.         KEY="ABQIAAAAHg_ENG5Yq9pOZd19v64gyxTMcdcN4KfyGCBxustvF1FXdNe4WBQOej_ZiBgIK6-a4M3hTxcVfSkt2g"
  7.         STR="$1"
  8.         # 采用网页搜索  
  9.         curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null  
  10.         # 采用博客搜索  
  11.         #curl -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null  
  12.         #curl --retry 5 -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null  
  13.         #curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null  
# usage: google_search # Google搜索 google_search() { REF="http://codingstandards.javaeye.com/" KEY="ABQIAAAAHg_ENG5Yq9pOZd19v64gyxTMcdcN4KfyGCBxustvF1FXdNe4WBQOej_ZiBgIK6-a4M3hTxcVfSkt2g" STR="$1" # 采用网页搜索 curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null # 采用博客搜索 #curl -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null #curl --retry 5 -e $REF "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN" 2>/dev/null #curl --retry 5 -e "$REF" "http://ajax.googleapis.com/ajax/services/search/blogs?v=1.0&q=$STR&hl=zh-CN&key=$KEY" 2>/dev/null }