[转]对CURL的一些研究

作者:mq110
来源:http://bbs.chinaunix.net/viewthread.php?tid=586014

前两天看到有人求客户端socket发HTTP包的代码,受flw版主启发找了一些perl的资料,不过对perl还是不太熟悉。也没有深入的研究。无意中发现了libcurl.so这个库。去google上搜索发现它是处理客户端发送HTTP请求的库以及可以处理web服务器回送回来的包。研究了两天将研究的成果,共享出来给大家一起研究。

参考:http://curl.haxx.se/这是curl开发者的首页。

利用libcurl.so库我们能轻松的连接某个web站点。获得某个首页的html代码或者是http请求的头部。还可以提交表单,
此外它还支持ftp,https,

/usr/include/curl/curl.h中。

1CURLcodecurl_global_init(longflags);

描述:
这个函数只能用一次。(其实在调用curl_global_cleanup函数后仍然可再用)
如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动完成。

参数:flags

CURL_GLOBAL_ALL //初始化所有的可能的调用。
CURL_GLOBAL_SSL //初始化支持安全套接字层。
CURL_GLOBAL_WIN32 //初始化win32套接字库。
CURL_GLOBAL_NOTHING//没有额外的初始化。


2voidcurl_global_cleanup(void);

描述:在结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。

3char*curl_version();

描述:打印当前libcurl库的版本。


4CURL*curl_easy_init();

描述:
curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样).相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个会话的开始.它的返回值一般都用在easy系列的函数中.

5voidcurl_easy_cleanup(CURL*handle);

描述:
这个调用用来结束一个会话.与curl_easy_init配合着用.

参数:
CURL类型的指针.

6CURLcodecurl_easy_setopt(CURL*handle,CURLoptionoption,parameter);

描述:这个函数最重要了.几乎所有的curl程序都要频繁的使用它.
它告诉curl库.程序将有如何的行为.比如要查看一个网页的html代码等.
(这个函数有些像ioctl函数)

参数:
1CURL类型的指针
2各种CURLoption类型的选项.(都在curl.h库里有定义,man也可以查看到)
3parameter这个参数既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.

CURLoption这个参数的取值很多.具体的可以查看man手册.

7CURLcodecurl_easy_perform(CURL*handle);

描述:这个函数在初始化CURL类型的指针以及curl_easy_setopt完成后调用.就像字面的意思所说perform就像是个舞台.让我们设置的
option运作起来.

参数:
CURL类型的指针.

下面来看一个简单的例子:
用来获得某个主页的html代码

#include<stdio.h>;

#include<curl/curl.h>;
#include<stdlib.h>;

intmain(intargc,char*argv[])
{
CURL*curl; //定义CURL类型的指针
CURLcoderes; //定义CURLcode类型的变量

if(argc!=2)
{
printf("Usage:file<url>;\n");
exit(1);
}

curl=curl_easy_init(); //初始化一个CURL类型的指针
if(curl!=NULL)
{
//设置curl选项.其中CURLOPT_URL是让用户指定url.argv[1]中存放的命令行传进来的网址
curl_easy_setopt(curl,CURLOPT_URL,argv[1]);
//调用curl_easy_perform执行我们的设置.并进行相关的操作.在这里只在屏幕上显示出来.
res=curl_easy_perform(curl);
//清除curl操作.
curl_easy_cleanup(curl);
}
return0;
}



编译:gcc-o001-Wall001.c-lcurl

我们来获得www.chinaunix.net主页的html代码

./001www.chinaunix.net

再来看一个例子:
实际编程时我们未必只显示出来.我们的目的是要对获得html代码做相应的处理.比如检验关键字,发现重要信息等等.

那么我们就需要把获得的html代码存入相应的文件中.看下面一个例子


#include<stdio.h>;
#include<stdlib.h>;
#include<unistd.h>;

#include<curl/curl.h>;
#include<curl/types.h>;
#include<curl/easy.h>;

FILE*fp;//定义FILE类型指针

size_twrite_data(void*ptr,size_tsize,size_tnmemb,void*stream)//这个函数是为了符合CURLOPT_WRITEFUNCTION,而构造的
{
intwritten=fwrite(ptr,size,nmemb,(FILE*)fp);
returnwritten;
}

intmain(intargc,char*argv[])
{
CURL*curl;

curl_global_init(CURL_GLOBAL_ALL);
curl=curl_easy_init();
curl_easy_setopt(curl,CURLOPT_URL,argv[1]);

if((fp=fopen(argv[1],"w"))==NULL)
{
curl_easy_cleanup(curl);
exit(1);
}
curl_easy_setopt(curl,CURLOPT_WRITEFUNCTION,write_data);//CURLOPT_WRITEFUNCTION将后继的动作交给write_data函数处理
curl_easy_perform(curl);
curl_easy_cleanup(curl);
exit(0);
}



gcc-o002-Wall002.c-lcurl
./002www.chinaunix.net
这个例子就将html代码保存在了www.chinaunix.net文件中了.

此外还可以获得http报文的头部post表单等等.这里就不详细的介绍了.具体的可以mancurl_easy_setopt
(要用到一个重要的结构体,HttpPost)



下面看一个从ftp站点下载文件的例子.


#include<stdio.h>;

#include<curl/curl.h>;
#include<curl/types.h>;
#include<curl/easy.h>;

structFtpFile//定义一个结构为了传递给my_fwrite函数.可用curl_easy_setopt的CURLOPT_WRITEDATA选项传递
{
char*filename;
FILE*stream;
};

intmy_fwrite(void*buffer,size_tsize,size_tnmemb,void*stream)
{
structFtpFile*out=(structFtpFile*)stream;//stream指针其实就是指向structFtpFileftpfile的
if(out&&!out->;stream)
{
out->;stream=fopen(out->;filename,"wb");//没有这个流的话就创建一个名字是out->;filename.
if(!out->;stream)
return-1;
}
returnfwrite(buffer,size,nmemb,out->;stream);
}

intmain(intargc,char*argv[])
{
CURL*curl;
CURLcoderes;
structFtpFileftpfile={argv[2],NULL};//初始化一个FtpFile结构
curl_global_init(CURL_GLOBAL_DEFAULT);

curl=curl_easy_init();
if(curl)
{
curl_easy_setopt(curl,CURLOPT_URL,argv[1]);
curl_easy_setopt(curl,CURLOPT_WRITEFUNCTION,my_fwrite);
curl_easy_setopt(curl,CURLOPT_WRITEDATA,&ftpfile);//给相关函数的第四个参数传递一个结构体的指针
curl_easy_setopt(curl,CURLOPT_VERBOSE,TRUE);//CURLOPT_VERBOSE这个选项很常用用来在屏幕上显示对服务器相关操作返回的信息

res=curl_easy_perform(curl);
curl_easy_cleanup(curl);

if(CURLE_OK!=res)
fprintf(stderr,"curltoldus%d\n",res);
}
if(ftpfile.stream)
fclose(ftpfile.stream);
curl_global_cleanup();

return0;
}



gcc-o003-Wall003.c-lcurl
./003ftp://202.96.64.144/fei.giffei.gif


我有个匿名的ftp的网址将目录下的fei.gif保存到本地也叫fei.gif


此外还有curl_escapecurl_unescape函数用来转换汉字成%XX这种类型.以及转换回来.如果要下载带有汉字的文件.先要调用将字符串转换一下.

curl库还有好多功能.有待大家来挖掘.

说明:在gcc编译的时候记得加上 -lcurl

你可能感兴趣的:(编程,.net,gcc,perl,FP)