一、什么是cURL
1. cURL (Client URL Library Functions) 由Daniel Stenberg 创建
2. 官方定义 : curl is a command line tool for transferring data with URL syntax 释义:使用URL语法传输数据的命令行工具
3. 笼统总结 : curl是客户端向服务器请求资源的工具
二、cURL的使用场景
1. 网页资源 (编写爬虫 新闻、购物等... ...)
2. WebService 数据接口资源 (接口数据 天气、号码归属地... ...)
3. FTP 服务器里面的文件资源 (文件下载)
4. 其他资源 (所有网络上的资源都可以用curl去访问和下载到---强大之处)
三、在PHP中使用cURL
1. 确认PHP支持cURL
-Windows 确认方式:win+R 》cmd 》 php -i/m 》显示出所有PHP的设置 》在cmd中右键鼠标‘编辑-查找’ cURL 》如果查找到(cURL support)说明支持
注 php -i 出错可能是环境变量导致 自行脑补 不再叙述
-Linux 确认方式: xshell连接Linux,命令行输入 ‘php -i | grep cURL’。 如果看到cURL support=enabled 和 cURL Information 版本信息 说明支持
-通用方式:phpinfo() 查看 curl
-如果不支持:百度PHP Windows/Linux cURL 方法解决
2.cURL操作步骤解析
客户端: 初始化curl -> 向服务器发送请求 -> 接收服务器数据 -> 关闭curl
curl_init() 发送和接收之间是靠curl_exec()执行 curl_close()
三、cURL实战
1.用cURL做一个简单的网页爬虫
代码:
$curl=curl_init("http://www.baidu.com"); # 初始化
curl_exec($curl); # 执行
curl_close($curl); # 关闭curl
?>
新需求:用cURL抓取网页信息并替换部分内容(将百度 替换为 ‘阿里巴巴’)
$curlobj = curl_init(); #初始化
curl_setopt($curlobj, CURLOPT_URL, "http://www.baidu.com"); #设置访问网页的URL地址
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #执行之后不用直接打印出来
$output = curl_exec($curlobj); # 执行
curl_close($curlobj); # 关闭 curl
// echo str_replace("百度", "阿里巴巴", $output); #替换
// echo str_replace("新闻", "阿里巴巴", $output); #替换
echo str_replace("地图", "阿里巴巴", $output); #替换
2.用cURL获取天气信息
$data = "theCityName=兰州"; # 多个地址用 & 符号即可
$curlobj =curl_init();
curl_setopt($curlobj, CURLOPT_URL, "http://www.webxml.com.cn/WebServices/WeatherWebService.asmx/getWeatherbyCityName"); # 获取的路径
curl_setopt($curlobj, CURLOPT_HEADER, 0);
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']); # 解决为将对象引用设置到对象的实例问题
curl_setopt($curlobj, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'); # 解决为将对象引用设置到对象的实例问题
curl_setopt($curlobj, CURLOPT_POST, 1);
curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded;charset=utf8","Content-length:".strlen($data))); # 设置编码格式 长度
$rtn = curl_exec($curlobj);
if (!curl_errno($curlobj)) {
echo $rtn;
} else {
echo 'Curl 错误:'.curl_error($curlobj);
}
curl_close($curlobj);
3.用cURL操作 ftp 服务器中的数据
loding...
4.用cURL访问 https 资源
/**
* 代码实例 -PHP-cURL实战
* 实例描述:下载网络上面的一个HTTPS的资源
* 注意
*/
$curlobj = curl_init();
curl_setopt($curlobj, CURLOPT_URL, "https://ajax.aspnetcdn.com/ajax/jquery.validate/1.12.0/jquery.validate.js"); # 设置访问的页面
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #执行之后不打印出来
date_default_timezone_set('PRC'); # 使用Cookie时,必须先设时区
curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, 0); # 终止服务器端进行验证
$output = curl_exec($curlobj);
curl_close($curlobj);
echo $output;
5.用cURL模拟登录后获取数据
/**
* 代码实例 -PHP-cURL实战
* 实例描述:用cURL登录网站并且下载个人空间内容 (以慕课网为例)
* 注意
*/
$data = 'username=此处填写对应网站能够登录的用户名&password=登录密码&remember=1';
$curlobj = curl_init(); # 初始化
curl_setopt($curlobj, CURLOPT_URL, "https://m.imooc.com/account/login");# 设置访问网页的URL
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); # 执行之后不直接打印出来
// Cookie 相关设置,这部分设置需要在所有的会话开始之前就设置
date_default_timezone_set('PRC'); # 使用cookie时 必须先设置时区
curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($curlobj, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($curlobj, CURLOPT_COOKIESESSION, true);
curl_setopt($curlobj, CURLOPT_COOKIEFILE, "cookiefile");
curl_setopt($curlobj, CURLOPT_COOKIEJAR, "cookiefile");
curl_setopt($curlobj, CURLOPT_COOKIE, session_name() . '=' . session_id());
curl_setopt($curlobj, CURLOPT_HEADER, 0);
curl_setopt($curlobj, CURLOPT_FOLLOWLOCATION, 1); #能够让cURL支持饿页面链接跳转
curl_setopt($curlobj, CURLOPT_POST, 1);
curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded; charset=utf-8","Content-length: ".strlen($data)));
curl_exec($curlobj); # 执行
curl_setopt($curlobj, CURLOPT_URL, "https://www.imooc.com/u/1893790");
curl_setopt($curlobj, CURLOPT_POST, 0);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("Content-type:text/xml"));
$output=curl_exec($curlobj);
curl_close($curlobj);
echo $output;