PHP实例--CURL实现简单采集

互联网上的数据非常多,有新闻网站,购物网站,视频网站,如果我们需要一些有规律的数据的话,比较笨拙费工夫的方法就是一条条手动录入,这是一个非常大的工作量,费时费力;还有一种方法,就是自己编写采集程序,直接将采集到的数据保存到数据库中,而不用一条条录入,从而减少工作量。

如果是我们想要采集的数据量非常大的情况下,我们当然都愿意选择后者,减少工作量。那么怎样编写采集程序呢,实验楼项目教程【CURL实现简单采集】就做了详细的介绍。

项目简介

该项目用PHP编写CURL来实现采集的功能,项目先分析需要采集的数据的网站的特点,加入到CURL的属性中来,实现定制采集的功能,最终得到需要的结果。

涉及知识点

  • CURL的使用
  • preg_match_all
  • array_filter
  • explode

实现采集器的原理

PHP中建立CURL请求的基本步骤

1 . 创建一个新CURL资源: $curl = curl_init ()

2 . 设置URL和相应的选项: curl_setopt ($curl,option,value) 常用参数:

  • CURLOPT_HEADER: 如果你想把一个头包含在输出中,设置这个选项为一个非零值。
  • CURLOPT_URL: 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。
  • CURLOPT_RETURNTRANSFER:如果成功只将结果返回,不自动输出任何内容。
  • CURLOPT_SSL_VERIFYHOST:禁用SSL证书的验证
  • CURLOPT_SSL_VERIFYPEER:禁用SSL证书的验证

3 . 抓取URL并把它传递给浏览器: $output = curl_exec ($curl)

4 . 关闭CURL资源,并且释放系统资源: curl_close ( $ch )

开发步骤

开发中以采集实验楼网站课程名字和图片为目标数据进行CURL采集程序的实现;

简单的采集:CURl简单实现获取一个网站页面功能;

新建一个curltest.php文件,抓取实验楼首页,并输出到页面:


代码执行效果如下:

实验楼首页

实现文字替换;

把页面中的所有的"实验楼"修改为"我喜欢在实验楼学习":

实现后如下:

PHP实例--CURL实现简单采集_第1张图片
替换后的网页

开始页面采集;

关于详细的开发步骤和代码详解,点击【CURL实现简单采集】,即可查看和学习了~

你可能感兴趣的:(PHP实例--CURL实现简单采集)