Python爬虫教程,简单易懂,学会后可以做副业赚钱

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第1张图片

在这个信息爆炸的时代,要想高效地获取数据,爬虫绝对是首选。而用python做爬虫也十分简单,下面就通过一个简单的小爬虫程序,来一睹写爬虫的基本过程:


一、准备工作

语言:python

IDE:pycharm

首先是要用到的库,因为是刚入门最简单的程序,我们主要就用到下面这两个:

import requests //用于请求网页
import re  //正则表达式,用于解析筛选网页中的信息

其中re是python自带的,requests库需要我们自己安装,在命令行中输入pip install requests即可。

然后随便找一个网站,注意不要尝试爬取隐私敏感信息。

二、编写爬虫程序

开始爬虫前,我们首先应明确两点:

  1. 爬虫的网址;

  2. 需要爬取的内容(数据)。

第一步,爬虫的网址,我们拿某表情包网站来举例子。

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第2张图片

首先肯定要通过python访问这个网站,代码如下:

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'
    }
response = requests.get('https://qq.yh31.com/zjbq/',headers=headers)  //请求网页

其中之所以要加headers这一段,是因为有些网页会识别出python请求,然后拒绝,所以我们要换个正常的请求头。可以随便找一个或者f12从网络信息里复制一个。

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第3张图片

然后我们要找到我们要爬取的图片在网页代码里的位置,f12查看源代码,找到表情包如下:

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第4张图片

然后建立匹配规则,用正则表达式把中间那串替换掉,最简单的就是.*?

t = '(.*?)'

像这样,就可以调用re库里的findall方法把相关内容爬下来了。

result = re.findall(t, response.text)

返回的内容是由字符串组成的列表,最后我们经由爬到的地址,通过python语句把图片下载下来保存到文件夹里就OK啦。

程序源码:

import requests
import re
import os
 
image = '表情包'
if not os.path.exists(image):
    os.mkdir(image)
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'
    }
response = requests.get('https://qq.yh31.com/zjbq/',headers=headers)
response.encoding = 'GBK'
response.encoding = 'utf-8'
print(response.request.headers)
print(response.status_code)
t = '(.*?)'
result = re.findall(t, response.text)
for img in result:
    print(img)
    res = requests.get(img[0])
    print(res.status_code)
    s = img[0].split('.')[-1]  //截取地址末尾,得到表情包格式,如.jpg .git
    with open(image + '/' + img[1] + '.' + s, mode='wb') as file:
        file.write(res.content)

最终结果

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第5张图片


只要明白了爬虫的原理,就会发现爬虫并不难,只要多多练习,还可以开辟副业。

 最后

为了帮助大家更好的学习Python,小编给大家准备了一份Python学习资料,里面的内容都是适合零基础小白的笔记和资料,不懂编程也能听懂、看懂,需要获取方式:扫描下方即可获取。

CSDN大礼包:《Python零基础入门&进阶学习资源包》免费分享

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第6张图片

Python学习路线汇总

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

Python必备开发工具

精品Python学习书籍

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

温馨提示:篇幅有限,已打包文件夹,获取方式:点击这里【 Python全套资料或扫描下方即可获取。

CSDN大礼包:《Python零基础入门&进阶学习资源包》免费分享

Python学习视频600合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

​​​

100道Python练习题

​​​

面试刷题

​​​

​​​

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

​​​

获取方式:点击这里【 Python全套资料或扫描下方即可获取。

CSDN大礼包:《Python零基础入门&进阶学习资源包》免费分享

Python爬虫教程,简单易懂,学会后可以做副业赚钱_第7张图片

 

你可能感兴趣的:(python,编程,爬虫,python,开发语言,数据分析,数据挖掘,面试)