python监控网页更新_【小白教程】Python3监控网页

之前用RSS来监控网页更新内容,可惜刷新时间太长了,三个小时。。只能看看新闻啥的,又没有小钱钱充会员(摊手

听说Python可以做这个功能,抱着试试看的态度,本以为会很麻烦,没想到这么简单哈哈~我从来没有用过Python都做出来了,相信你也没问题!

(我真是纯小白,路过的大佬请指教(⊙o⊙)ノ)

所用模块

#监控模块

from urllib import request

from bs4 import BeautifulSoup

#正则表达

import re

import time

#发送邮件模块

#邮箱服务器

import smtplib

#构建邮件正文内容

from email.mime.text import MIMEText

# email 用于构建邮件内容

from email.header import Header

1.原理

把网页获取到本地转码,然后筛选你需要的信息,重复这一过程。(看!是不是很简单呐

2.获取网页信息

用到了python的urllib模块,先上代码

#解析url地址 返回utf-8解码信息

def analyUrl(url):

header={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

#发送访问请求 此处header作用为模拟浏览器访问 部分网页反爬虫会检测访问源信息

_tmpRes

你可能感兴趣的:(python监控网页更新)