Python入门学习(14)

利用Python实现翻墙——下载网址

今天作业

Python入门学习(14)_第1张图片
图片发自App

我完成的图

Python入门学习(14)_第2张图片
图片发自App

今天的代码很多看不懂,幸亏群里有大神,参考 TianAff 和 sinkpink 的笔记才有一点思路。

1、urllib模块提供上层接口,可以像读取本地文件一样读取www和ftp上的数据。(我试试,发现只需两行代码就能抓取百度首页的html)

Python入门学习(14)_第3张图片
图片发自App

2、re模块。经python大大解析,作业中re是过滤网页的html符号,只显示我们关注的文字

3、利用urlretrieve()函数将远程信息下载到本地

4、re.sub()中re是regular expression的缩写,表示正则表达式。正则表达式通常被用来检索、替换符合某个模式的文本(不太懂!!!)

5、"* ?"的组合是非贪婪模式(还是不懂!!!)

6、join()函数表示连接字符串,常常用于字符连接操作

Python入门学习(14)_第4张图片
图片发自App

你可能感兴趣的:(Python入门学习(14))