Python3爬虫学习之一:Python3中urlopen报错解决方式

  • Python3中关于urllib阐述与Python2的不同之处
  • 报错现象及解决方式

Python3中关于urllib阐述与Python2的不同之处

详细的说明与讲解,请参考下列博文:

1.python3中文手册关于urllib用法概述

2.详解:Python2中的urllib、urllib2与Python3中的urllib以及第三方模块requests

报错现象

在练习中,我选用《python网络数据采集》这本书的例子来为大家展示。
我们在pycharm中敲下如下代码:
Python3爬虫学习之一:Python3中urlopen报错解决方式_第1张图片

from urllib.request import urlopen

html = urlopen("https://pythonscraping.com/pages/page1.html")

print(html .read())

我们点击运行后,出现如下情况,代码运行成功。
Python3爬虫学习之一:Python3中urlopen报错解决方式_第2张图片
但第一次我们可能会遇见如下的问题:
1.报错,返回值为1。
2.爬取不换行。
Python3爬虫学习之一:Python3中urlopen报错解决方式_第3张图片
可以参考下列说明:
Python3爬虫学习之一:Python3中urlopen报错解决方式_第4张图片
python 3+将urllib分成了几个部分:request、parse、error,使用的时候,可以直接用下列方式:

不可以直接from urllib import urlopen会出现下列现象:
Python3爬虫学习之一:Python3中urlopen报错解决方式_第5张图片
我们换一种方式:

import urllib.request
htmlcode=urllib.request.urlopen("http://www.baidu.com").read()
print(htmlcode)

但是这段代码有点儿小问题,就是没有换行,显示结果如下:
Python3爬虫学习之一:Python3中urlopen报错解决方式_第6张图片
我试着寻找一下原因:
就是pycharm的设置没有把换行按钮点开,图示一下:
Python3爬虫学习之一:Python3中urlopen报错解决方式_第7张图片
这样就解决了。

第一篇博文就到这里,有问题欢迎指出,一同进步~~~

你可能感兴趣的:(python爬虫)