PYTHON 3 爬虫出现 问题

python3爬虫手把手教

python官方手册

问题

在用python写爬虫的时候遇到了urlopen的一个error:

>>> url = """https://www.google.com.hk/search?newwindow=1&safe=strict&biw=960&bih=430&noj=1&q=django&oq=django
&gs_l=serp.3...664389.664389.0.664921.1.1.0.0.0.0.0.0..0.0....0...1c..64.serp
..1.0.0.cfHP0MSxtWU
"""
... ...

造成这个问题的原因会有很多,例如,有的网站为了防止程序访问,需要加上header等才能正常访问,否则会报这个错误。

解决方法

其实细心的朋友会发现我上面的代码为了雅观,用了“ “““ “ 来续行,并且用回车将url路径给截断了。所以问题就来了——这就相当于在原来的url字符串中引入了‘/n‘ 字符,所以路径不对,肯定打不开啦!

只要不要回车,就可以恢复urllib.request.open的正常使用了。

(问题:但这种情况下如何实现换行? 用 ‘a‘ + ‘b’ + ‘c’ 就行啦~)

你可能感兴趣的:(个人技术点滴)