Python及Python网络爬虫问题总结

requests爬取中文乱码

在这里插入图片描述
doc = requests.get(‘https://www.baidu.com’)
doc.encoding = ‘utf-8’
print(doc.text)

在这里插入图片描述

ChromeDriver启动失败 unknown error: cannot find Chrome binary

Python及Python网络爬虫问题总结_第1张图片
Python及Python网络爬虫问题总结_第2张图片
重新调用OK

菜鸟写Python-Pycharm执行Scrapy项目报:Scrapy-no active project 和(或)Unknown command: crawl错误

https://blog.csdn.net/godot06/article/details/81558910

PhantomJS问题

UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless
在这里插入图片描述意思就是Selenuim已经放弃PhantomJS,了,建议使用火狐或者谷歌无界面浏览器。解决:https://www.cnblogs.com/shaosks/p/9134257.html

ImportError: DLL load failed: 找不到指定的模块。

如果pycharm中有这个模块,能够导入使用。那么说明版本太低了。升级一下
Python及Python网络爬虫问题总结_第3张图片

UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x9c in position 7: illegal multibyte sequence

在这里插入图片描述
在这里插入图片描述

你可能感兴趣的:(Python)