本文章用于豆瓣电影爬取信息过程中出现的问题
全部内容见笔者的github
场景
conda create -n scrapy python=3
问题
OSError: [WinError 87] The parameter is incorrect
描述
解决方案
场景
问题
WebDriverException: Message: unknown error: bad inspector message
in
3 driver = webdriver.Chrome(options=chrome_options)
4 driver.get(url)
----> 5 html = driver.page_source
UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\ud83d’ in position 76660: surrogates not allowed
html = HTML(url=self.url, html=content.encode(DEFAULT_ENCODING), default_encoding=DEFAULT_ENCODING)
描述
解决方案
场景
问题
描述
解决方案
from selenium.webdriver.chrome.options import Options
from fake_useragent import UserAgent
chrome_options = Options()
ua = UserAgent()
user_agent = {“user-agent”: ua.random}
chrome_options.add_argument(f’–user-agent={user_agent}’) # 添加请求头中的用户代理
chrome_options.add_argument(’–disable-gpu’) # 禁用GPU
chrome_options.add_argument(’–headless’) # 无图形界面
chrome_options.add_argument(’–blink-settings=imagesEnabled=false’) # 禁止图片加载
chrome_options.add_argument(’–window-size=800,900’) # 设定屏幕分辨率
chrome_options.add_experimental_option(‘excludeSwitches’, [‘enable-automation’]) # 设定浏览器调控模式