爬虫(笔记01)/无界面和谷歌有界面操作

一、 标题无界面创建以及参数的配置

from selenium import webdriver

爬虫(笔记01)/无界面和谷歌有界面操作_第1张图片

二、谷歌有界面参数设置

	from selenium import webdriver
	import time
	from selenium.webdriver.common.keys import Keys
	from selenium.webdriver.chrome.options import Options
	
	#用此对象来添加参数
	chrome_options = Options()
	
	chrome_options.add_argument('--proxy-server=http://ip:port')    #添加代理
	chrome_options.add_argument('--no-sandbox')      #解决DevToolsActivePort文件不存在的报错
	chrome_options.add_argument('window-size=1920x3000')   	#指定浏览器分辨率
	chrome_options.add_argument('--disable-gpu')   		#谷歌文档提到需要加上这个属性来规避bug
	chrome_options.add_argument('--hide-scrollbars')   #隐藏滚动条, 应对一些特殊页面
	chrome_options.add_argument('blink-settings=imagesEnabled=false')   		#不加载图片, 提升速度
	chrome_options.add_argument('--headless')   #浏览器不提供可视化页面. linux下如果系统不支持可视化不加这条会启动失败
	
	driver = webdriver.Chrome(r'C:\Users\ibm\PycharmProject\day7\chromedriver.exe', chrome_options=chrome_options)
	
	driver.get('https://www.baidu.com')
	
	print(driver.page_source)
	
	driver.close() #关闭浏览器,回收资源
	
注:(基本操作和无界面一样)

三、常用的基本操作

	1. driver.get(url)   # 发起请求
	2. time.sleep(2)   # 请求要耗时,所以让睡眠一会儿
	3. driver.save_screenshot('1.png')   # 截屏看下是否请求到页面
	4. response = driver.page_source  # 返回页面
	5. browser.find_element_by_id('kw').send_keys('赵丽颖')    # 	 在搜索框中输入"selenium"
	6.	browser.find_element_by_id('kw').send_keys(Keys.SPACE)   #  输入空格
	7.	browser.find_element_by_id('kw').send_keys(Keys.CONTROL, 'a')   #  Ctrl+a 模拟全选
	8.	browser.find_element_by_id('kw').send_keys(Keys.CONTROL, 'c')   #  Ctrl+c 模拟复制
	9.	browser.find_element_by_id('kw').send_keys(Keys.CONTROL, 'v')    #  Ctrl+v 模拟粘贴
	10.	browser.find_element_by_id('kw').send_keys(Keys.ENTER)    #  输入回车,代替 搜索 按钮
	11.	#输入selenium 搜索
			driver.find_element_by_id('kw').send_keys('赵丽颖')
			driver.find_element_by_id('su').click()

四、 小结与拓展

爬虫(笔记01)/无界面和谷歌有界面操作_第2张图片

你可能感兴趣的:(爬虫(笔记01)/无界面和谷歌有界面操作)