二木成林

python爬虫（6）——Selenium的使用

下载安装Selenium

在DOS窗口输入命令pip install selenium

然后使用python编辑器输入如下代码进行运行：

from selenium import webdriver

driver=webdriver.Chrome()
driver.get("http://www.baidu.com")

print(driver.title)
driver.quit()

运行报错：

Traceback (most recent call last):
  File "E:\预PyCharm项目\教程\Demo\venv\lib\site-packages\selenium\webdriver\common\service.py", line 76, in start
    stdin=PIPE)
  File "F:\python\InstallationFiles\lib\subprocess.py", line 756, in __init__
    restore_signals, start_new_session)
  File "F:\python\InstallationFiles\lib\subprocess.py", line 1155, in _execute_child
    startupinfo)
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "E:/预PyCharm项目/教程/第二章/demo1/demo1-1.py", line 3, in 
    driver=webdriver.Chrome()
  File "E:\预PyCharm项目\教程\Demo\venv\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 73, in __init__
    self.service.start()
  File "E:\预PyCharm项目\教程\Demo\venv\lib\site-packages\selenium\webdriver\common\service.py", line 83, in start
    os.path.basename(self.path), self.start_error_message)
selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home

因为使用selenium驱动不同的浏览器，需要单独下载并设置不同的浏览器驱动。

各浏览器驱动地址：

注意：要下载和自己电脑浏览器版本相同的浏览器驱动，否则会报错

浏览器驱动	地址
Firefox浏览器驱动	https://github.com/mozilla/geckodriver/releases
Chrome浏览器驱动	https://npm.taobao.org/mirrors/chromedriver
IE浏览器驱动	http://selenium-release.storage.googleapis.com/index.html
Edge浏览器驱动	https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver
Opera浏览器驱动	https://github.com/operasoftware/operachromiumdriver/releases
PhantomJS浏览器驱动	http://phantomjs.org/

下载成功后就是设置浏览器驱动。

然后将其添加到Path中

我的电脑-->属性-->系统设置-->高级-->环境变量-->系统变量-->Path

再次运行上面的python代码，如果还是报错。

可以自己定义驱动器的路径：

driver = webdriver.Chrome(r"F:\BrowserDriver\chromedriver\chromedriver_win32\chromedriver.exe")

运行成功则在控制台打印：

百度一下，你就知道

其他的浏览器驱动：

webdriver.Chrome()# 谷歌浏览器
webdriver.Firefox()# 火狐浏览器
webdriver.Ie() # IE浏览器
webdriver.Edge() # Edge浏览器
webdriver.Opera() # Opera浏览器
webdriver.PhantomJS() # PhantomJS浏览器

selenium元素定位

定位方式	对应方法	描述
id	find_element_by_id()	通过元素的ID属性
name	find_element_by_name()	通过元素的name属性
className	find_element_by_class_name()	通过元素的class属性（即类名）
tagName	find_element_by_tag_name()	通过元素的标签名
linkText	find_element_by_link_text()	通过超链接的文本值（是a元素）必须精确匹配
partialLinkText	find_element_by_partial_link_text()	通过超链接的文本值（是a元素）是模糊匹配
xpath	find_element_by_xpath()	通过xpath表达式
cssSelector	find_element_by_css_selector()	通过CSS选择器

实例介绍：

from selenium import webdriver

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"

driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 通过ID定位
driver.find_element_by_id("kw")

# 通过name定位
driver.find_element_by_name("wd")

# 通过className定位
driver.find_element_by_class_name("s_ipt")

# 通过tagName定位
driver.find_element_by_tag_name("input")

# 通过xpath表达式定位（能够定位成功的xpath表达式有很多，这里只写一种）
driver.find_element_by_xpath("//input[@id='kw']")

# 通过CSS选择器定位（能够定位成功的CSS选择器有很多，这里只写一种）
driver.find_element_by_css_selector(".s_ipt")

# 通过a元素的文本值进行精确定位（精确地位即a标签的完整文本值）
driver.find_element_by_link_text("新闻")

# 通过a元素的文本值进行模糊定位（模糊定位即a标签的一些文本值）
driver.find_element_by_partial_link_text("新")

driver.quit()

控制浏览器操作

控制浏览器窗口大小

让某种浏览器以自定义尺寸打开，让访问的页面在这种尺寸下运行。

python代码如下：

from selenium import webdriver

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"

driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

driver.set_window_size(300, 400)  # 第一个参数是浏览器的宽度；第二个参数是浏览器的高度
# driver.maximize_window()# 控制浏览器全屏显示

# driver.quit() # 这行代码先注释掉，以免运行后直接关掉

运行效果如下：

控制浏览器前进后退

在使用浏览器浏览网页时，浏览器提供了后退和前进按钮，可以方便地在浏览过的网页之间切换，WebDriver也提供了对应的back()和forward()方法来模拟后退和前进按钮。

from selenium import webdriver

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"

driver = webdriver.Chrome(options=options)

# 访问百度首页，即第一个页面
first_url = "https://www.baidu.com/"
print("现在访问: " + first_url)
driver.get(first_url)

# 访问新闻页面，即第二个页面
second_url = "http://news.baidu.com/"
print("现在访问：" + second_url)
driver.get(second_url)

# 后退到百度首页（第一个页面）
print("后退到百度首页：" + first_url)
driver.back()

# 前进到新闻页面（第二个页面）
print("前进到新闻页面：" + second_url)
driver.forward()

# driver.quit() # 这行代码先注释掉，以免运行后直接关掉

由于页面切换比较快，图片不好展示，以控制台打印来显示执行过程：

现在访问: https://www.baidu.com/
现在访问：http://news.baidu.com/
后退到百度首页：https://www.baidu.com/
前进到新闻页面：http://news.baidu.com/

刷新页面

如果需要手动刷新页面，可以使用refresh()方法。

from selenium import webdriver

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"

driver = webdriver.Chrome(options=options)

# 手动刷新页面
driver.refresh()

# driver.quit() # 这行代码先注释掉，以免运行后直接关掉

WebDriver常用方法

点击和输入

from selenium import webdriver

# clear()：清除输入框中的文本
# send_keys(value)：模拟按键在输入框中输入文本值
# click()：单击按钮元素

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 清除ID为"kw"的输入框中的文本
driver.find_element_by_id("kw").clear()
# 向ID为"kw"的输入框中输入一个值
driver.find_element_by_id("kw").send_keys("Hello World!")
# 点击ID为"su"的按钮
driver.find_element_by_id("su").click()

# driver.quit() # 这行代码先注释掉，以免运行后直接关掉

运行成功，会有如下效果：

提交

submit()方法用于提交表单。例如，在搜索框输入关键字之后的“回车” 操作，就可以通过该方法模拟。

from selenium import webdriver

# submit()：用于提交表单，和click()方法相似

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 获取ID为"kw"的输入框
search_text = driver.find_element_by_id("kw")
# 清除ID为"kw"的输入框中的文本
search_text.clear()
# 向ID为"kw"的输入框中输入一个值
search_text.send_keys("Hello World!")
# 并使用submit()方法提交
search_text.submit()

# driver.quit() # 这行代码先注释掉，以免运行后直接关掉

运行成功的效果如下：

和上面的click()方法类似。

其他方法

from selenium import webdriver

# size：属性，返回元素的尺寸，结果是一个字典
# text：属性，返回元素的文本
# get_attribute(attributeName)：方法，返回元素的属性值，参数是要获取的属性名字
# is_displayed()：设置该元素是否用户可见

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 获取ID为"kw"的元素的尺寸大小
size = driver.find_element_by_id("kw").size
print(size)

# 获取ID为"tj_trnews"的元素的文本
text = driver.find_element_by_name("tj_trnews").text
print(text)

# 返回ID为"tj_trnews"的元素的属性值
attribute = driver.find_element_by_name("tj_trnews").get_attribute("href")
print(attribute)

# 返回ID为"tj_trnews"的元素的结果是否可见，返回值是True或False
result = driver.find_element_by_name("tj_trnews").is_displayed()
print(result)

driver.quit()

控制台打印结果为：

{'height': 22, 'width': 500}
新闻
http://news.baidu.com/
True

鼠标事件

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains  # 导入鼠标操作方法的类

# 在 WebDriver 中， 将这些关于鼠标操作的方法封装在 ActionChains 类提供。
# ActionChains 类提供了鼠标操作的常用方法：
# perform()： 执行所有 ActionChains 中存储的行为；
# context_click()： 右击；
# double_click()： 双击；
# drag_and_drop()： 拖动；
# move_to_element()： 鼠标悬停。

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 获取ID为"su"的元素
element = driver.find_element_by_id("su")
# 执行鼠标悬停操作
# 调用 ActionChains()类， 将浏览器驱动 driver 作为参数传入。
# move_to_element(element)方法是模拟鼠标悬停操作，在调用是传入要指定的元素
# perform()相当于提交
ActionChains(driver).move_to_element(element).perform()

driver.quit()

键盘事件

示例代码如下：

from selenium import webdriver
# 使用键盘事件需要引入keys模块
from selenium.webdriver.common.keys import Keys

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 输入框输入内容
driver.find_element_by_id("kw").send_keys("Hello")
# 输入空格键
driver.find_element_by_id("kw").send_keys(Keys.SPACE)
# 输入框输入内容
driver.find_element_by_id("kw").send_keys("World!")
# 复制输入框内容
driver.find_element_by_id("kw").send_keys(Keys.CONTROL, "c")
# 通过回车键提交输入框内容
driver.find_element_by_id("su").send_keys(Keys.ENTER)

# driver.quit()

运行效果图如下：

代码解释说明：

from selenium.webdriver.common.keys import Keys：在使用键盘按键方法前需要先导入 keys 类。
send_keys(Keys.BACK_SPACE) ：删除键（BackSpace）
send_keys(Keys.SPACE)：空格键(Space)
send_keys(Keys.TAB) ：制表键(Tab)
send_keys(Keys.ESCAPE) ：回退键（Esc）
send_keys(Keys.ENTER)：回车键（Enter）
send_keys(Keys.CONTROL,'a') ：全选（Ctrl+A）
send_keys(Keys.CONTROL,'c') ：复制（Ctrl+C）
send_keys(Keys.CONTROL,'x') ：剪切（Ctrl+X）
send_keys(Keys.CONTROL,'v') ：粘贴（Ctrl+V）
send_keys(Keys.F1) 键盘 F1
……
send_keys(Keys.F12) 键盘 F12

获取断言信息

将程序实际产生的结果与自己预期想要产生的结果进行比较，即为断言。

在selenium中通常使用title、URL和text等信息进行断言。

import time

from selenium import webdriver

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

print("搜索提交之前：")
print(driver.title)  # 打印当前页面的title
print(driver.current_url)  # 打印当前页面的URL

driver.find_element_by_id("kw").send_keys("Hello World!")
driver.find_element_by_id("su").click()
time.sleep(3)# 延迟3秒

print("搜索提交之后：")
print(driver.title)  # 打印当前页面的title
print(driver.current_url)  # 打印当前页面的URL

print(driver.find_element_by_css_selector("span.nums_text").text)  # 打印结果

driver.quit()

控制台打印：

搜索提交之前：
百度一下，你就知道
https://www.baidu.com/
搜索提交之后：
Hello World!_百度搜索
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=Hello%20World!&rsv_pq=ac825d880001b31a&rsv_t=6e57kMEF39ti66UkqskIuuYFq1L5LER8TH%2F7tKqs8vlflFjmFTI8%2FAKVk7w&rqlang=cn&rsv_enter=0&rsv_dl=tb&rsv_sug3=12&inputT=190&rsv_sug4=191
百度为您找到相关结果约22,400,000个

代码解释说明：

title：用于获得当前页面的标题。
current_url：用户获得当前页面的URL。
text：获取元素的文本信息。

设置元素等待

WebDriver提供了两种类型的等待：显式等待和隐式等待。

显式等待

显式等待即是等待某个条件成立时再继续执行，否则在达到最大时长时抛出超时异常。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait

# 设置元素等待
# 显式等待：在某个条件成立时继续执行，否则在超时后抛出异常
# 隐式等待：

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

element = WebDriverWait(driver, 5, 0.5).until(EC.presence_of_element_located((By.ID, "kw")))
element.send_keys("Hello World!")

# driver.quit()

运行完成后如果不关闭浏览器，就会出现如下：

如果把"kw"改成"kww"

由于不存在这个元素就会报异常TimeoutException

代码解释说明：

本例中是判断ID为"kw"的元素是否存在。

注意需要导入如下模块：

from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait

WebDriverWait类是由WebDirver 提供的等待方法。在设置时间内，默认每隔一段时间检测一次当前页面元素是否存在，如果超过设置时间检测不到则抛出异常。
WebDriverWait()一般由until()或until_not()方法配合使用。until()方法提供一个驱动程序作为参数直到返回值为True；until_not()方法与until()方法相反，直到返回值为False。

WebDriverWait参数介绍：

WebDriverWait(driver,timeout,poll_frequency,ignored_exceptions)
# driver：浏览器的驱动
# timeout：最长超时时间，默认以秒为单位
# poll_frequency：检测的间隔（步长）时间，默认为0.5S。
# ignored_exceptions ：超时后的异常信息，默认情况下抛NoSuchElementException异常。

隐式等待

隐式等待通过implicitly_wait()方法来实现，默认设置为0.

from time import ctime

from selenium import webdriver
from selenium.common.exceptions import NoSuchCookieException

# 设置元素等待
# 显式等待：在某个条件成立时继续执行，否则在超时后抛出异常
# 隐式等待：如果元素可以定位则继续执行，否则以轮询的方式不断判断元素是否被定位到，直到超出设置时长才抛出异常

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 设置隐式等待为10秒
driver.implicitly_wait(10)  # 默认参数的单位是秒

try:
    print(ctime())  # 输出现在时间
    driver.find_element_by_id("kww").send_keys("Hello World!")  # 查找id为"kww"的元素，如果没有找到10秒后抛出异常
except NoSuchCookieException as e:
    print(e)
finally:
    print(ctime())  # 输入现在时间
    driver.quit()

控制台抛出异常的打印：

定位一组元素

定位一组元素和定位单个元素相似，只是多个s而已。

driver.find_elements_by_id()# 通过ID查找一组元素
driver.find_elements_by_name()# 通过name属性查找一组元素
driver.find_elements_by_class_name()# 通过class名查找一组元素
driver.find_elements_by_tag_name()# 通过标签名查找一组元素
driver.find_elements_by_link_text()# 通过a标签的文本值精确匹配一组元素
driver.find_elements_by_partial_link_text()# 通过a标签的文本值模糊匹配一组元素
driver.find_elements_by_xpath()# 通过XPATH表达式查找一组元素
driver.find_elements_by_css_selector()# 通过CSS选择器查找一组元素

下面只演示其中一个的例子，使用和定位单个元素相同。

from selenium import webdriver

# 定位一组元素

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 通过ID查找一组a标签的元素，返回一个列表
elements = driver.find_elements_by_tag_name("a")
# 选好遍历列表
for element in elements:
    print(element.text)

driver.quit()

控制台打印：

新闻
hao123
地图
视频
贴吧
学术
登录
设置
更多产品
把百度设为主页
关于百度
About  Baidu
百度推广
使用百度前必读
意见反馈
京公网安备11000002000001号

多表单切换

在Web应用中经常会遇到frame/iframe表单嵌套页面的应用，WebDriver只能在一个页面上对元素识别与定位，对于frame/iframe表单内嵌页面上的元素无法直接定位。

这时就需要通过switch_to.frame()方法将当前定位的主体切换为frame/iframe表单的内嵌页面中。

下面以网易邮箱的登录为例：

from selenium import webdriver

# 多表单切换

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://mail.163.com/")

# 点击“密码登录”超链接，跳转至登录表单
driver.find_element_by_id("switchAccountLogin").click()
# 跳到iframe表单
iframe = driver.find_element_by_tag_name("iframe")
driver.switch_to.frame(iframe)
driver.find_element_by_xpath("//input[@name='email']").send_keys("10086")
driver.find_element_by_name("password").send_keys("123456")
# 跳回到最外层的页面
# driver.switch_to.default_content()

# driver.quit()

运行成功的效果如下：

代码解释说明：

switch_to.frame()默认可用直接读取表单的id或name属性。
如果没有可用的id和name属性，可用使用其他方式读取到该iframe元素，然后作为参数传递进去
switch_to.default_content()方法可用跳回到最外层的页面。

多窗口切换

在页面操作过程中有时候点击某个链接会弹出新的窗口，这时就需要主机切换到新打开的窗口上进行操作。

WebDriver提供了switch_to.window()方法，可以实现在不同的窗口之间切换。

以百度注册为例：

from selenium import webdriver

# 多窗口切换

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F")

# 获取当前页面的窗口句柄
current_handle = driver.current_window_handle

# 打开“立即注册”新窗口
driver.find_element_by_link_text("立即注册").click()

# 获取当前打开的所有的窗口的句柄
all_handles = driver.window_handles

# 切换窗口
for handle in all_handles:
    if handle != current_handle:
        # 切换窗口
        driver.switch_to.window(handle)
        # 为输入框填入值
        driver.find_element_by_name("userName").send_keys("userName")
        driver.find_element_by_name("phone").send_keys("phone")

# driver.quit()

打开的浏览器页面如下：

代码解释说明：

current_window_handle：属性，获取当前窗口的句柄。
window_handles：属性，获取所有窗口的句柄。
switch_to.window()：方法，切换到相应的窗口，参数是要切换的窗口的句柄。

警告框

webdriver可用处理由JavaScript产生的alert、confirm及prompt等对话框。

示例如下：

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time

# 处理警告框

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 将鼠标放在“设置”链接上
link=driver.find_element_by_link_text("设置")
ActionChains(driver).move_to_element(link).perform()

# 打开“搜索设置”
driver.find_element_by_link_text("搜索设置").click()
time.sleep(6)# 需要等待一段时间

# 点击“保存设置”
driver.find_element_by_link_text("保存设置").click()

# 接受警告框
# driver.switch_to.alert.accept()
# 打印警告框信息
print(driver.switch_to.alert.text)

# driver.quit()

控制台打印：

已经记录下您的使用偏好

浏览器如下：

代码解释说明：

switch_to.alert：是获取当前页面的警告框
text：属性，接受alert、confirm、prompt中的文字信息
accept()：接受现有警告框
dismiss()：解散现有警告框
send_keys(text)：发送文本至警告框。text即是你要发送的文本。

下拉列表框选择

可用Select类来处理下拉列表框。

import time

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.select import Select

# 下拉列表框选择

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("http://www.baidu.com")

# 将鼠标放在“设置”链接上
link = driver.find_element_by_link_text("设置")
ActionChains(driver).move_to_element(link).perform()

# 打开“搜索设置”
driver.find_element_by_link_text("搜索设置").click()
time.sleep(6)  # 需要等待一段时间

# 获取下拉列表框并选择值
select = driver.find_element_by_name("NR")
# Select(select).select_by_index(2)# 通过索引进行选择，索引从0开始
# Select(select).select_by_value("20")# 通过值进行选择
Select(select).select_by_visible_text("每页显示20条")# 通过显式的文本进行选择

# driver.quit()

浏览器效果如下：

文件上传

对于通过input标签实现的上传功能，可以将其看作是一个输入框，即通过send_keys()指定本地文件路径的方式实现文件上传。

from selenium import webdriver

# 下拉列表框选择

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://download.csdn.net/upload")

driver.find_element_by_id("txt_userfile").send_keys(r"C:\Users\Administrator\Documents\temp\temp.txt")

# driver.quit()

操作cookie

WebDriver提供了操作Cookie的相关方法，可以读取、添加和删除cookie信息。

WebDriver操作cookie的方法：

方法	描述
get_cookies()	获得所有的cookie信息
get_cookie(name)	返回字典的key为“name”的cookie信息
add_cookie(cookie_dict)	添加cookie。参数是一个字典对象，必须拥有name和value值
delete_cookie(name,optionsString)	删除cookie信息，“name”是要删除的cookie名称；“optionsString”是该cookie的选项
delete_all_cookies()	删除所有的cookie信息

from selenium import webdriver

# 操作cookie

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://www.baidu.com/")

# 获取cookie信息
cookie=driver.get_cookies()
# 打印
print(cookie)

# 写入cookie信息
driver.add_cookie({"name":"张三","value":"123456"})
# 打印
print(driver.get_cookies())

# 删除cookie
driver.delete_all_cookies()
# 打印
print(driver.get_cookies())

driver.quit()

控制台打印：

[{'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1434_21120_30210_30071_22159'}, {'domain': '.baidu.com', 'expiry': 1607165433.523985, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'C2D902C0E736D3D3F1BCEC5909153B0E:FG=1'}, {'domain': '.baidu.com', 'expiry': 3723113080.523962, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'C2D902C0E736D3D30F3C6E6D815F1039'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'delPer', 'path': '/', 'secure': False, 'value': '0'}, {'domain': '.baidu.com', 'expiry': 3723113080.523975, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1575629434'}, {'domain': '.baidu.com', 'expiry': 1575715833.924175, 'httpOnly': False, 'name': 'BDORZ', 'path': '/', 'secure': False, 'value': 'B490B5EBF6F3CD402E515D22BCDA1598'}, {'domain': 'www.baidu.com', 'expiry': 1576493433, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314753'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '0'}]
[{'domain': 'www.baidu.com', 'httpOnly': False, 'name': '张三', 'path': '/', 'secure': True, 'value': '123456'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'H_PS_PSSID', 'path': '/', 'secure': False, 'value': '1434_21120_30210_30071_22159'}, {'domain': '.baidu.com', 'expiry': 1607165433.523985, 'httpOnly': False, 'name': 'BAIDUID', 'path': '/', 'secure': False, 'value': 'C2D902C0E736D3D3F1BCEC5909153B0E:FG=1'}, {'domain': '.baidu.com', 'expiry': 3723113080.523962, 'httpOnly': False, 'name': 'BIDUPSID', 'path': '/', 'secure': False, 'value': 'C2D902C0E736D3D30F3C6E6D815F1039'}, {'domain': '.baidu.com', 'httpOnly': False, 'name': 'delPer', 'path': '/', 'secure': False, 'value': '0'}, {'domain': '.baidu.com', 'expiry': 3723113080.523975, 'httpOnly': False, 'name': 'PSTM', 'path': '/', 'secure': False, 'value': '1575629434'}, {'domain': '.baidu.com', 'expiry': 1575715833.924175, 'httpOnly': False, 'name': 'BDORZ', 'path': '/', 'secure': False, 'value': 'B490B5EBF6F3CD402E515D22BCDA1598'}, {'domain': 'www.baidu.com', 'expiry': 1576493433, 'httpOnly': False, 'name': 'BD_UPN', 'path': '/', 'secure': False, 'value': '12314753'}, {'domain': 'www.baidu.com', 'httpOnly': False, 'name': 'BD_HOME', 'path': '/', 'secure': False, 'value': '0'}]
[]

调用JavaScript代码

WebDriver提供了execute_script()方法来执行JavaScript代码。

import time

from selenium import webdriver

# 执行JavaScript代码

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://www.baidu.com/")

driver.set_window_size(300, 400)  # 设置浏览器大小

# 通过JavaScript设置浏览器窗口的滚动条位置
js1 = "window.scrollTo(100,300)"
driver.execute_script(js1)
time.sleep(5)

js2 = "alert('正在使用selenium执行JavaScript代码哟！')"
driver.execute_script(js2)

# driver.quit()

浏览器效果如下：

窗口截图

WebDriver提供了截图函数get_screenshot_as_file()来截取当前窗口。

import time

from selenium import webdriver

# 窗口截图

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://www.baidu.com/")

driver.set_window_size(300, 400)  # 设置浏览器大小

# 截取当前窗口，并指定截图图片的保存位置
driver.get_screenshot_as_file("screen_shot.png")

driver.quit()

图片如下：

关闭浏览器

webdriver提供两个方法

close() 关闭单个窗口
quit() 关闭所有窗口

from selenium import webdriver

# 关闭窗口
# close() 关闭单个窗口
# quit() 关闭所有窗口

options = webdriver.ChromeOptions()  # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径
options.binary_location = r"F:\谷歌浏览器\安装文件\Chrome-78.0.3904.108\Google\Chrome\Application\chrome.exe"
driver = webdriver.Chrome(options=options)
driver.get("https://www.baidu.com/")

# 关闭窗口
driver.quit()

你可能感兴趣的:(#,python爬虫,python,python爬虫)

python 一小时教程 wsf_123456 python Python 编程 C C#C++
1序言面向读者本文适合有经验的程序员尽快进入Python2.x世界.特别地,如果你掌握Java和Javascript,不用1小时你就可以用Python快速流畅地写有用的Python程序.Python3.x用户请参考:http://www.cnitblog.com/yunshichen/archive/2009/04/01/55924.html(由于Django不支持python3,所以为了你的发展
python合并多个pdf_Python实现按序合并多个pdf文件 weixin_39647458 python合并多个pdf
技术交流QQ群:1027579432，欢迎你的加入！欢迎关注我的微信公众号：CurryCoder的程序人生1.整体实现步骤在日常办公中，我们可能会有一个需求，需要将多个pdf文件合并成一个文件。例如：需要将每个章节的pdf文件学习资料合并成一个pdf文件，便于我们进行学习资料的归档与整理。如何才能合并多个pdf文件呢？我查了一下网上现有的资料(详见参考资料1)，发现python中有一个第三方库Py
练手代码之使用Python实现合并PDF文件 Wcowin Python python pdf 前端
如果你有合并PDF的需要，你会怎么办我们无所不能的程序员会选择写一个Python代码来实现（谁会这么无聊？是我），如果真的有PDF操作需要，我推荐你使用PDFExpert这个软件哈~话不多说直接上代码：importosimportPyPDF2fromtkinterimportTkfromtkinter.filedialogimportaskopenfilenamesdefcombine_pdfs(
Python面向对象面试题及参考答案大模型大数据攻城狮 python 面试继承封装接口隔离弱引用元类
目录什么是面向对象编程？Python中的类和对象是什么？什么是继承？Python如何实现继承？什么是多态？Python如何实现多态？Python中的类属性和实例属性有什么区别？类属性和实例属性的访问优先级规则是什么？Python中的实例方法、类方法和静态方法有什么区别？静态方法、类方法、实例方法的参数传递差异是什么？什么是构造函数（init）？解释__init__方法与__new__方法的区别Py
Python中dataframe的to_list和to_list()差距 emmmmXxxy python list
先新建一个dataframe数据框df=pd.DataFrame({'a':[1,2,3],'b':[3,4,5],'c':[5,6,7]})df结果然后看一下两者的区别dataframe的to_list1df['b']结果031425Name:b,dtype:int642df['b'].to_list结果3看一下数据类型type(df['b'].to_list)结果methoddataframe
Python实现观察者模式麦田里走一夜 PYTHON python 观察者模式开发语言
请关注【来玩AI】公众号体验人工智能来玩AI>>>Python实现观察者模式观察者模式python代码实现说明应用场景观察者模式模式是一种常用的设计模式，可以在对象之间建立一对多的依赖关系。Python中实现观察者模式有多种方式，下面给出一种基于类和装饰器的实现方式：python代码实现classObserver:defupdate(self,observable,*args,**kwargs):
自然语言处理系列（5）——情感分析的原理与实战 DoYangTan 自然语言处理人工智能
自然语言处理系列（5）——情感分析的原理与实战情感分析（SentimentAnalysis）是自然语言处理中的一项经典任务，目的是通过分析文本，判断其表达的情感倾向性。情感分析广泛应用于社交媒体监控、市场调研、客户服务等领域，帮助企业和机构快速了解用户的情感态度。在本文中，我们将深入探讨情感分析的基本概念、常用方法，并展示如何使用Python和现代NLP工具实现情感分析任务。1.情感分析的基本概念
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 web安全 CTF 网络安全大赛 python Linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
anaconda 创建虚拟环境 yuweififi 环境搭建
1.打开AnacondaPrompt2.创建环境condacreate--nametorchpython=3.62.输入activatetorch安装的anacondapython虚拟环境打开，torch为创建的env名字3.condainfo--env查看所有创建的环境4.关闭环境deactivate切记先激活环境
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
网络安全工具 AWVS 与 Nmap：原理、使用及代码示例阿贾克斯的黎明网络安全安全 web安全网络
目录网络安全工具AWVS与Nmap：原理、使用及代码示例AWVS：Web漏洞扫描的利器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用AWVSAPI进行扫描）Nmap：网络探测与端口扫描的神器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用Nmap进行扫描）总结在网络安全领域，AWVS（AcunetixWebVulnerabilityScanner）和Nmap是
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
【Python专栏】Python的发展历程雾岛心情 Python入门到精通 python 开发语言
Python的创始人为吉多·范罗苏姆（GuidovanRossum），人称龟叔1989年，为了打发圣诞节假期，Guido开始写Python语言的编译器。Python这个名字，来自Guido所挚爱的电视剧MontyPython’sFlyingCircus。他希望这个新的叫做Python的语言，能符合他的理想：创造一种C和shell之间，功能全面，易学易用，可拓展的语言。Python的具体发展历史和版
Stable diffusion 3.5本地运行环境配置记录寸先生的牛马庄园扩散模型 stable diffusion
1.环境配置创建虚环境condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-cuda=12.1-cpytorch-cnvidiaJupyter能使用Anaconda虚环境condainstallipykernelpython-mi
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
如何使用Python编程实现捕获笔记本电脑麦克风的音频并通过蓝牙耳机实时传输 winfredzhang python 音视频实时传输蓝牙耳机
在现代的工作和生活环境中，音频传输的需求日益增加。无论是远程会议、在线教育，还是家庭娱乐，音频的实时传输都扮演着至关重要的角色。今天，我将向大家介绍一个简单而实用的应用程序，它能够捕获笔记本电脑麦克风的音频，并通过蓝牙耳机实时传输。这款应用程序特别适用于需要在会议室等场景中远程听取声音的情况。接下来，我将详细讲解这个应用程序的实现过程，并提供完整的代码和使用指南。引言想象一下这样的场景：你需要离开
网络安全加密python代码黑客Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快网络信息安全中遇到的各种攻击是防不胜防的，采取适当的防护措施就能有效地保护网络信息的安全,包括防火墙、入侵检测系统、漏洞扫描技术以及加密技术等多种防护措施。而信息安全的本质就是要保护信息本身和信息系统在存储、传输中的完整性和保密性,保障不被攻击和篡改,上述的主动攻击、被动攻击和病毒袭击都会造成信息的破坏和泄密,我们以信息安全中的基础理论出
python 商城性能,python商城项目总结 Yvetzy python 商城性能
importhashlib#实例化md5对象md5=hashlib.md5()#md5.update()方法的参数必须是字节型数据md5.update(bytes(request.POST['password'],encoding="UTF-8"))#以16进制格式存储md5.hexdigest()'''这里有个坑必须注意：md5.update()方法会将每次加密的字符进行拼接，所以每次加密前都要
用Python写一个商城系统潮水岩
如果要用Python写一个商城系统，可以先定义需要实现的功能，再按照功能模块分别进行开发。下面是一个简单的开发流程：数据模型设计：需要定义商品、订单、用户等数据模型，并且将它们存储在数据库中。用户模块：用户可以注册、登录、查看个人信息、修改密码等。商品模块：商家可以发布商品、管理商品信息、查看商品列表等；用户可以查看商品详情、加入购物车等。订单模块：用户可以下单、查看订单详情、取消订单、评价订单等
python pandas 读取数据库_Python+Pandas 获取数据库并加入DataFrame的实例 weixin_39955149 python pandas 读取数据库
Python+Pandas获取数据库并加入DataFrame的实例实例如下所示：importpandasaspdimportsysimportimpimp.reload(sys)fromsqlalchemyimportcreate_engineimportcx_Oracledb=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbins
python导出结果_Python连接Oracle数据查询导出结果 weixin_39712821 python导出结果
python连接oracle，需用用到模块cx_oracle，可以直接pip安装，如网络不好，可下载离线后本地安装本人由于工作需要，期望便捷查询所得结果，且固定输出某个格式具体代码如下：#!coding:utf-8importcx_Oracleconn=cx_Oracle.connect('username/password@IP/连接名')cur=conn.cursor()cur.execute
Python—kafka操作蓝魔Y Python编程 kafka
文档结构1、概念简介2、环境搭建3、操作实践1、概念简介2、环境搭建接口手册：https://kafka-python.readthedocs.io/en/master/Python操作kafka的模块为：kafka-python模块安装pipinstallkafka-python3、操作实践=============================================over====
python使用kafka原理详解_Python操作Kafka原理及使用详解形象顧問Aking
Python操作Kafka原理及使用详解一、什么是KafkaKafka是一个分布式流处理系统，流处理系统使它可以像消息队列一样publish或者subscribe消息，分布式提供了容错性，并发处理消息的机制二、Kafka的基本概念kafka运行在集群上，集群包含一个或多个服务器。kafka把消息存在topic中，每一条消息包含键值(key)，值(value)和时间戳(timestamp)。kafk
python把oracle的查询结果导出为insert语句优游的鱼 oracle python 数据库开发语言
可以使用cx_Oracle库在Python中连接Oracle数据库并执行查询。然后，可以使用pandas库将查询结果读取为DataFrame，并使用to_sql()方法将其导出为insert语句。示例代码如下：importcx_Oracleimportpandasaspd#ConnecttoOracledatabaseconn=cx_Oracle.connect('username/passwor
python画出roc曲线 auc计算逻辑_Python画ROC曲线和AUC值计算路过炊烟 python画出roc曲线 auc计算逻辑
前言ROC(ReceiverOperatingCharacteristic)曲线和AUC常被用来评价一个二值分类器(binaryclassifier)的优劣。这篇文章将先简单的介绍ROC和AUC，而后用实例演示如何python作出ROC曲线图以及计算AUC。AUC介绍AUC(AreaUnderCurve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大的容忍性，
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
记一次从mysql数据迁移到oralce （基于python和pandas） qq_36532060 mysql oracle pandas python
记一次从mysql数据迁移到oralce（基于python）前景提要具体实现创建数据库链接读取mysql数据写入orcale结语前景提要公司最近有个从mysql迁移数据到oracle的需求，于是进行了一下方案调研和分析，但作为一个之前从没接触过Oracle的人真的感到好难，但再难也难上，这篇文章主要是记录一下做这件事时遇到的坑以及分享一下最终的方案及代码。具体实现创建数据库链接其实我觉得这个算是最
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

python爬虫（6）——Selenium的使用

目录

下载安装Selenium

selenium元素定位

控制浏览器操作

控制浏览器窗口大小

控制浏览器前进后退

刷新页面

WebDriver常用方法

点击和输入

提交

其他方法

鼠标事件

键盘事件

获取断言信息

设置元素等待

显式等待

隐式等待

定位一组元素

多表单切换

多窗口切换

警告框

下拉列表框选择

文件上传

操作cookie

调用JavaScript代码

窗口截图

关闭浏览器

你可能感兴趣的:(#,python爬虫,python,python爬虫)