python下selenium如何处理日期控件的几种方法

1. 背景介绍

  • 我们在使用selenium爬取数据时,有时会需要选择日期,来获取某个时间段的数据。但是网上的日期控件还真是五花八门,有正常一点的:
  • 淘宝联盟上的python下selenium如何处理日期控件的几种方法_第1张图片
  • 有这样的:
    python下selenium如何处理日期控件的几种方法_第2张图片
  • 当然还有这样的:
    python下selenium如何处理日期控件的几种方法_第3张图片
  • 简单点的,我们还可以模拟鼠标点击,拖动的方式。但是复杂点的,那就完蛋了,该怎么办呢?
  • 其实很简单,不管我们是通过什么方式选的,最终往服务器上发送的都是我们选定的日期数据,那么我们就不用去搞什么时间日期控件了,好好研究一下,我们手动选择的日期数据,是存储在页面的哪个位置,又是如何发送给服务器的,那就简单了。
  • 可喜的是,大部分的日期控件,我们都可以把它当成一个普通的input框处理,对value进行赋值操作。
    python下selenium如何处理日期控件的几种方法_第4张图片
  • 也有一些类型的input框都是禁止手动输入的,那就用js代码把禁止输入的readonly属性去掉就好。

2. 代码示例

# -*- coding: utf-8 -*-

from selenium import webdriver
from time import sleep

driver = webdriver.Firefox()
driver.get('http://www.sucaijiayuan.com/api/demo.php?url=/demo/20141108-1/')

driver.switch_to.frame('iframe')

# 介绍4中操作方法
# js = "document.getElementById('txtBeginDate').removeAttribute('readonly')"  # 1.原生js,移除属性
# js = "$('input[id=txtBeginDate]').removeAttr('readonly')"  # 2.jQuery,移除属性
# js = "$('input[id=txtBeginDate]').attr('readonly',false)"  # 3.jQuery,设置为false
js = "$('input[id=txtBeginDate]').attr('readonly','')"  # 4.jQuery,设置为空(同3)

driver.execute_script(js)
driver.find_element_by_id('txtBeginDate').send_keys('2016-08-24')
sleep(2)
print(driver.find_element_by_id('txtBeginDate').get_attribute('value'))
driver.quit()
  • 如同验证码一样,有点击位置等各种奇怪的验证码,你去选的话很麻烦,想办法绕过去才是真理。

你可能感兴趣的:(selenium,python爬虫)