【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次

文章目录

  • 一、项目背景
  • 二、页面查找
    • 1、查询条件
    • 2、定位有二等座的元素
    • 3、定位有二等座的车次信息
    • 4、Ctrl+F检验xpath查找的车次
  • 三、代码实现

一、项目背景

工具: python+pycharm+selenium
12306网址: https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc
出发地: 南京
目的地: 上海
发车日期: 当天日期的第二天
发车时间: 06:00–12:00
目的: 打印所有二等座有座的车次

二、页面查找

1、查询条件

【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次_第1张图片

2、定位有二等座的元素

【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次_第2张图片
id="queryLeftTable"标签下的第4个td标签下的符合class=yes的元素,xpath://*[@id="queryLeftTable"]//td[4][@class="yes"]

3、定位有二等座的车次信息

【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次_第3张图片
位于第2步中元素的上一级tr标签下的第1个td标签下的a标签内,xpath://*[@id="queryLeftTable"]//td[4][@class="yes"]/../td[1]//a

4、Ctrl+F检验xpath查找的车次

【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次_第4张图片
查找成功,二等座有座的车次数量为30。

三、代码实现

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.select import Select

driver = webdriver.Chrome()
driver.implicitly_wait(10)
driver.get("https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc")
# 需点击出发地输入框再进行输入
ele = driver.find_element(By.ID,"fromStationText")
ele.click()
# 输入出发地(需要按回车键确定)
ele.send_keys("南京\n")

# 需点击目的地输入框再进行输入
ele1 = driver.find_element(By.ID,"toStationText")
ele1.click()
# 输入目的地(需要按回车键确定)
ele1.send_keys("上海\n")

# 选择发车时段
select = Select(driver.find_element(By.ID,"cc_start_time"))
select.select_by_visible_text("06:00--12:00")

# 选择发车时间-当前日期第二天
driver.find_element(By.XPATH,'//*[@id="date_range"]//li[2]').click()

# 选取二等座有座的车次信息
trains = ele2 = driver.find_elements(By.XPATH,'//*[@id="queryLeftTable"]//td[4][@class="yes"]/../td[1]//a')

# 输出二等座有座的车次数量
print("二等座有座的车次数量为:")
print(len(trains))

# 输出二等座有座的车次
print("二等座有座的车次分别为:")
for train in trains:
    print(train.text)
driver.quit()

运行结果如下:
【Python】selenium项目实战:从12306网站获取特定时间段二等座有票的车次_第5张图片
二等座有座的车次数量和车次信息符合页面查找结果,至此完成该项目。

你可能感兴趣的:(python,selenium,开发语言,爬虫)