哈喽铁汁们这不马上要放年假了嘛,昨天我们公司收到放假安排的通知可高兴坏了!不知道你们又通知放假了没啊?是不是又得为春节抢票发愁了呢?别担心哦小编一想到这就马不停蹄的准备出这一期了
想领取更多完整源码跟Python学习资料可私信我或点击这行字体
当你想查询一下火车票信息的时候,还在为打开无响应的12306官网和广告n秒的APP吗而懊恼吗?那就教大家想做一个简单好用的查票系统
环境:
Python 3.6
Pycharm
模块
requests
pandas
json
模块在cmd里pip install +模块名 就可以安装好了
一. 这些数据内容是从哪里的?
通过开发者工具进行抓包分析, 分析具体的数据是从哪里的
可以通过用搜索 你想要数据内容, 会给你返回相应的数据
二. 代码实现步骤
确定需求 >>> 发送请求 >>> 获取数据 >>> 解析数据 >>> 保存数据
发送请求, 对于相应的数据包url地址发送请求
获取数据, 获取响应体json字典数据
解析数据, 直接通过键值对提取数据
数据展示
import requests # 数据请求模块 pip install requests
import pprint # 格式化输出的模块
import pandas as pd # pip install pandas
import json
f = open('city.json', mode='r', encoding='utf-8')
text = f.read()
city_json = json.loads(text)
# dit = dict(text)
# 字符串转字典 json
while True:
from_station = input('请输入出发的城市: ')
to_station = input('请输入目的城市: ')
# date = input('请输入查询时间(格式: 2021-09-10): ')
# print(city_json[from_station])
# print(city_json[to_station])
# print(type(city_json))
# 模块安装
# win + R 输入cmd pip install requests
# 发送请求
# url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2021-09-11&leftTicketDTO.from_station=CSQ&leftTicketDTO.to_station=LZZ&purpose_codes=ADULT'
url = 'https://kyfw.12306.cn/otn/leftTicket/query'
# 字典的形式 ? 非贪婪匹配
data = {
'leftTicketDTO.train_date': '2021-09-11',
'leftTicketDTO.from_station': city_json[from_station],
'leftTicketDTO.to_station': city_json[to_station],
'purpose_codes': 'ADULT',
}
# 请求头是什么? 作用是什么? 为什么要加
# 作用是什么 伪装浏览器 (把python代码伪装成浏览器对于发送请求)
# headers User-Agent: 浏览器基本信息
# Cookie 用户信息 host 域名 referer 防盗链
# 比如 笔趣阁 表情包网站 你都可以不加headers (对某些网站)
headers = {
'Cookie': '*',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
}
# 返回的是响应体对象 <> 表示对象 200[状态码]表示请求成功
# 请求参数 params: get请求传递的请求参数 data: post请求需要提交表单
response = requests.get(url=url, params=data, headers=headers)
response.encoding = response.apparent_encoding
# 如果服务器给我们返回的响应体数据 {} 完整的 可以直接获取json字典数据
# result = response.json()['data']['result']
# pprint.pprint(response.json())
# print(response.text)
# 解析数据 根据键值对进行取值 根据冒号左边的内容 提取冒号右边的内容
# json 和 字典 数据类型是一样的 json是一种数据存储的格式
result = response.json()['data']['result']
lis = []
for index in result[1:]:
# 字符串分割方法
index_list = index.replace('有', 'Yes').replace('无', 'No').split('|') # 返回的列表 可以根据索引位置提取内容
page = 0
Num = index_list[3] # 车次
time_1 = index_list[8] # 发车时间
time_2 = index_list[9] # 到达时间
prince_seat = index_list[32] # 特等座
first_class_seat = index_list[31] # 一等座
second_class = index_list[30] # 二等座
Wz = index_list[26] # 无座
Yz = index_list[29] # 硬座
Rw = index_list[23] # 软卧
Yw = index_list[28] # 硬卧
dit = {
'Num': Num,
'Start': time_1,
'End': time_2,
'Top':prince_seat,
'First':first_class_seat,
'Second':second_class,
'Wz': Wz,
'Yz': Yz,
'Rw': Rw,
'Yw': Yw,
}
lis.append(dit)
# print(dit)
pd.set_option('display.max_rows', None)
columns = ['Num', 'Start', 'End', 'Top', 'First', 'Second', 'Yz', 'Wz', 'Rw', 'Yw']
content = pd.DataFrame(lis, columns=columns)
print(content)
效果:
只要在命令行敲一行命令就能获得你想要的火车票信息!
Python版本:Python3
运行平台:Windows
IDE:PyCharm
浏览器:Chrome
本项目利用 python 实现对 12306 网站的爬取,并查询相应的时间、座次类型、剩余票数等,方便朋友们抢票。众所周知,12306是一个安全级别比较高的网站,要想爬去绝非易事,特别是对相应验证码的处理,足以让一般的 python 工程师望而却步了。今天,我们就来简单的爬取一下这个神奇的网站。
12306 官网(注:本项目所获取的信息全部为网上公开的可取信息)
首先,我们导入第三方库
import requests
之后,写一个函数
def check():
接下来就往函数里写程序吧!
我们先来获取网页信息
img01
首先,我们发送请求。
response =requests.get('https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-09-23&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT')
由于显示编码格式与原格式不同,导致无法正确的处理所获去的数据;于是我们先转换一下编码格式。
img02
#将显示编码与原编码格式统一
response.encoding = 'utf-8'
为方便接下来的数据处理,我们需将数据转换成字典格式
#转换成字典格式
result = response.json()
#这里通过调用控制台,找到相应数据,并一层层地追踪
return result['data']['result']
我们现在来编写序号
number= 0
#用split将数据进行切割,方便后续查找
for i in check():
tem_list = i.split('|')
接下来,我们得查看各个坐次所对应的序号了;可以在调试的时候输出查值
#查找各坐次
# for n in tem_list:
# print(nu,n)
# nu +=1
# nu =0
# print(i)
#注:以上内容只供调试使用
通过调试程序,我们找到相应信息的序号
#23 =软卧
#26 = 无座
#28 = 硬卧
#29 = 硬座
#30 = 一等座
#31 = 二等座
#32 = 商务座
最后,只需找到你需要买的座次就行了。
tem_list = i.split('|')
if tem_list[32] != '无' and tem_list[32] != '':
print(tem_list[3],'有票')
else:
print(tem_list[3],'无票')
到这就分享结束了!学会的铁汁可以自己试一试哟~记得给小编三连哦!家人们的支持是小编更新最大的动力
春节将近, 希望大家快乐的敲代码,抢票成功,开心回家!❤❤❤