python学习
题目要求:在本练习,我们会借助cookies的相关知识,使用Python登录饿了么网站,爬取自己家附近的餐厅列表。
网站地址:https://www.ele.me/home/
第一步,模拟手机号发送验证码
1。打开饿了吗登录界面,输入手机号,发送页面,打开network ,发现出现一个mobile_send_code 请求,这个就是发送验证码的请求,点开preview可以看见发送验证码成功后,返回了一个token,这个token 后期登录会用上
2.查看hearder,最下面有一些参数,mobile就是我们刚刚输入的手机的号码
3.编写发送验证码的代码,运行代码手机收到验证码,即为成功(注意饿了么如果手机多次发送验证码之后,就会需要用图形验证码验证,此时这个代码就会报错,所以一定要注意次数,不要验证码发送次数过多)
import requests
session = requests.session()
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
url_1 = 'https://h5.ele.me/restapi/eus/login/mobile_send_code'
tel = input('请输入手机号码:')
data_1 = {'captcha_hash':'',
'captcha_value':'',
'mobile':tel,
'scf':''}在这里插入代码片
第二步 登录饿了么
1.输入手机号,和验证码,点击登录后,出现一个新的请求login_by_mobile
2,划到最下面,查看这个请求的参数,可以看见moblie就是手机号,validate_code是验证码,validate_token,就是第一步中获取验证码返回的token;
3.编写登录的代码
url_2 = 'https://h5.ele.me/restapi/eus/login/login_by_mobile'
code = input('请输入手机验证码:')
data_2 = {'mobile':tel,
'scf':'ms',
'validate_code':code,
'validate_token':token}
session.post(url_2,headers=headers,data=data_2)
第三步:输入收货地址
1.点击登录之后,我们可以看见我们进入到这个页面,输入收货地址
2.输入一个收货地址,如贵州大学,出现了如下地址信息
3.发现左边出现一个serach 的请求,这个请求的参数key word是我们刚刚输入的收货地址,geohash是城市的代号,latitude,longitude分别是经纬度
4.点击preview ,出现刚刚搜索的与贵州大学相关的地址信息
5.、模拟输入地址,获取必要参数
address_url = 'https://www.ele.me/restapi/v2/pois?'
place = input('请输入你的收货地址:')
params = {'extras[]':'count','geohash':'ws105rz9smwm','keyword':place,'limit':'20','type':'nearby'}
# 这里使用了深圳的geohash
address_res = requests.get(address_url,params=params)
address_json = address_res.json()
print('以下,是与'+place+'相关的位置信息:\n')
n=0
for address in address_json:
print(str(n)+'. '+address['name']+':'+address['short_address']+'\n')
n = n+1
address_num = int(input('请输入您选择位置的序号:'))
final_address = address_json[address_num]
第四步:获取输入地址附近的餐厅列表
1.成功输入地址之后,转到主页面,会看见下面推荐了附近一些比较近的餐厅,用户点击network,查看请求,出现一个restaurant的请求,很明显这个请求就记录餐厅的信息
3.提取附近的餐厅信息
restaurants_url = 'https://www.ele.me/restapi/shopping/restaurants?'
# 使用带有餐馆列表的那个XHR地址。
params = {'extras[]':'activities',
'geohash':final_address['geohash'],
'latitude':final_address['latitude'],
'limit':'24',
'longitude':final_address['longitude'],
'offset':'0',
'terminal':'web'
}
# 将参数封装,其中geohash和经纬度,来自前面获取到的数据。
restaurants_res = session.get(restaurants_url,params=params)
# 发起请求,将响应的结果,赋值给restaurants_res
restaurants = restaurants_res.json()
# 把response对象,转为json。
for restaurant in restaurants:
# restsurants最外层是一个列表,它可被遍历。restaurant则是字典,里面包含了单个餐厅的所有信息。
print(restaurant['name'])
最后贴上完整代码
import requests
session = requests.session()
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
url_1 = 'https://h5.ele.me/restapi/eus/login/mobile_send_code'
tel = input('请输入手机号码:')
data_1 = {'captcha_hash':'',
'captcha_value':'',
'mobile':tel,
'scf':''}
token = session.post(url_1, headers=headers, data=data_1).json()['validate_token']
url_2 = 'https://h5.ele.me/restapi/eus/login/login_by_mobile'
code = input('请输入手机验证码:')
data_2 = {'mobile':tel,
'scf':'ms',
'validate_code':code,
'validate_token':token}
session.post(url_2,headers=headers,data=data_2)
address_url = 'https://www.ele.me/restapi/v2/pois?'
place = input('请输入你的收货地址:')
params = {'extras[]':'count','geohash':'ws105rz9smwm','keyword':place,'limit':'20','type':'nearby'}
# 这里使用了深圳的geohash
address_res = requests.get(address_url,params=params)
address_json = address_res.json()
print('以下,是与'+place+'相关的位置信息:\n')
n=0
for address in address_json:
print(str(n)+'. '+address['name']+':'+address['short_address']+'\n')
n = n+1
address_num = int(input('请输入您选择位置的序号:'))
final_address = address_json[address_num]
restaurants_url = 'https://www.ele.me/restapi/shopping/restaurants?'
# 使用带有餐馆列表的那个XHR地址。
params = {'extras[]':'activities',
'geohash':final_address['geohash'],
'latitude':final_address['latitude'],
'limit':'24',
'longitude':final_address['longitude'],
'offset':'0',
'terminal':'web'
}
# 将参数封装,其中geohash和经纬度,来自前面获取到的数据。
restaurants_res = session.get(restaurants_url,params=params)
# 发起请求,将响应的结果,赋值给restaurants_res
restaurants = restaurants_res.json()
# 把response对象,转为json。
for restaurant in restaurants:
# restsurants最外层是一个列表,它可被遍历。restaurant则是字典,里面包含了单个餐厅的所有信息。
print(restaurant['name'])