Python获取中国日历2022版

近期又遇到了要做排班的事情,需要标记哪些日期是法定节假日,本来想着把以前的记录拿来抄作业,怎奈到了2022年已然不是那个2020年的它了。

接下来,放上2022年版本的日历获取方法。
今年的接口已经变成了:https://sp1.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?tn=wisetpl&format=json&resource_id=39043&query=2022%E5%B9%B41%E6%9C%88&t=1642579711570&cb=op_aladdin_callback1642579711570

然后获取的结果也只有上月、当月、下月,且对节假日的标记字段(status)有的月份没有,所以处理方式有所变化,最终标记的是否节假日仅做了较少的抽样验证,严格来说需要使用者自己再进行验证后使用。
以下是全部代码:


# -*- coding: utf-8 -*-
"""
Created on Wed Jan 19 16:10:13 2022

@author: shanlin
"""

import pandas as pd
import requests
import json
import numpy as np
import re

# 生成某一年的日历
def gen_calendar2022(year=2022):
    df=pd.DataFrame()
    # 获取法定节假日
    up1='https://sp1.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?tn=wisetpl&format=json&resource_id=39043&query='
    up2='月&t=1642579711570&cb=op_aladdin_callback1642579711570'
    # 2022年接口已经改为按月获取数据,因此循环12个月获取每月数据
    for i in range(1,13):
        url="".join([up1,str(year),"年",str(i),up2])
        print(url)
        r=requests.get(url)
        rtxt=re.split("[()]", r.text)[1]
        r_json=json.loads(rtxt)
        each_d1=pd.DataFrame(r_json['data'])
        each_d2=pd.DataFrame(each_d1['almanac'][0])
        ## 筛选当月数据,数据中year\month\day是公立日期,数据会返回3个月的数据
        each_d3=each_d2[each_d2['month']==str(i)]
        # ## 由于12月的数据没有status字段(可能是下一年一月放假规定没出来,所以这里进行特殊处理)--结论应该是某些月份没有节假日就没有status字段,所以后面专门针对status进行处理
        # if i==11:
        #     each_d3=each_d2[each_d2['month']>=str(i)]
        # else:
        #     each_d3=each_d2[each_d2['month']==str(i)]
        ## 组合真的日期,并标记节假日情况
        each_d3['公历日期']=pd.to_datetime(each_d3['year']+"/"+each_d3['month']+"/"+each_d3['day'])
        each_d3['周几']=each_d3['公历日期'].dt.dayofweek+1
        ## 标记是否节假日(即当天是否是法定放假),其中status中的1表示放假,2表示上班,注意需要处理有没有status列的情况
        ## 有status的情况
        if "status" in each_d3.columns:
            each_d3['status'].fillna(0,inplace=True)
            each_d3['status']=each_d3['status'].astype('int',errors='ignore')
            ## 按周几把周末标记成1,周一至周五标记成0,然后通过标记和status的值相加,结果为1和2的就是假期
            judge=np.where(each_d3['周几']<6,0,1)+each_d3['status']
            each_d3['是否节假日']=np.where((judge==1) | (judge==2),"Y","N")
            df=df.append(each_d3)
            # each_d3.to_csv("百度日历.csv",index=False)
        ## 没有status的情况,直接按周末为节假日
        else:
            each_d3['是否节假日']=np.where(each_d3['周几']>=6,"Y","N")
            df=df.append(each_d3)
    # 重命名列
    df.rename(columns={'animal':'生肖','avoid':'忌','cnDay':'中文星期','day':'日','gzDate':'干支日','gzMonth':'干支月','gzYear':'干支年','isBigMonth':'是否为阴历大月','lDate':'中文阴历日','lMonth':'中文阴历月','lunarDate':'数字阴历日','lunarMonth':'数字阴历月','lunarYear':'数字阴历年','month':'月','oDate':'阳历当天0点','suit':'宜','term':'节气节日','type':'各种与节日有关的类型','value':'各种日','year':'年','desc':'一种节日','status':'1休假2上班'},
              inplace=True)
    return df


if __name__=="__main__":
    df=pd.DataFrame()
    for year in range(2010,2023):
    # 注意2010年的元旦当天并未被百度标记为假日,所以当年的数据可能是错误的
    # year=2022
        each_df=gen_calendar2022(year)
        df=df.append(each_df)
    df.to_csv('{}年节日历表.csv'.format(year),index=False)

以下还是懒人入口,放了2010-2022年的数据(不过2010年元旦百度并未标记为假日,所以这一年的是否节假日数据可能是错的):

地址: 
https://pan.baidu.com/s/1lKTlbFGSCQYt5FczXRgI8A?pwd=h44c 
提取码: h44c 
日历表内容

你可能感兴趣的:(Python获取中国日历2022版)