python实用小代码(数据分析向)

一、python实现31省市名称替换

        首先定义了一个字典province_dict,其中包含每个省市的无缩写名称与其标准名称之间的映射。然后,我们使用map()函数将每个省市名称从无缩写名称转换为标准名称,并将结果存储在新列省市标准名称中。

province_dict = {'北京': '北京市', '天津': '天津市', '河北': '河北省', '山西': '山西省', '内蒙古': '内蒙古自治区', 
                 '辽宁': '辽宁省', '吉林': '吉林省', '黑龙江': '黑龙江省', '上海': '上海市', '江苏': '江苏省',
                 '浙江': '浙江省', '安徽': '安徽省', '福建': '福建省', '江西': '江西省', '山东': '山东省',
                 '河南': '河南省', '湖北': '湖北省', '湖南': '湖南省', '广东': '广东省', '广西': '广西壮族自治区',
                 '海南': '海南省', '重庆': '重庆市', '四川': '四川省', '贵州': '贵州省', '云南': '云南省',
                 '西藏': '西藏自治区', '陕西': '陕西省', '甘肃': '甘肃省', '青海': '青海省', '宁夏': '宁夏回族自治区',
                 '新疆': '新疆维吾尔自治区'}

# 将省市名称映射到标准名称
df['省市标准名称'] = df['省市名称'].map(province_dict)

# 输出结果
print(df)

二、将数据框转化为面板数据

import pandas as pd

# 假设原始数据框名为df,其中省份列为'Province',年份列标签为2014-2022
# 其他列为对应的企业数据

# 使用melt函数转换为面板数据
panel_data = pd.melt(df, id_vars=['Province'], var_name='Year', value_name='Data')

# 输出转换后的面板数据
print(panel_data)

三、将数据进行分类的(以区域划分为列子)

# 按照地区进行分类
def get_region_category(x):
    if x in ['北京', '天津', '河北', '山西', '内蒙古']:
        return "华北"
    elif x in ['上海', '江苏', '浙江', '安徽', '福建', '江西', '山东']:
        return "华东"
    elif x in ['辽宁', '吉林', '黑龙江']:
        return "东北"
    elif x in ['广东', '广西', '海南']:
        return "华南"
    elif x in ['湖北', '湖南', '河南']:
        return "华中"
    elif x in ['四川', '贵州', '云南', '重庆', '西藏']:
        return "西南"
    elif x in ['陕西', '甘肃', '青海', '宁夏', '新疆']:
        return "西北"
    else:
        return "其他"
        print('请检查')

data['地区'] = data['省市名'].apply(get_region_category)

四、绘图调整图例,并设置表格的图线

# 添加图例,图例放在图像下方的中间位置,分两行显示,并调整图例字体大小。
plt.subplots_adjust(bottom=0.2)
legend1 = ax1.legend(loc='lower center', bbox_to_anchor=(0.5, -0.25), ncol=3, frameon=False)
plt.setp(legend1.get_texts(), fontsize='12')
# 添加第二个图例
legend2 = ax2.legend(loc='lower center', bbox_to_anchor=(0.5, -0.26), ncol=4, frameon=False)
plt.setp(legend2.get_texts(), fontsize='12')
#设置图线
ax1.spines['top'].set_visible(False)
ax2.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax2.spines['right'].set_visible(False)

你可能感兴趣的:(统计与数据分析素养max,python,学术写作)