pandas学习:第一次作业

文章目录

  • 第一次作业
  • 一、企业收入的多样性
  • 总结


第一次作业

import pandas as pd
import numpy as np

一、企业收入的多样性

df_company = pd.read_csv("company.csv")
df_company_data = pd.read_csv("company_data.csv")
df_company_data['证券代码'] = df_company_data["证券代码"].map(lambda x:("#"+"0"*(6-len(str(x)))+str(x)))
df_company_data['日期']= df_company_data["日期"].str[:4].astype("int64")
df = df_company.merge(df_company_data,on=["证券代码","日期"],how="left")
def shangzhi(x):
    if x.any():
        pi = abs(x)/abs(x).sum()
        return -(pi*np.log2(pi)).sum()
    else:
        return np.nan
df1 = df.groupby(['证券代码','日期'])['收入额'].apply(shangzhi).reset_index()
df1.rename(columns={
     '收入额':'收入熵指标'},inplace=True)

pandas学习:第一次作业_第1张图片

总结

加油,明天努力把其他题给补全

你可能感兴趣的:(pandas,数据分析)