Python基础篇—Pandas应用(三)

为某行添加求和项

  • 导入数据:
import pandas as pd
data = pd.read_csv('data.txt')
data


Python基础篇—Pandas应用(三)_第1张图片

  • 添加总和栏显示wid、uid、fans的总和:
data['total'] = data['wid']+data1['uid']+data1['fans']
data


Python基础篇—Pandas应用(三)_第2张图片

  • 对各列进行汇总:
data['fans'].sum()
data['fans'].mean()
data['fans'].min()
data['fans'].max()

输出:

11
3.6666666666666665
1
6
  • 每列相加求和:
sum_row = data[['wid','uid','fans']].sum()
sum_row

输出:

wid       6
uid     141
fans     11
dtype: int64
  • 将总和值显示为表格中的单独一行:
data_sum = pd.DataFrame(sum_row).T#'.T':转置
data_sum

输出:


这里写图片描述

在此之前,需要添加丢失的列,即:添加全部的列,然后让pandas去添加所有缺失的数据:

data_sum = data_sum.reindex(columns=data.columns)
data_sum 

输出:


这里写图片描述

最后使用append把它加入到已有的内容中:

data_last = data.append(data_sum,ignore=True)
data_last

输出:


Python基础篇—Pandas应用(三)_第3张图片

注意到’total’列求和值为缺失值,如何加上呢?在求sum_row时加上’total’就可以了:

sum_row = data[['wid','uid','fans','total']].sum()

看:


Python基础篇—Pandas应用(三)_第4张图片

  • 把数据单位格式化为货币:
data_last.columns = ['Jan','Feb','Mar','Total']
data_last

输出:


Python基础篇—Pandas应用(三)_第5张图片

转化为货币:

def money(x):
    return "${:,.0f}".format(x)

formatted_data = data_last.applymap(money)
formatted_data

输出:


Python基础篇—Pandas应用(三)_第6张图片

你可能感兴趣的:(Pandas)