Pandas DataFrame.sum()函数用于返回用户所请求轴的值之和。如果输入值是索引轴, 则它将在列中添加所有值, 并且对所有列都相同。它返回一个序列, 其中包含每一列中所有值的总和。
在计算DataFrame中的总和时, 它还能够跳过DataFrame中的缺失值。
句法:
DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs)
参数
轴:{索引(0), 列(1)}
0或’index’用于行, 而1或’columns’用于列。
skipna:布尔值, 默认为True
它用于排除所有空值。
级别:整数或级别名称, 默认为无
如果轴是多索引, 则它沿特定级别计数并折叠为一个系列。
numeric_only:布尔值, 默认值无
它仅包含int, float和boolean列。如果为None, 它将尝试使用所有内容, 因此应使用数字数据。
min_count:整数, 默认值0
它是指执行任何操作所需的有效值数量。如果小于min_count个非NA值, 则结果为NaN。
** kwargs:这是一个可选参数, 将传递给函数。
返回值:
如果指定级别, 则返回Series或DataFrame的总和。
范例1:
import pandas as pd
# default min_count = 0
pd.Series([]).sum()
# Passed min_count = 1, then sum of an empty series will be NaN
pd.Series([]).sum(min_count = 1)
输出
0.0
nan
范例2:
import pandas as pd
# making a dict of list
info = {'Name': ['Parker', 'Smith', 'William'], 'age' : [32, 28, 39]}
data = pd.DataFrame(info)
# sum of all salary stored in 'total'
data['total'] = data['age'].sum()
print(data)
输出
Name age total
0 Parker 32 99
1 Smith 28 99
2 William 39 99