数据分析与挖掘——学习笔记

版本:python3.6

正在学习python,然后尝试数据分析。

pandas模块:

import pandas
c = './learn.xlsx'  # 导入Excel表格
b = pandas.read_excel(c,index_col='日期')  # 以日期作为索引列
print(len(b)) # 打印所有的数据记录
print(b.describe())  # 查看数据的情况

Excel表如下:

数据分析与挖掘——学习笔记_第1张图片

代码输出如下:

5                       # 代表数据的总条数
               身高   
count    4.000000        # count 表示有效数据,缺失了5.12那天的。
mean   151.750000        # 平均值
std      1.707825        # 标准差
min    150.000000        # 最小值
25%    150.750000        # 分位数
50%    151.500000
75%    152.500000
max    154.000000   

————————————————————————

使用下面语句截取数据:

a = b[(b['身高']>151)] # 取出身高大于151的数据
d = a.describe()
d.loc['range'] = d.loc['max'] - d.loc['min']  # 使用这个语句增加range输出
print(d)

代码输出如下:

               身高
count    2.000000
mean   153.000000
std      1.414214
min    152.000000
25%    152.500000
50%    153.000000
75%    153.500000
max    154.000000
range    2.000000

not end


你可能感兴趣的:(studying,数据分析挖掘学习)