数据分析

cvs文件:read_csv() 读取以‘,’分割的文件到DataFrame
txt文件:read_table()读取以‘/t’分割的文件到DataFrame
实质上是通用的,在实际使用中可以通过对sep参数的控制来对任何文本文件读取。

 

df.shape

df.head()

数据处理三剑客:df.isnull().sum(), info(), describle()

df.fillna()

df.dropna()

时序df[''].shift(-2)移位

 

标准化:X = preprocessing.scale(X)
 

zip打包数字和标签成字典。机器学习中object必须转化成数字类型,才能应用。

 

train_test_split将数据拆分成训练和测试集

 

shift+tab显示函数的官方文档

 

.plot(kind='box')箱型图

你可能感兴趣的:(数据分析)