机器学习-采用Pandas数据导入

通过Pandas来导入CSV文件要使用pandas.read_csv()函数。这个函数返回值是DataFrame,可以很方便进行下一步的处理。在机器学习项目中,经常用Pandas来做数据清洗与数据准备工作。常使用这种方法。代码如下:

#!/user/bin/python
# -* - coding:UTF-8 -*-
from pandas import read_csv
#使用Pandas导入CSV数据
filename = 'pima_data.csv'
names = ['preg','plas','pres','skin','test', 'mass','pedi','age','class']

查看数据:
peek = data.head(10)
print peek
数据维度:

1.数据的行会导致花费大量的时间来训练算法得到模型;太少的数据会导致对算法的训练不充分,得到不合适的模型

2.如果数据具有太多的特征,会引起某些算法性能低下的问题。

data = read_csv(filename,names=names)
print data.shape
数据属性和类型:
print data.dtypes






你可能感兴趣的:(机器学习,python,机器学习)