python数据分析——numpy进阶

官方文档

1.如何将数据导入和导出csv文件

参考文章

1.1 np.genfromtxt函数

导入数据的标准方法是使用np.genfromtxt函数,它可以从web URLs导入数据,处理缺失值,多种分隔符,处理不规则的列数等功能。一个不太通用的版本是用np.loadtxt函数导入数据,它假设数据集无缺失值.

# 关闭数字的科学表示方法np.set_printoptions(suppress=True)
# 从url的csv文件导入数据path = 'https://raw.githubusercontent.com/selva86/datasets/master/Auto.csv'
# delimiter:分隔符
# skip_header:从多少行开始读数据,以0开始
# filling_values:缺失值表示
# dtype:数据类型
# data = np.genfromtxt(path, delimiter=',', skip_header=1, filling_values=-999, dtype='float')
# data[:3]  # 显示前3行数据

import numpy as np

path = 'https://raw.githubusercontent.com/selva86/datasets/master/Auto.csv'
data = np.genfromtxt(path,delimiter=',',skip_header=1,filling_values=-999,dtype='float')
print(data[:3])

若设置参数dtype为'object'或'None',np.genfromtxt在未设置占位符的前提下能同时处理具有数字和文本列的数据集. 

1.2 np.savetxt()函数

最后,'np.savetxt'将数据保存为csv文件:

# 保存数据为csv文件np.savetxt("out.csv", data, delimiter=",")

(待更新。。。。。)

你可能感兴趣的:(python数据分析,数据分析,数据挖掘,pandas)