Python数据分析与展示 第一章 Numpy数据存取和函数

数据的CSV文件存取

CSV(Comma-Separated Value,逗号分隔值)

CSV是一种常见的文件格式,用来存储批量数据

Python数据分析与展示 第一章 Numpy数据存取和函数_第1张图片

np.savetxt(...) 

np.savetxt(frame, array, fmt='%.18e', delimiter=None)
  • frame:文件、字符串或产生器,可以是 .gz 或 .bz2 的压缩文件;
  • array:存入文件的数组;
  • fmt:写入文件的格式,例如:%d     %.2f     %.18e
  • delimiter:分隔字符串,默认是任何空格

Python数据分析与展示 第一章 Numpy数据存取和函数_第2张图片

np.loadtxt(...) 

np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
  • frame:文件、字符串或产生器,可以是 .gz 或 .bz2 的压缩文件;
  • dtype:数据类型,可选;
  • delimiter:分割字符串,默认是任何空格;
  • unpack:如果True,读入属性将分别写入不同变量。

Python数据分析与展示 第一章 Numpy数据存取和函数_第3张图片

CSV文件的局限性

CSV只能有效存储一维和二维数组

np.savetxt()和 np.loadtxt() 只能有效存取一维和二维数组

多维数据的存取

a.tofile(...)

a.tofile(frame, sep='', format='%s')
  • frame:文件、字符串;
  • sep:数据分割字符串,如果是空串,写入文件为二进制;
  • format:写入数据的格式。

Python数据分析与展示 第一章 Numpy数据存取和函数_第4张图片

np.fromfile(...)

np.fromfile(frame, dtype=float, count=-1, sep='')
  • frame:文件、字符串
  • dtype:读取的数据类型
  • count:读入元素个数,“-1”表示读入整个文件
  • sep:数据分割字符串,如果是空串,写入文件为二进制。

Python数据分析与展示 第一章 Numpy数据存取和函数_第5张图片

 注意:

np.tofile()和 np.fromfile() 读取时需要知道存入文件时数组的维度和元素类型

这两个函数需要配合使用,可以通过元数据文件来存储额外信息

Numpy的便捷文件存取

np.save(fname, array) 或 np.savez(fname, array)

  • fname:文件名,以 .npy 为扩展名,压缩扩展名为 .npz
  • array:数组变量

np.load(fname)

  • fname:文件名,以 .npy 为扩展名,压缩扩展名为 .npz

Numpy的随机数函数

随机数函数子库

  • np.random.rand()
  • np.random.randn()
  • np.random.randint()

np.random的随机数函数

函数 说明
rand(d0, d1, ... , dn) 根据 d0~dn 创建随机数数组,浮点数,[0, 1), 均匀分布
randn(d0, d1, ..., dn) 根据 d0~dn 创建随机数数组,标准正太分布
randint(low[,high, shape]) 根据 shape 创建随机整数 或 整数数组,范围是 [low, high)
seed(s) 随机数种子,s 是给定的种子值

NumPy 的统计函数

 直接提供的统计类函数:

  • np.std()
  • np.var()
  • np.average()
函数 说明
sum(a, axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组
mean(a, axis=None) 根据给定轴axis计算数组a相关元素的期望,axis整数或元组
average(a, axis=None, weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a, axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a, axis=None) 根据给定轴axis计算数组a相关元素的方差

你可能感兴趣的:(Python,数据分析,python)