利用Python进行数据分析 - 第四章 numpy基础:数组和矢量计算

标签: 读书笔记 python 数据分析


1. 创建ndarray(多维数组对象)

函数 说明
array 将参数数据(列表,元祖,数组等序列类型)转换为ndarray,可指定dtype
arange 类似range,但返回的是一个ndarray而不是列表
ones 根据指定的形状和dtype创建一个全1数组
ones_like 以另一个数组为参数,根据其形状和dtype创建一个全1数组
zeors,zeros_like 全0数组
empty,empty_like 创建新数组,只分配内存空间但不填充任何值
eye,identity 创建一个正方的N*N单位矩阵(对角线为1,其余为0)
astype(type) 数组转换为dtype为type的数组
In: import numpy as np
#array
In: np.array([[1,2,3],[4,5,6]])
Out: 
array([[1,2,3],
       [4,5,6]])
In: np.array([1,2,3],dtype=np.int32)
Out: array([1,2,3])
#arange
In: np.arange(3)
Out: array([0,1,2])
#ones
In: np.ones((2,3))
Out:
array([[1,1,1],
       [1,1,1]])

2. 数组和标量之间的运算

  • 大小相等的数组之间的算数运算会将运算应用的元素级,各个相同位置的元素进行各自运算
  • 数组与标量的算术运算会将标量值传播到各个元素进行运算

3. 基本的索引和切片

  • 按索引访问元素
In: arr = arange(10)
In: arr
Out: array([0,1,2,3,4,5,6,7,8,9])
In: arr[5]
Out: 5
In: arr[5:8]
Out: array([5,6,7])
#将一个标量值赋值给一个切片时,该值会自动传播(广播)到整个选区
In: arr[5:8] = 12
In: arr
Out: array([0,1,2,3,4,12,12,12,8,9])
In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
In: arr2d[2,2]
Out: 9
In: arr2d[2]
Out: array([7,8,9])
  • 与python普通列表切片的区别:普通列表的切片是列表切片部分的复制;数组切片是原始数组部分的引用(考虑到大数据量数组的性能问题),即切片上的任何修改都会直接反映到源数组上。
In: arr1 = arr[5:8]
In: arr1
Out: array([0,1,2,3,4,12,12,12,8,9])
In: arr1[1] = 12345
In: arr
Out: array([0,1,2,3,4,12,12345,12,8,9])
  • 如果需要数组切片的副本而非引用,需要显示进行复制操作 arr2 = arr[5:8].copy()
  • 多维数组切片
In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
#从第一个轴切片
In: arr2d[:2]
Out: 
array([[1,2,3],
       [4,5,6]])
#一次从多个轴切片
In: arr2d[1:2,1:]
Out:
array([[5,6]])
#某一个轴直接用索引,得到的结果数组的维度将降低一维
In: arr2d[1,:2]
Out:
arrary([4,5])
#只有冒号,表示选取整个轴
In: arr2d[:,:1]
Out:
array([[1],
       [4],
       [7]])
#对切片的赋值会传播到整个切片区域
In: arr2d[:2,1:] = 0
In: arr2d
Out:
array([[1,0,0],
       [4,0,0],
       [7,8,9]])
  • 通用函数

待续...

你可能感兴趣的:(利用Python进行数据分析 - 第四章 numpy基础:数组和矢量计算)