NumPy（4）数组数学操作与复制、排序

保留初心，砥砺前行

NumPy官方网站

NumPy Tutorial

先定义两个NumPy array

A = np.array([[1, 2, 3],
              [2, 3, 4]]).astype(np.float32)
B = np.array([[2, 3, 4],
              [3, 4, 5]]).astype(np.float32)

算数运算：

Subtraction

print A - B
print np.subtract(A, B)

[[-1. -1. -1.]
 [-1. -1. -1.]]
[[-1. -1. -1.]
 [-1. -1. -1.]]

Addition

print A + B
print np.add(A, B)

[[ 3.  5.  7.]
 [ 5.  7.  9.]]
[[ 3.  5.  7.]
 [ 5.  7.  9.]]

Division

print A / B
print np.divide(A, B)

[[ 0.5         0.66666669  0.75      ]
 [ 0.66666669  0.75        0.80000001]]
[[ 0.5         0.66666669  0.75      ]
 [ 0.66666669  0.75        0.80000001]]

Multiplication，只是对应的元素相乘，并不是真正的矩阵乘法

print A * B
print np.multiply(A, B)

[[  2.   6.  12.]
 [  6.  12.  20.]]
[[  2.   6.  12.]
 [  6.  12.  20.]]

dot product 点积，这是真正的矩阵乘法，与上边的操作相对应

print np.dot(A, np.transpose(B))
print np.transpose(B)

[[ 20.  26.]
 [ 29.  38.]]
[[ 2.  3.]
 [ 3.  4.]
 [ 4.  5.]]

把每个元素n_ij变成以e为底，n_ij为指数的形式——e^n_ij

print np.exp(A)

[[  2.71828175   7.38905621  20.08553696]
 [  7.38905621  20.08553696  54.59814835]]

把每个元素开方

print np.sqrt(A)

[[ 1.          1.41421354  1.73205078]
 [ 1.41421354  1.73205078  2.        ]]

比较：

两个矩阵之间的对应元素大小的比较

print A == B
print A < B
print A < 3

[[False False False]
 [False False False]]
[[ True  True  True]
 [ True  True  True]]
[[ True  True False]
 [ True False False]]

两个矩阵在矩阵层面的比较

print np.array_equal(A, B)

False

聚合函数：

这里包含求所有元素（或按照行或列划分的）和，所有元素（或按照行或列划分的）中的最大最小值，元素累加，平均数，中位数，相关系数，标准差等。

关于相关系数：相关表和相关图可反映两个变量之间的相互关系及其相关方向，但无法确切地表明两个变量之间相关的程度。于是，著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。

```

print np.min(A) #A中的最小值
print np.sum(A), np.sum(A, axis=1) #A所有元素求和，横轴元素求和
print np.max(A, axis=1) #每一个横轴的最大值
print np.cumsum(A), np.cumsum(A, axis=1) #按元素累加，每一个横轴按元素累加
print np.mean(A) #求所有元素的平均值
print np.median(A) #中位数
print np.corrcoef(A) #相关系数
print np.std(A) #标准差

其中，np.cumsum累加可能不是很清晰，看下边的例子：

print np.cumsum(A), np.cumsum(A, axis=1)
[ 1. 3. 6. 8. 11. 15.] [[ 1. 3. 6.]
[ 2. 5. 9.]]

可以看出np.cumsum(A)的每一个元素是A中这个位置的元素（包括自身）累加到第一个元素的值。


- ###排序：
np.sort()
Return a sorted copy of an array.
>`Parameters:   `
***a*** : array_like
Array to be sorted.
**axis **: int or None, optional
Axis along which to sort. If None, the array is flattened before sorting. The default is -1, which sorts along the last axis.
**kind** : {‘quicksort’, ‘mergesort’, ‘heapsort’}, optional
Sorting algorithm. Default is ‘quicksort’.
**order** : str or list of str, optional
`Returns:   `
**sorted_array** : ndarray
Array of the same type and shape as *a*.

    ```
C = np.array([1,3,5,2,34,5,6,3,5,8])                                          
print np.sort(C)

 [1  2  3  3  5  5  5  6  8 34]```
- ###复制：
####copy
首先需要注意的是，B = A并不意味着copy了一个与A相同的array并赋值给B，而是B也指向了A指向的那个array，如果此时对A进行操作，则B也会产生同样的变化，因为它们本来就是同一个array。

C = np.array([1, 2, 3, 4, 6])
D = C.copy()

这是deep copy ，可以看做是真正的copy，如上代码所示，将C中的内容复制到D中，C与D虽然内容完全一样，但是是两个array。
####view
>Different array objects can share the same data. The view method creates a new array object that looks at the same data.

    事实上，没有任何数据类型是固定的，主要取决于如何看待这片数据的内存区域。
在numpy.ndarray.view中，提供对内存区域不同的切割方式，来完成数据类型的转换，而无须要对数据进行额外的copy，来节约内存空间。
我自己的理解是，view生成的array和被view的array的data实际上指向的是同一块内存，也就是相同的一块数据。不同点在于view可以表示成不同的shape或type。这样比copy节省内存。
接下来看示例就可以明白个大概。

C = np.array([1, 2, 3, 4, 6])
D = C.view()
print D is C
print D.base is C
False
True

C = np.array([1, 2, 3, 4, 6])
D = C.view(np.float32)
print C
print D

[1 2 3 4 6]
[ 1.40129846e-45 0.00000000e+00 2.80259693e-45 0.00000000e+00
4.20389539e-45 0.00000000e+00 5.60519386e-45 0.00000000e+00
8.40779079e-45 0.00000000e+00]

他们其实共享的是同一个内存中的同一个数据，只是表示出来的type不同而已。

C = np.array([1, 2, 3, 4, 6])
D = C.view()
C[0] = 3
print C
print D

[3 2 3 4 6]
[3 2 3 4 6]

当array C中的某个元素变化，可以看到array D中的相应元素也发生了变化。

好了，以上就是今天的全部内容了，欢迎讨论指正。

>[相关链接：NumPy（1）简介，基础属性，数组创建（ones，zeros，empty，arange，linespace）](http://www.jianshu.com/p/5472800d7c36)
>[相关链接：NumPy（2）reshape，dot，flat](http://www.jianshu.com/p/949b1f8750a9)
>[相关链接：NumPy（3）full，eye，empty，random](http://www.jianshu.com/p/973bceed75c5)

NumPy（4）数组数学操作与复制、排序

保留初心，砥砺前行

算数运算：

比较：

聚合函数：

你可能感兴趣的:(NumPy（4）数组数学操作与复制、排序)