皮卡丘的学习生涯

Python之NumPy使用

欢迎关注

微信公众号：想进化的猿

头条号：python进阶者

一、NumPy基本概念

NumPy是Python的一种开源数值计算扩展，是一种用Python实现的科学计算工具包，可用来存储和处理大型矩阵。Numpy提供的内容包括以下几部分：

1、一个强大的N维数组对象Array，也就是ndarray；

2、较为成熟的函数库；

3、用于整合C/C++和Fortran代码的工具包；

4、实用的线性代数、傅里叶变换和随机数生成函数。

NumPy是一个运行速度非常快的数学库，它的主要功能就是数组计算。NumPy配合SciPy（高级科学计算库）、Matplotlib（绘图工具库）一起使用可组成强大的科学计算环境，可用于代替MatLab的功能，并且有助于我们通过Python学习数据科学和机器学习。

关于NumPy的安装和系统学习可参考NumPy中文文档：https://www.numpy.org.cn。

二、NumPy基础数据结构

NumPy数组（即ndarray，以下统一用ndarray表示）是一个多维数组对象，它由两部分组成，包括：1、实际的数据。2、描述数据的元数据。

NumPy数组的创建

NumPy创建数组最基本的方法是将序列传递给NumPy的array()函数，参数可以是列表、元组等，基本用法如下：

import numpy as np

arr1 = np.array([0, 1, 2, 3, 4])
arr2 = np.array((0, 1, 2, 3, 4))
print([0, 1, 2, 3, 4])
print((0, 1, 2, 3, 4))
print(arr1)
print(arr2)

以上代码分别给array()函数传入一个列表和元组，生成的ndarray是一样的。作为对比，我们把源列表和元组也打印出来，运行结果如下图所示。从打印结果可以看出，Python的列表和元组数据间用逗号隔开，而ndarray的数据之间用空格隔开。

ndarray还可以通过NumPy的arange()函数创建。arange()函数创建的是一个等差数组，它非常类似Python自身的range()函数，两者的区别仅仅在于返回值，arange()函数返回的是一个ndarray，而range()函数返回的是list。下面我们看一下arange()函数创建ndarray的基本用法。

import numpy as np

arr1 = np.arange(5)
arr2 = np.arange(1, 5)
arr3 = np.arange(1, 10, 2)

print(arr1)
print(arr2)
print(arr3)

我们通过给arange()函数传入不同个数的参数分别创建了三个ndarray。arr1传入一个参数5，表示创建0~4共5个数的ndarray；arr2传入两个参数1，5，表示创建1~4的ndarray，arange与range一样，是不包括大数的，所以不能取到5；arr3传入3个参数，前两个参数表示数据范围1~9的整数，第三参数2表示以2为一个跨度，即取1，3，5，7，9这5个数为ndarray数据。运行结果如下所示。

熟悉Matlab的朋友都知道linspace是一个均分计算指令，NumPy中也有linspace()函数，作用与Matlab中的linspace一致，它也可以用来创建ndarray。

import numpy as np

arr1 = np.linspace(1, 10, 4)
arr2 = np.linspace(1, 10, 4, endpoint=False)
arr3 = np.linspace(1, 10, 4, retstep=True)

print(arr1)
print(arr2)
print(arr3)

运行结果如下，1~10区间4等分后的数据组成ndarray，且数据为浮点型。linspace中的endpoint参数表示是否包含最后一个值，这里是10，默认为True包含，设为False就不包含了；retstep参数表示是否返回步长，默认为False不包含，设为Ture返回一个元组，包括一个ndarray和一个步长值。

以上我们创建的都是一维的ndarray，接下来我们创建几个多维的ndarray，基本创建方法如下。

import numpy as np

arr1 = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]])
arr2 = np.arange(1, 5).reshape(2, 2)
arr3 = np.arange(1, 12, 2).reshape(2, 3)

print(arr1)
print(arr2)
print(arr3)

reshape()函数可以重新调整矩阵的行数、列数、维数，利用reshape()可以将一维ndarray调整为多维的ndarray。运行结果如下。

通过array()函数想利用多维数组为参数来创建ndarray时，如果传入的多维数组个数不一样，NumPy不会报错，但不会如愿生成多维ndarray，而是会生成一维ndarray。当传入的多维数组中其中有字符串时，生成的多维ndarray就会自动转化成字符串类型，我们看一下效果。

import numpy as np

arr1 = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8]])
arr2 = np.array([[0, 1, 2, 3, 4], ['a', 'b', 'c', 'd', 'e']])

print(arr1)
print(arr2)

arr1传入两个个数不同的数list，生成的是一个包含两个list类型的一维ndarray；arr2传入一个整型list和一个字符型list，生成的是一个字符型的二维ndarray。

NumPy中还有一些常见的ndarray创建方式，包括zeros()、zeros_like()、ones()、ones_like()、eye()等函数。zeros()函数初始化一个数据全为0的ndarray；zeros_like()函数传入一个ndarray，生成一个形状一模一样、数据全为0的ndarray；ones()函数和ones_like()函数的功能与zeros()函数、zeros_like()函数类似，只是ones()函数和ones_like()函数生成的ndarray数据全为1。eye()函数创建一个行列数相同的单位矩阵ndarray，即对角线值全为1，其余值全为0的ndarray。这些函数的基本用法如下。

import numpy as np

arr1 = np.zeros(5)
arr = [[0, 1, 2, 3, 4], [5, 6, 7, 8, 9]]
arr2 = np.zeros_like(arr)
arr3 = np.ones(5)
arr4 = np.ones_like(arr)
arr5 = np.eye(5)

print(arr1)
print(arr2)
print(arr3)
print(arr4)
print(arr5)

运行结果如下所示。

NumPy数组的基本属性

首先，我们需要明确几个概念。数组的维数称为秩，一维数组的秩为1，二维数组的秩为2，依次类推。在NumPy中，每个线性的数组称为一个轴，秩描述的其实就是轴的数量。

NumPy数组的常见属性有以下几个：

ndim：ndarray的秩数（轴数），也就是数组的维度个数。

shape：ndarray的形状，例如n行m列的ndarray，shape就是(n，m)。

size：ndarray中所有元素的个数，例如n行m列的ndarray，size就是n*m。

dtype：ndarray的元素类型。

itemsize：ndarray中元素的字节大小，例如int32的字节大小为4，float64的字节大小为8。

我们创建一个4行5列的整型数组，即n=4，m=5，分别看一下这几个属性。

import numpy as np

arr = np.arange(20).reshape(4, 5)

print(arr)
print('ndim: ' + str(arr.ndim))
print('shape: ' + str(arr.shape))
print('size: ' + str(arr.size))
print('dtype: ' + str(arr.dtype))
print('itemsize: ' + str(arr.itemsize))

运行结果如下所示。对于4行5列的ndarray，轴数为2，形状为(4，5)，共有4*5=20个数据，元素类型为int64，字节大小就是int64的字节大小，为8。

三、NumPy常用函数

改变数组形状的reshape()、resize()、T()

reshape()函数的作用是重新调整ndarray的行数、列数、维数，根据传入的参数个数不同，可以重置成不同维数的数组，但是新的形状必须与原来的形状兼容，即相乘后必须等于原数组中元素的总数量，否则会报错。基本用法如下。

import numpy as np

arr1 = np.arange(12)
print(arr1)
print("---------------")
arr2 = arr1.reshape(3, 2, 2)
print(arr2)
print("---------------")
arr3 = arr2.reshape(3, 4)
print(arr3)

以上代码首先创建了一个一维ndarray，共12个数，然后使用reshape()函数将一维ndarray调整成3*2*2的三维ndarray，再对新的三维ndarray调整成3*4的二维ndarray，可以看到，不管做怎样的调整，相乘后的结果都是源数组的元素总个数12。运行结果如下所示。

resize()函数与reshape()函数的作用一样，也可以重新调整ndarray的行数、列数、维数，不同的是reshape()函数需要兼容原来的形状，少于或超出原数组个数会报错，而resize()函数不会报错，当少于时，resize()函数会自动截断，当超出时，resize()函数会循环copy原数组中的值进行填充，直至将新ndarray填充满。我们创建一个10个数的一维ndarray，将形状调整成3*4共12个数，代码如下。

import numpy as np

arr = np.arange(10)
print(arr)
print("---------------")
np.resize(arr, (3, 4))  # 数量不够时会循环使用直至充满形状
print(np.resize(arr, (2, 6)))
print("---------------")
print(arr.resize(2, 6))
print(arr)

运行结果如下所示，新数组共3*4=12个数，大于原数组的10个数，多出的两个数就会从原数组中取出前两个数进行填充。另外，调用ndarray本身的resize()方法不会生成新ndarray，但会改变ndarray形状，调用后再次打印arr，会发现它的形状已经被改变了，并且多余的位置以0填充。

ndarray复制

ndarray的复制使用NumPy的copy()函数，当我们把一个ndarray复制给新的ndarray时，两者是紧密关联的，当原ndarray改变时，新ndarray也会随之改变，但一般我们使用复制并不想要他们有关联性，这个时候使用copy()函数就可以解决这个问题，其实这就是NumPy中的浅copy和深copy。下面我们看一下两者的区别。

import numpy as np

arr1 = np.arange(10)
arr2 = arr1  # 指向同一个数组
print(arr1 == arr2)
arr1[2] = 100
print(arr1)
print(arr2)
print("---------------")
arr3 = arr1.copy()
print(arr1 == arr3)
arr1[3] = 1000
print(arr1)
print(arr3)

运行结果如下图所示。首先不管是赋值还是使用copy()函数生成新ndarray，两者的值都是相等的。区别就是改变原数组时，一个会随之改变，一个不会。

ndarray数据类型转换

NumPy中支持的数据类型比Python内置的类型要更多，下表列举了常用的NumPy基本数据类型。

NumPy中设置ndarray数据类型使用astype()函数，基本用法如下。

import numpy as np

arr1 = np.arange(10, dtype=float)
print(arr1, arr1.dtype)
arr2 = arr1.astype(np.int64)
print(arr2, arr2.dtype)
arr3 = arr2.astype(np.string_)
print(arr3, arr3.dtype)

运行结果如下所示。

ndarray合并

ndarray的合并使用NumPy的stack()函数，传入要合并的ndarray，axis参数表示按行合并或按列合并，默认axis=0按行合并，axis=1时按列合并。按行合并或按列合并还可以使用hstack()函数或vstack()函数。基本用法如下。

import numpy as np

a = np.arange(5)
b = np.arange(5, 9)
print(a)
print(b)
print("---------------")
print(np.hstack((a, b, a))) # 横向连接
print("---------------")
c = np.array([[1], [2], [3]])
d = np.array([['a'], ['b'], ['c']])
print(c)
print(d)
print("---------------")
print(np.vstack((c, d))) # 纵向连接
print("---------------")
# 默认纵向
# print(np.stack((a, b), axis=1)) # 列数不一致，会报错
b = np.arange(5, 10)
print(np.stack((a, b, a), axis=1))

运行结果如下。需要注意的是，在合并时，必须保证要合并的几个ndarray在合并方向上的数量是一致的，否则会报错。

ndarray拆分

NumPy中使用split()函数对ndarray进行拆分，与合并的stack()函数类似，axis表示拆分方向，同时，也有hsplit()函数和vsplit()函数分别按行或按列拆分。split()相关函数的基本用法如下。

import numpy as np

arr = np.arange(16).reshape(4, 4)
print(arr)
print("---------------")
print(np.hsplit(arr, 2))
print(np.split(arr, 2, axis=1))
print("---------------")
print(np.vsplit(arr, 2))
print(np.split(arr, 2))

运行结果如下。拆分时必须保证拆分的数量能等分，否则会报错。

四、NumPy的索引和切片

基本索引和切片

NumPy中ndarray的基本索引和切片与Python中的数组类似，我们分别以一维、二维、三维ndarray作为代表看一下NumPy中ndarray的基本索引和切片。

1、一维ndarray的基本索引和切片

import numpy as np

arr = np.arange(10)
print(arr)
print("---------------")
# 直接索引，打印arr索引为2的值
print(arr[2])
print("---------------")
# 切片，打印arr中从索引5开始到最后一个数的值（包括5）
print(arr[5:])
print("---------------")
print("---------------")
# 切片，打印arr中从开始到索引5的值（不包括5）
print(arr[:5])
print("---------------")
# 切片，打印arr中从第一个数开始以2位步长到最后一个数的值
print(arr[::2])

运行结果如下。

2、二维ndarray的基本索引和切片

import numpy as np

arr = np.arange(15).reshape(3, 5)
print(arr)
print("---------------")
# 索引，打印行索引为1的那一行的值
print(arr[1])
print("---------------")
# 索引，打印行索引为1，列索引为1的值
print(arr[1][1])
print(arr[1, 1])
print("---------------")
# 切片，打印行索引从开始到行索引为2（不包括2）的几行值
print(arr[:2])
print("---------------")
# 切片，打印行索引从第一行到行索引为2（不包括2），列索引从2开始（包括2）到最后一列的值
print(arr[:2, 2:])

运行结果如下。

3、三维ndarray的基本索引和切片

import numpy as np

arr = np.arange(16).reshape(4, 2, 2)
print(arr)
print("---------------")
# 索引
print(arr[1][1][1])
print("---------------")
# 切片
print(arr[1:])

运行结果如下。

四维以上的ndarray使用索引和切片的方法以此类推即可。

布尔型索引和切片

NumPy中还有一种布尔型的索引和切片，布尔型有True和False两个值，对ndarray使用布尔型索引和切片会取出布尔值为True的值，需要注意的是用于索引和切片的布尔型数组的长度和待操作的ndarray的操作轴的大小必须一致。另外，布尔型数组也可与切片，整数（整数序列）一起使用。基本用法如下。

import numpy as np

arr = np.arange(12).reshape(3, 4)
print(arr)
print("---------------")
x = np.array([True, False, True])
y = np.array([True, True, False, False])
print(x)
print(y)
print("---------------")
# 对第一维（这里是行）操作
print(arr[x])
print("---------------")
# 对第二维（这里是列）操作
print(arr[:, y])
print("---------------")
print(arr>6)
print("---------------")
print(arr[arr>6])

对第一维操作时，可省略后面的维度，但对非第一维操作时，其他维度上的值不能忽略，可用“:”表示其他维度上的所有值。除了显示的设置布尔型数组进行索引和切片，还可以使用条件表达式，上述代码中我们打印了arr>6的值，可以看到，返回的是一个与arr形状一致的布尔型ndarray，再使用新生成的布尔型ndarray对arr进行索引，得到的将会是一个满足条件的一维ndarray。运行结果如下所示。

五、ndarray数据运算

基本标量数据运算

基本标量数据运算指的是在ndarray上以其中的元素方式进行计算，既可以用“+（加）、-（减）、*（乘）、/（除）、**（幂)”等数学运算符重载，也可以使用NumPy模块中的函数（add、subtract、multiply、divide等）。下面我们来看一下ndarray的一些基本标量数据运算。

import numpy as np

arr = np.arange(12).reshape(3, 4)

print(arr)
print("---------------")

# 加
print(arr + 5)
print(np.add(arr, 5))
print("---------------")

# 减
print(arr - 5)
print(np.subtract(arr, 5))
print("---------------")

# 乘
print(arr * 5)
print(np.multiply(arr, 5))
print("---------------")

# 除
print(arr / 5)
print(np.divide(arr, 5))
print("---------------")

# 幂
print(arr ** 2)
print("---------------")

# 平方根
print(np.sqrt(x))

我们创建一个3*4的ndarray，然后分别对它进行加、减、乘、除、幂、平方根的运算，可以看到，当ndarray与单个数进行标量数据运算时，ndarray中的每个元素分别与此数进行运算得到结果。同时，用数学符号和使用NumPy模块中的运算函数计算的结果是一致的。运行结果如下所示。

ndarray除了可以与单个数进行基本标量数据运算外，两个ndarray之间也可以进行基本标量数据运算，运算规则为ndarray中对应位置上的元素分别进行对应的运算。我们创建两个ndarray进行基本标量数据运算。

import numpy as np

x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

# 加法
print(x + y)
print(np.add(x, y))
print("---------------")

# 减法
print(x - y)
print(np.subtract(x, y))
print("---------------")

# 乘法
print(x * y)
print(np.multiply(x, y))
print("---------------")

# 除法
print(x / y)
print(np.divide(x, y))
print("---------------")

# 幂
print(x ** y)
print("---------------")

两个ndarray中对应位置上的元素分别做对应运算，运行结果如下所示。

矩阵运算

我们之前有提到，ndarray的元素之间是用空格隔开的，从结构上看，一个一维ndarray相当于一个向量，一个多维ndarray就相当于一个矩阵。事实上，在很多应用场景下，我们也经常把ndarray当做向量或矩阵来使用。学过向量与矩阵的朋友都知道，数学上的向量乘法、矩阵乘法是不同于标量乘法的，不是简单的对应位置上的元素做乘法。（关于向量与矩阵的概念以及向量乘法、矩阵乘法这里不做详细介绍，但这是比较重要的知识点，不了解或者已经遗忘的朋友请务必去学习回顾一下。）

不同于MATLAB，NumPy中“*”符号只是是标量乘法，而不是向量乘法、矩阵乘法，NumPy中的向量乘法、矩阵乘法使用dot()函数来计算，运算结果也成为向量或矩阵的内积。dot()函数也有两种使用方法，既可以作为ndarray对象的实例方法，也可以直接以NumPy模块中的函数作为运算。我们创建两个矩阵和两个向量，分别进行向量与向量的内积计算，向量与矩阵的内积计算，矩阵与矩阵的内积计算。

import numpy as np

# 创建两个矩阵
x = np.array([[1,2],[3,4]])
y = np.array([[5,6],[7,8]])

# 创建两个向量
v = np.array([9,10])
w = np.array([11, 12])

# 向量与向量的内积为标量
print(v.dot(w.T))
print(np.dot(v, w))
print("---------------")

# 矩阵与向量的内积为向量
print(x.dot(v))
print(np.dot(x, v))
print("---------------")

# 矩阵与矩阵的内积为矩阵
print(x.dot(y))
print(np.dot(x, y))

运算结果如下所示。向量与向量的内积结果为一个标量，向量与矩阵的内积结果为一个向量，矩阵与矩阵的内积结果为一个矩阵。

数据处理运算

NumPy中对于ndarray的数据处理运算提供了许多有用的函数，包括计算平均值的mean()函数、计算最大、最小值的max()、min()函数，计算标准差的std()函数、计算方差的var()函数、求总和的sum()函数、排序函数sort()等。这些运算函数的基本用法如下。

import numpy as np

arr = np.arange(12).reshape(3, 4)

# 平均值
print(arr.mean())
print(np.mean(arr, axis=0))
print("---------------")
# 最大、最小值
print(arr.max())
print(np.max(arr, axis=1))
print("---------------")
print(arr.min())
print("---------------")
# 标准差
print(arr.std())
print("---------------")
# 方差
print(arr.var())
print("---------------")
# 求和
print(arr.sum())
print("---------------")
# 排序
print(np.sort(arr))
print(-np.sort(-arr))

我们创建一个3*4的ndarray来进行数据处理运算。这些数据处理运算函数与dot()函数一样，也有两种使用方法，以mean()为例，我们可以使用arr.mean()或np.mean()，当不传参数时，默认操作对象为整个ndarray，设置axis=1或axis=0时可以分别指定对行或对列进行数据处理运算。运行结果如下所示。

六、NumPy中的广播

NumPy中的广播是一种非常强大的机制，它允许NumPy在执行数据运算时使用不同形状的数组。例如，当一个较小的ndarray和一个较大的ndarray要进行数据运算时，我们会希望通过多次使用较小的数组来对较大的数组执行一些操作。

在介绍基本标量数据运算时，我们用ndarray与一个标量进行运算，其实就是一个简单的广播，广播机制会把标量循环填充成与要运算的ndarray同样形状的一个ndarray，然后再运算，所以我们看到的结果就是ndarray中每个元素分别与标量进行相关运算。

如果没有广播机制，当ndarray与一个标量进行运算时，需要先对这个标量进行转化，我们可以来看一下这个过程。

import numpy as np

x = np.arange(12).reshape(3, 4)
print(x)

v = 5
# 创建与x形状一致的空ndarray
y = np.empty_like(x)

# 用标量5填充这个空ndarray
for i in range(3):
    for j in range(4):
        y[i, j] = 5
        
print("---------------")
print(y)

# 运算
print("---------------")
print(np.add(x, y))

首先，创建一个与要运算的ndarray形状一致的空ndarray，然后用参与运算的标量去填充这个空ndarray，最后对这两个形状一致的ndarray进行运算。运行结果如下所示。

以上是一种保持ndarray形状一致的扩展方法，但是这种方法在ndarray非常大时，像这样的显式循环就会变得很慢。这时我们有另一种快速的扩展方法，使用NumPy的tile()函数进行叠加。我们可以像如下这样实现这种方法。

import numpy as np

x = np.arange(12).reshape(3, 4)
print(x)

v = np.array([5])

# 使用tile进行ndarray叠加
vv = np.tile(v, (3, 4))
print("---------------")
print(vv)

# 运算
y = x + vv
print("---------------")
print(y)

tile()函数传入要扩展的ndarray，然后将形状传入，就会开始往各个维度方向上进行扩展。运行结果如下所示，与循环方式填充实现的结果是一样的。

以上是没有广播机制的前提下对较小的ndarray进行扩展填充至与较大的ndarray形状一致的方法，有了广播机制，就不需要以上的操作了，对于3*4的ndarray与标量5的运算，我们可以直接进行。

import numpy as np

x = np.arange(12).reshape(3, 4)
print(x)

v = 5

# 直接运算
y = x + v
print("---------------")
print(y)

运算结果如下所示，可以得到一样的正确结果。

当然，需要注意的是，不是所有较小的ndarray与较大的ndarray之间的运算都是可以利用广播机制的，例如，我们用形状为(4，3)的ndarray与形状为(3，4)的ndarray进行数据运算，就会报“operands could not be broadcast together with shapes (4，3) (3，4)”的错误，可以看到，形状(4，3)和(3，4)的ndarray并不能顺利进行广播来运算。

因此，我们在使用广播机制时，一定要特别注意是否遵循了以下规则：

1、如果ndarray不具有相同的rank，则将较低等级ndarray的形状添加1，直到两个形状具有相同的长度。

2、如果两个ndarray在维度上具有相同的大小，或者如果其中一个ndarray在该维度中的大小为1，则称这两个ndarray在维度上是兼容的。

3、如果ndarray在所有维度上兼容，则可以一起广播。

4、广播之后，每个阵列的行为就好像它的形状等于两个输入ndarray的形状的元素最大值。

5、在一个ndarray的大小为1且另一个ndarray的大小大于1的任何维度中，第一个ndarray的行为就像沿着该维度复制一样。

形状(4，3)和(3，4)的ndarray就是由于没有遵循规则2，所以不能顺利进行广播。在遵循广播机制规则的基础下，我们应该尽可能地使用去它，因为广播机制通常会使我们的代码更加简洁，效率也更高。

七、NumPy中的随机数

NumPy中的随机数集中在random包中，它包含了多种概率分布的随机样本，是数据计算、分析的重要辅助工具，主要包括normal(mean,stdev,size)、random(size)、rand(d0, d1, ..., dn)、randn(d0, d1, ..., dn)、randint(low[, high, size, dtype])、choice(a[, size, replace, p])。下面我们分别看一下这几种随机数的用法。

normal(mean,stdev,size)

normal(mean,stdev,size)生成一组均值为mean，标准差为stdev、大小形状为size的高斯随机数或高斯随机数ndarray。

import numpy as np

arr = np.random.normal(2, 1, size=(5, 5))
print(arr)
print("---------------")
print(arr.mean())
print("---------------")
print(arr.std())

我们创建了一个均值为2，标准差为1的5*5的ndarray，然后使用mean()函数和std()函数分别计算这个ndarray的均值和标准差，虽然由于浮点数误差可能存在偏差，但结果基本上是接近mean=2、std=1的。运行结果如下所示。

random(size)

random(size)生成一组[0，1)范围（大于等于0小于1）、大小形状为size的随机数或随机数ndarray。此外，random_sample(size)、ranf(size)、sample(size)与random(size)的用法与功能基本一样。

import numpy as np

arr1 = np.random.random(size=(5, 5))
print(arr1)
print("---------------")
arr2 = np.random.random_sample(size=(5, 5))
print(arr2)
print("---------------")
arr3 = np.random.ranf(size=(5, 5))
print(arr3)
print("---------------")
arr4 = np.random.sample(size=(5, 5))
print(arr4)

我们分别用random(size)、random_sample(size)、ranf(size)、sample(size)这四个函数创建5*5的ndarray，可以看到，这四个函数创建的ndarray中的元素都是[0，1)范围内的。运行结果如下所示。

rand(d0, d1, ..., dn)

rand(d0, d1, ..., dn)生成一个[0, 1)的均匀分布的随机浮点数或N维随机浮点数ndarray，如果没有参数，则返回一个值，如果有参数，则返回d0*d1*…*dn个值。

import numpy as np

x = np.random.rand()
print(x)
print("---------------")
arr = np.random.rand(2, 2, 3)
print(arr)

运行结果如下，当给rand()函数传入参数时，d0, d1, ..., dn分别表示第1、2、...、(n-1)维上的元素个数，会生成一个d0*d1*…*dn的ndarray。

randn(d0, d1, ..., dn)

randn(d0, d1, ..., dn)生成一个期望为0、方差为1（标准正态分布）的随机浮点数或N维随机浮点数ndarray，参数d0, d1, ..., dn的含义与rand()函数中的参数是一样的。

import numpy as np

x = np.random.randn()
print(x)
print("---------------")
arr = np.random.randn(2, 4, 4)
print(arr)
print("---------------")
print("均值为: " + str(arr.mean()))
print("方差为: " + str(arr.var()))

运行结果如下所示，可以看到，虽然存在误差，但是均值和方差分别是解决0和1的。

randint(low[, high, size, dtype])

randint(low[, high, size, dtype])生成一个整数或N维整数ndarray。当传入参数high时，范围为[low，high)，当不传参数high时，范围就会变成为[0，low)；size表示生成的ndarray维度大小；dtype为数据类型，但是只能传整型（int、int8、int32、int64等），默认的数据类型是np.int。

import numpy as np

print(np.random.randint(5))
print("---------------")
print(np.random.randint(5, 10))
print("---------------")
print(np.random.randint(5, size=10))
print("---------------")
print(np.random.randint(5, 10, size=(2, 5)))
print("---------------")
print(np.random.randint(5, dtype=np.int32))

运行结果如下所示。

choice(a[, size, replace, p])

choice(a[, size, replace, p])生成一个元素值来自数组a、大小形状为size的值或ndarray。a表示输入数组，即生成结果的元素的来源数组，当输入为单个数字例如5时，为range(5)；size表示输出的ndarray大小形状，默认为1；replace设置输出数字是否可重复，False代表不可重复，比如a=[1，2，3，4，5]，输出的ndarray中1，2，3，4，5不能重复，所以该ndarray的维数不能超过5；p代表a中对应的单位出现的概率，为一个数组，例如[0.1，0.2，0.1，0.3，0.3]，他们维数和a相同，且加起来总和必须等于1。

import numpy as np

arr_from = [2, 12, 6, 8, 9]
arr1 = np.random.choice(arr_from)
print(arr1)
print("---------------")
arr2 = np.random.choice(arr_from, size=(2, 3))
print(arr2)
print("---------------")
arr3 = np.random.choice(arr_from, size=(2, 2), replace=False)
print(arr3)
print("---------------")
arr4 = np.random.choice(arr_from, size=(2, 3), p=[0.1, 0.1, 0.1, 0.1, 0.6])
print(arr4)
print("---------------")

arr_str_from = ['xzq', 'qlh', 'xzq666', 'qlh888']
result = np.random.choice(arr_str_from)
print(result)

arr1只传入来源数组a，得到的是一个来自a的值；arr2传入size，返回的结果就会变成指定大小形状的ndarray；arr3将replace参数设置成False，元素不可重复，所以size的大小必须小于源数组a；arr4设置概率p，为了观察差异，我们将最后一个元素9的概率设置成0.6，可以发现，得到的ndarray中出现9的频率会特别高。此外，当源数组a中拥有字符型数据时，整个源数组中的元素都会被转成字符型数据。运行结果如下所示。

seed(n)

我们在使用随机数时，有时候会有生成相同随机数的需求，NumPy中使用seed()函数来控制生成相同的随机数，每次运行代码时给seed()函数设置相同的标记n时，即可生成相同的随机数。

import numpy as np

# 不使用seed
a = np.random.rand(5)
print('第一次列表a：',a)
a = np.random.rand(5)
print('第二次列表a：',a)
print("---------------")


# 使用seed
np.random.seed(2)
b = rand(5)
print('第一次列表b：',b)
np.random.seed(2)
b = rand(5)
print('第二次列表b：',b)
np.random.seed(2)
b = rand(5)
print('第三次列表b：',b)
np.random.seed(0)
b = rand(5)
print('第四次列表b：',b)
np.random.seed(0)
b = rand(5)
print('第五次列表b：',b)
np.random.seed(2)
b = rand(5)
print('第六次列表b：',b)
b = rand(5)
print('第七次列表b：',b)

我们通过几组随机数来看一下是否设置seed()函数对生成随机数的影响。运行结果如下所示，可以看到，当不设置seed时，生成的随机数都是随机的不相同的；而使用seed()函数时，对于设置了相同标记的seed(n)时，生成的随机数是一模一样的，如第一次、第二次、第三次、第六次都设置了seed(2)，第四次、第五次都设置了seed(0)，返回的就分别是一样的随机数，而第七次我们没设置任何seed()，所以又返回了不一样的随机数。

八、ndarray的保存与加载

NumPy中可以怼ndarray数据进行存储，以便下次继续使用，一般我们将ndarray数据保存成.npy文件。NumPy中使用save()函数对ndarray进行保存，基本用法如下。

import numpy as np

arr = np.random.rand(4, 4)
print(arr)
np.save('/Users/qhzc-imac-02/Desktop/result.npy', arr)
print('保存成功')

运行结果如下所示。我们传入路径和要保存的ndarray，运行后就会在指定路径下生成一个.npy文件。

我们用sublime把这个文件打开，可以看到如下内容。

保存的.npy文件是以二进制格式存储的，所以看到的并不是我们的原始数组。但这不影响我们对保存的数据的继续使用，待下次使用时，只需要使用NumPy中的load()函数即可。

import numpy as np

arr_load = np.load('/Users/qhzc-imac-02/Desktop/result.npy')
print(arr_load)
print('加载成功')

运行结果如下所示，加载的ndarray就是我们之前保存的ndarray，内容是完全一样的。

如果我们要将多个ndarray保存到同一个文件中，这时我们可以使用NumPy的savez()函数。savez函数的第一个参数是路径，后面的参数则是需要保存的ndarray，有几个传几个，也可以使用关键字参数为ndarray起一个名字，非关键字参数传递的ndarray会自动为传入的数组命名为arr_0，arr_1，arr2等。savez函数保存的是一个.npz压缩文件，其中每个文件都是一个.npy文件，文件名对应于ndarray名。基本用法如下。

import numpy as np

arr1 = np.random.rand(2, 2)
arr2 = np.random.rand(3, 3)
arr3 = np.random.rand(4, 4)
np.savez('/Users/qhzc-imac-02/Desktop/ndarrays_save.npz', arr1, no2=arr2, no3=arr3)
print(arr1)
print("---------------")
print(arr2)
print("---------------")
print(arr3)
print("---------------")
print('保存成功')

运行后会在指定路径下生成一个.npz文件，它也是以二进制格式存储的。便于与加载结果的对比将运行结果记录如下。

加载.npz文件同样通过NumPy的load()函数，load()函数会自动识别.npz文件，并且返回一个类似于字典的对象，可以通过ndarray名作为关键字获取ndarray的内容。

import numpy as np

ndarray_dict = np.load('/Users/qhzc-imac-02/Desktop/ndarrays_save.npz')
print(ndarray_dict['arr_0'])
print("---------------")
print(ndarray_dict['no2'])
print("---------------")
print(ndarray_dict['no3'])

运行结果如下所示。使用时注意保存时给每个ndarray的命名，可以看到，加载出来的数据与保存的是一致的。

以上对ndarray的保存都是以二进制格式保存的，如果我们想从保存的文件中查看我们保存的内容，可以将ndarray保存成.txt格式。NumPy中使用savetxt()函数来存储.txt格式，对应的使用loadtxt()函数来加载.txt文件中的ndarray。

import numpy as np

arr = np.random.rand(4, 4)
print(arr)
print("---------------")

np.savetxt('/Users/qhzc-imac-02/Desktop/ndarray1.txt', arr, delimiter=',')
arr_txt_load1 = np.loadtxt('/Users/qhzc-imac-02/Desktop/ndarray1.txt', delimiter=',')
print(arr_txt_load1)
print("---------------")

np.savetxt('/Users/qhzc-imac-02/Desktop/ndarray2.txt', arr, delimiter=',', fmt='%.2f')
arr_txt_load2 = np.loadtxt('/Users/qhzc-imac-02/Desktop/ndarray2.txt', delimiter=',')
print(arr_txt_load2)

我们创建一个4*4的随机ndarray，分别保存成两个.txt文件，都使用“,”作为分隔符，同时将保存至ndarray2.txt的ndarray设置成保留两位小数。运行后可以看到在指定位置生成了ndarray1.txt和ndarray2.txt两个文件，我们打开这两个文件可以看到如下内容。

ndarray1.txt文件保存的是源数据，而ndarray2.txt文件由于设置了保存两位小数，所以是格式化后的数据。此时再调用loadtxt()函数分别加载这两个.txt文件，就会得到各自文件中的内容。从ndarray1.txt加载的内容与源ndarray一模一样，ndarray2.txt则会加载保留两位小数的ndarray。

你可能感兴趣的:(数据分析)

AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
Python - 数据分析三剑客之Pandas MinggeQingchun Python Python Pandas
阅读前可参考NumPy文章https://blog.csdn.net/MinggeQingchun/article/details/148253682https://blog.csdn.net/MinggeQingchun/article/details/148253682‌Pandas是Python中一个强大的开源数据分析库，专门用于处理结构化数据（如表格、时间序列等），其核心数据结构为Seri
新增AI Copilot，DataEase开源数据可视化分析工具v2.9.0发布 FIT2CLOUD飞致云开源数据可视化 DataEase AI Copilot 嵌入式
2024年8月5日，人人可用的开源数据可视化分析工具DataEase正式发布v2.9.0版本。这一版本的功能变动包括：导航栏新增Copilot入口，借助AI技术，通过自然语言交互实现即问即答，让数据分析更加直观和便捷；图表方面，对有图例的图表支持序列颜色设置，并对地图、表格等图表类型进行功能增强和优化；仪表板和数据大屏方面，新增应用导出/导入功能，仪表板和数据大屏中可以支持富文本和跑马灯组件刷新，
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
python-pandas数据分析+案例分析
文章目录前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比2.车辆销售规模及环比、不同价位车销量及环比3.各车系、厂商、品牌车销量及环比，市占率及变化趋势4.品牌、车类、车型、级别的各top销量二、地质灾害航空公司客户价值分析1.原始数据存在少量的缺失值和异常值前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比importnump
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
用Python做数据分析之数据统计学掌门 Python 数据分析大数据 python 数据分析人工智能
接下来说说数据统计部分，这里主要介绍数据采样，标准差，协方差和相关系数的使用方法。1、数据采样Excel的数据分析功能中提供了数据抽样的功能，如下图所示。Python通过sample函数完成数据采样。2、数据抽样Sample是进行数据采样的函数，设置n的数量就可以了。函数自动返回参与的结果。1#简单的数据采样2df_inner.sample(n=3)3、简单随机采样Weights参数是采样的权重，
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
数据分析框架和方法 XiaoQiong.Zhang 人工智能
一、核心分析框架(TheBigPictureFrameworks)描述性分析(WhatHappened?)目的：了解过去发生了什么，描述现状，监控业务健康。核心工作：汇总、聚合、计算基础指标(KPI)，生成报表和仪表盘。常用方法/指标：计数/求和/平均值/中位数：DAU/MAU，总销售额，客单价等。比率：转化率，点击率，流失率，毛利率等。分布：用户活跃度分布、订单金额分布、地域分布等。常用于理解群
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
基于Python的旅游数据可视化应用
摘要本文详细介绍了一个功能完善的基于Python语言开发的旅游行业数据可视化分析应用系统。该系统采用Pandas这一强大的数据处理库进行数据清洗、转换和预处理工作，确保数据质量可靠。在可视化展示方面，系统整合了Matplotlib和Seaborn两大主流可视化库，通过丰富的图表类型直观呈现数据分析结果。特别值得一提的是，所有可视化图表均采用统一的绿色主题配色方案，这种设计不仅美观大方，更能突出体现
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
动态时间规整（Dynamic Time Warping，DTW）介绍 EmorZhong 机器学习人工智能深度学习数据结构算法
在时序数据分析中，动态时间规整（DynamicTimeWarping，DTW）是一种经典的用于度量两个时间序列相似度的算法。它的核心价值在于解决了传统距离度量（如欧氏距离）在处理时间序列时的局限性——尤其是当序列存在时间错位（如节奏快慢不同）或长度差异时，仍能准确捕捉它们的“形状相似性”。一、为什么需要DTW？传统的距离度量（如欧氏距离）要求两个时间序列必须长度相同且时间点严格对齐。但实际场景中，
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
一文搞懂怎么入门大模型
在人工智能飞速发展的当下，大模型已然成为推动众多领域创新变革的核心力量。无论是在智能客服、内容创作，还是数据分析、科学研究等方面，大模型都展现出了令人瞩目的能力。对于渴望踏入大模型领域的初学者而言，构建一个系统且全面的入门路径至关重要。接下来，我们将以DeepSeek为例，详细阐述如何系统地入门大模型。一、理论基础：搭建认知框架在深入实践之前，理解大模型的基础理论是关键。大模型，通常指具有海量参数
从零到一：王者荣耀英雄数据采集与技能图谱异步爬虫实战程序员威哥爬虫 python 开发语言自动化 scrapy
引言：随着游戏行业的迅猛发展，王者荣耀作为一款深受玩家喜爱的手游，其英雄数据和技能信息成为了爬虫开发者研究的热点之一。通过抓取英雄数据并对技能图谱进行可视化，我们不仅能够更好地理解游戏数据，还可以为游戏爱好者或数据分析师提供一个有价值的数据分析平台。本篇文章将带你一步步实现王者荣耀英雄数据的采集与技能图谱的可视化，并使用异步爬虫技术提高爬取效率。我们将结合实际开发中的需求，深入讲解如何使用异步爬虫
【HTML网页】智能健康监测——全方位健康管理专家（包含网页源代码）
智能健康监测分析系统智能健康监测分析系统是一种基于物联网、大数据、人工智能等技术的综合性健康管理解决方案。它具有以下六大核心功能：实时监测系统通过智能传感器和可穿戴设备，实时采集用户的生理数据，例如心率、血压、血氧饱和度、血糖水平和睡眠质量等，确保用户随时掌握自己的身体状况。健康数据分析利用人工智能和大数据分析技术，系统对采集到的数据进行处理和分析，提取有价值的健康信息，如心率变异性、呼吸频率等，
【字节跳动】数据挖掘面试题0010：解释全国人均收入下降，各省份人均收入增加的现象，属于辛普森悖论（开放性问题）言析数智数据挖掘常见面试题辛普森悖论局部与整体分析差异归因数据分析面试题
文章大纲一、辛普森悖论的核心定义二、现象成因：加权平均中的“权重偏移”三、数学逻辑与案例说明1.数学表达式2.具体案例四、辛普森悖论的本质：忽略“混杂因素”的影响五、生活中常见的辛普森悖论案例及应对策略1.医疗疗法效果评估2.大学录取率的性别偏差3.篮球运动员投篮效率4.公司员工绩效与部门规模如何利用辛普森悖论？（数据分析中的价值）六、总结全国人均收入下降而各省份人均收入增加的现象，确实属于辛普森
大模型学习应用 6: Vercel 部署自动获取微信公众号文章获取项目大地之灯大模型应用与学习学习微信大模型应用开发 python github flask
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页本文将详细介绍如何在Vercel平台上部署自动微信公众号文章获取项目，包括项目结构、代码实现、部署流程以及常见问题的解决方案。注意：本项目源代码github链接，可自行克隆到自己的代码仓库完成vercel部署，注意需要稳定ip输出（微信白名单需求），免费
ChatGPTNextChat项目重构计划（九）：NextChat 解析API路由处理逻辑 stream.ts
大模型落地开发实战指南！请关注微信公众号：「AGI启程号」深入浅出，助你轻松入门！数据分析、深度学习、大模型与算法的综合进阶，尽在CSDN博客主页目录一、文件作用概述二、导入模块与类型定义三、核心函数详细解析`fetch(url,options)`四、`fetch`函数详细步骤解析步骤1:检测Tauri环境并准备请求参数步骤2:创建数据流(`TransformStream`)步骤3:定义关闭数据流
x86架构CPU市场格局 InnoLink_1024 芯片架构硬件架构
x86架构的CPU市场是全球处理器市场的核心，涵盖PC（桌面端与移动端）、服务器和超算等领域，主要玩家为英特尔（Intel）和AMD。以下基于最新数据分析市场格局及各领域份额，辅以国产厂商动态。1.总体市场概况x86架构因其成熟的生态系统和强大的兼容性，在PC和服务器市场占据主导地位。根据2024年数据，x86架构在服务器CPU市场占约91%的份额，而ARM等其他架构（如华为鲲鹏、飞腾）占约8%，
Julia爬取数据能力及应用场景 q56731523 julia 开发语言
Julia是一种高性能编程语言，特别适合数值计算和数据分析。然而，关于数据爬取（即网络爬虫）方面，我们需要明确以下几点：虽然它是一门通用编程语言，但它的强项不在于网络爬取（WebScraping）这类任务。而且Julia的生态系统在爬虫方面还不够成熟和丰富。所以说Julia爬取数据后立即进行高性能的数据分析这点还是有一些优势。Julia虽然以高性能数值计算和数据分析见长，但它同样具备网络爬取（We
用Python的Chartify库，商业数据可视化效率提升13倍！忆愿 Python编程的脉动之声 python opencv 人工智能计算机视觉深度学习神经网络机器学习
文章目录为啥要用Chartify？安装那些事儿从零开始画图基础柱状图进阶折线图散点图与气泡图专业数据分析必备技能多维度分析时间序列分析高级可视化技巧自定义主题交互式特性批量图表生成性能优化技巧大数据集处理内存优化实战案例：销售数据分析系统数据可视化这事儿，搞过的都知道有多费劲。用matplotlib画个图要调半天参数，才能让图表看起来稍微顺眼一点；seaborn虽然画出来的图确实好看，但是配置项太
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts