前丨尘忆·梦

Python数据科学学习笔记之——NumPy入门

NumPy 入门

1、理解 Python 中的数据类型

1.1、Python 整型不仅仅是一个整型

标准的 Python 实现是用 C 语言编写的。这意味着每一个 Python 对象都是一个聪明的伪 C 语言结构体，该结构体不仅包含其值，还有其他信息。例如：当我们在 Python 中定义一个整型，例如：x = 10000 时，x 并不是一个 “原生” 整型，而是一个指针，指向一个 C 语言的复合结构体，结构体里包含了一些值。

查看 Python 源代码，可以发现整型（长整型）的定义，如下：

struct _longobject{
     
	long ob_refcnt;		//一个引用计数，它帮助 Python 默默地处理内存的分配和回收
	PyTypeObject *ob_type;	//将变量的类型编码
	size_t ob_size;	//指定接下来的数据成员的大小
	long ob_digit[1];	//包含我们希望 Python 变量表示的实际整型值
};

差异：C 语言整型本质上是对某个内存位置的标签，里面存储的字节会编码成整型。而 Python 的整型其实是一个指针，指向包含这个 Python 对象所有信息的某个内存位置，其中包括可以转换成整型的字节。由于 Python 的整型结构体里面还包含了大量额外的信息，所以 Python 可以自由、动态地编码。

1.2、Python 列表不仅仅是一个列表

Python 中的标准可变多元素容器是列表。因为 Python 的动态特性，甚至可以创建一个异构的列表：

L = [True,'2',3.0,4]
print([type(item) for item in L])

[<class 'bool'>, <class 'str'>, <class 'float'>, <class 'int'>]

为了获得这些灵活的类型，列表中的每一项必须包含各自的类型信息，引用类型和其他信息；也就是说，每一项都是一个完整的 Python 对象。

来看一个特殊的例子，如果列表中的所有变量都是同一类型的，那么很多信息都会是多余的——将数据存储在固定类型的数组中应该会更高效。动态类型的列表和固定类型的（NumPy 式）数组间的区别就在于此。

在实现层面，数组基本上包含一个指向连续数据块的指针。另一方面，Python 列表包含一个指向指针块的指针，这其中的每一个指针对应一个完整的 Python 对象。列表的优势是灵活，因为列表中的元素可以用任何类型的数据填充。固定类型的 NumPy 式数组缺乏这种灵活性，但是能更有效地存储和操作数据。

1.3、Python 中固定类型数组

Python 提供了几种将数据存储在有效的、固定类型的数据缓存中的选项。内置的数组（array）模块可以用于创建统一类型的密集数组：

import array
L = list(range(10))
A = array.array('i',L)	#这里的 'i' 是一个数据类型码，表示数据为整型

array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Python 的数组对象提供了数组型数据的有效存储，而 NumPy 为该数据加上了高效的操作。

从用 np 别名导入 NumPy 的标准做法：

import numpy as np

1.4、从 Python 列表创建数组

首先，可以用 np.array 从 Python 列表创建数组：

np.array([1,4,2,5,3])

[1,4,2,5,3]

NumPy 要求数组必须包含同一类型的数据。如果类型不匹配，NumPy 将会向上转型。如：

np.array([3.14,4,2,3])

[3.14 4.   2.   3.  ]

如果希望明确数组的数据类型，可以用 dtype 关键字：

np.array([1,2,3,4],dtype='float32')

[1. 2. 3. 4.]

NumPy 数组可以被指定为多维的。以下是用列表的列表初始化多维数组的一种方法：

#嵌套列表构成的多维数组
np.array([range(i,i+3) for i in [2,4,6]])

[[2 3 4]
 [4 5 6]
 [6 7 8]]

1.5、从头创建数组

面对大型数组的时候，用 NumPy 内置的方法从头创建数组是一种更高效的方法。

#创建一个长度为 10 的数组，数组的元素都是 0
np.zeros(10,dtype=int)

[0 0 0 0 0 0 0 0 0 0]

np.ones((3,5),dtype=float)

[[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]

#创建一个 3x5 的浮点型数组，数组的值都是 3.14
print(np.full((3,5),3.14))

[[3.14 3.14 3.14 3.14 3.14]
 [3.14 3.14 3.14 3.14 3.14]
 [3.14 3.14 3.14 3.14 3.14]]

#创建一个线性序列数组
#从 0 开始，到 20 结束，步长为 2
#（它和内置的 range() 函数类似）
print(np.arange(0,20,2))

[ 0  2  4  6  8 10 12 14 16 18]

#创建一个 5 个元素的数组，这 5 个数均匀地分布到 0~1
print(np.linspace(0,1,5))

[0.   0.25 0.5  0.75 1.  ]

#创建一个 3x3 的、在 0~1 均匀分布的随机数组成的数组
print(np.random.random((3,3)))

[[0.886326   0.93619859 0.59884604]
 [0.20913196 0.15508227 0.01782209]
 [0.20183124 0.5761326  0.19984512]]

#创建一个 3x3 的、均值为 0、标准差为 1 的正态分布的随机数数组
print(np.random.normal(0,1,(3,3)))

[[ 1.22672264 -1.25538307 -0.13381821]
 [ 1.18173765  0.95377135  0.52868231]
 [ 0.0503752   0.84407108 -0.06514662]]

#创建一个 3x3 的、[0,10) 区间的随机整型数组
print(np.random.randint(0,10,(3,3)))

[[2 9 6]
 [2 1 3]
 [2 0 5]]

#创建一个 3x3 的单位矩阵
print(np.eye(3))

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]

#创建一个由 3 个整型数组成的未初始化的数组
#数组的值是内存空间中的任意值
print(np.empty(3))

[1. 1. 1.]

2、NumPy 数组基础

2.1、NumPy 数组的属性

定义三个随机数组：一个一维数组、一个二维数组和一个三维数组。我们将用 NumPy 的随机数生成器设置一组种子值，以确保每次程序执行时都可以生成同样的随机数组：

np.random.seed(0)    #设置种子随机数
x1 = np.random.randint(10,size=6)   #一维数组
x2 = np.random.randint(10,size=(3,4))   #二维数组
x3 = np.random.randint(10,size=(3,4,5)) #三维数组

每个数组都有 ndim（数组的维度）、shape（数组每个维度的大小）和 size（数组的总大小）属性；

print("x3 ndim:",x3.ndim)   #数组的维度		x3 ndim: 3
print("x3 shape:",x3.shape) #数组每个维度的大小		x3 shape: (3, 4, 5)
print("x3 size:",x3.size)   #数组的总大小		x3 size: 60

另外一个有用的属性是 dtype，它是数组的数据类型：

print("dtype：",x3.dtype)    #数组的数据类型	dtype： int32

其他的属性包括每个数组元素字节大小的 itemsize，以及表示数组粽总字节大小的属性 nbytes：

print("itemsize:",x3.itemsize,"bytes")  #每个数组元素字节大小	itemsize: 4 bytes
print("nbytes:",x3.nbytes,"bytes")  #数组总字节大小	nbytes: 240 bytes

一般来说，可以认为 nbytes = itemsize * size。

2.2、数组索引：获取单个元素

在一维数组中，你可以通过中括号指定索引获取第 i 个值（从 0 开始计数）：

print(x1)		#[5 0 3 3 7 9]
print(x1[0])	#5
print(x1[4])	#7

为了获取数组的末尾索引，可以使用负值索引：

print(x1[-1])	#9
print(x1[-2])	#7

在多维数组中，可以用逗号分隔的索引元组获取元素：

print(x2)
'''
[[3 5 2 4]
 [7 6 8 8]
 [1 6 7 7]]
'''
print(x2[0,0])	#3
print(x2[2,0])	#1
print(x2[2,-1])	#7

也可以使用上述方式修改元素值：

x2[0,0] = 12
print(x2)
'''
[[12  5  2  4]
 [ 7  6  8  8]
 [ 1  6  7  7]]
'''

2.3、数组切片：获取子数组

切片符号用冒号（:）表示。为了获取数组 x 的一个切片，可以用以下方式：

x[start:end:step]

如果以上 3 个参数都未被指定，那么它们会被分别设置成默认值 start = 0，end = 维度的大小和 step = 1。

一维数组

x = np.arange(10)
print(x)	#[0 1 2 3 4 5 6 7 8 9]

print(x[:5])    #前五个元素	[0 1 2 3 4]
print(x[5:])    #索引 5 之后的元素	[5 6 7 8 9]
print(x[4:7])   #中间的子数组	[4 5 6]
print(x[::2])   #每隔一个元素	[0 2 4 6 8]
print(x[1::2])  #每隔一个元素，从索引 1 开始	[1 3 5 7 9]

逆序数组的一种方法：

print(x[::-1])  #所有元素，逆序	[9 8 7 6 5 4 3 2 1 0]
print(x[5::-2]) #从索引 5 开始每隔一个元素逆序	[5 3 1]

多维数组

print(x2)
'''
[[12  5  2  4]
 [ 7  6  8  8]
 [ 1  6  7  7]]
'''
print(x2[:2,:3])    #两行 三列
'''
[[12  5  2]
 [ 7  6  8]]
'''
print(x2[:3,::2])   #所有行，每隔一列
'''
[[12  2]
 [ 7  8]
 [ 1  7]]
'''

同样也可以逆序：

print(x2[::-1,::-1])    #逆序
'''
[[ 7  7  6  1]
 [ 8  8  6  7]
 [ 4  2  5 12]]
'''

获取数组的行和列

一种常见的需求是获取数组的单行与单列。用一个冒号（:）表示空切片。
```
print(x2[:,0])  #x2 的第一列	[12  7  1]
print(x2[0,:])  #x2 的第一行	[12  5  2  4]
```
获取行时，出于语法的简洁考虑，可以省略空的切片：
```
print(x2[0])    #等于 x2[0,:]	[12  5  2  4]
```
非副本视图的子数组

数组切片返回的是数组数据的视图，而不是数值数据的副本。
```
print(x2)
'''
[[12  5  2  4]
 [ 7  6  8  8]
 [ 1  6  7  7]]
'''
x2_sub = x2[:2,:2]
print(x2_sub)
'''
[[12  5]
 [ 7  6]]
'''
```
现在如果修改这个数组，将会看到原始的数组也被修改了。结果如下：
```
x2_sub[0,0] = 99
print(x2_sub)
'''
[[99  5]
 [ 7  6]]
'''
print(x2)
'''
[[99  5  2  4]
 [ 7  6  8  8]
 [ 1  6  7  7]]
'''
```
它意味着在处理非常大的数据集时，可以获取或处理这些数据集的片段，而不用复制底层的数据缓存。

创建数组的副本

可以简单地通过 copy() 来实现。

x2_sub_copy = x2[:2,:2].copy()
print(x2_sub_copy)
'''
[[99  5]
 [ 7  6]]
'''

如果修改这个子数组，原始的数组不会被改变：

x2_sub_copy[0,0] = 42
print(x2_sub_copy)
'''
[[42  5]
 [ 7  6]]
'''
print(x2)
'''
[[99  5  2  4]
 [ 7  6  8  8]
 [ 1  6  7  7]]
'''

2.4、数组的变形

通过 reshape() 函数来实现。

例如：如果你希望将数字 1~9 放入一个 3 × 3 的矩阵中，可以采用如下方法：

grid = np.arange(1,10).reshape((3,3))
print(grid)
'''
[[1 2 3]
 [4 5 6]
 [7 8 9]]
'''

另外一个常见的变形模式是将一个一维数组转变为二维的行或列的矩阵。你可以通过 reshape 方法来实现，或者更简单地在一个切片操作中利用 newaxis 关键字：

x = np.array([1,2,3])
print(x.reshape((1,3))) #通过变形获得行向量	[[1 2 3]]

#通过 newaxis 获得的行向量
print(x[np.newaxis,:])	#[[1 2 3]]

print(x.reshape((3,1)))
'''
[[1]
 [2]
 [3]]
'''

print(x[:,np.newaxis])
'''
[[1]
 [2]
 [3]]
'''

2.5、数组的拼接与分裂

数组的拼接

拼接或连接 NumPy 中的两个数组主要由 np.concatenate、np.vstack、np.hstack 例程实现。

x = np.array([1,2,3])
y = np.array([3,2,1])
print(np.concatenate([x,y]))	#[1 2 3 3 2 1]

np.concatenate 也可以用于二维数组的拼接：

grid = np.array([[1,2,3],
                 [4,5,6]])
#沿着第一个轴拼接
print(np.concatenate([grid,grid]))
'''
[[1 2 3]
 [4 5 6]
 [1 2 3]
 [4 5 6]]
'''

#沿第二个轴拼接
print(np.concatenate([grid,grid],axis=1))
'''
[[1 2 3 1 2 3]
 [4 5 6 4 5 6]]
'''

沿着固定维度处理数组时，使用 np.vstack（垂直栈）和 np.hstack（水平栈）函数会更简洁：

x = np.array([1,2,3])
grid = np.array([[9,8,7]
                 [6,5,4]])

#垂直栈数组
print(np.vstack([x,grid]))
'''
[[1 2 3]
 [9 8 7]
 [6 5 4]]
'''

#水平栈
y = np.array([[99],
              [99]])
print(np.hstack([grid,y]))
'''
[[ 9  8  7 99]
 [ 6  5  4 99]]
'''

数组的分裂

分裂可以使用 np.split、np.hsplit 和 np.vsplit 函数来实现。可以向以上函数传递一个索引列表作为参数，索引列表记录的是分裂点位置：

x = [1,2,3,99,99,3,2,1]
x1,x2,x3 = np.split(x,[3,5])
print(x1,x2,x3)		#[1 2 3] [99 99] [3 2 1]

注意：N 分裂将会得到 N+1 个子数组。

相关的 np.hsplit 和 np.vsplit 函数用法也是一样：

grid = np.arange(16).reshape((4,4))
print(grid)
'''
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
'''
upper,lower = np.vsplit(grid,[2])
print(upper)
'''
[[0 1 2 3]
 [4 5 6 7]]
'''
print(lower)
'''
[[ 8  9 10 11]
 [12 13 14 15]]
'''

left,right = np.hsplit(grid,[2])
print(left)
'''
[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
'''
print(right)
'''
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]
'''

3、NumPy 数组的计算：通用函数

3.1、通用函数介绍

NumPy 为很多类型的操作提供了非常方便的、静态类型的、可编译程序的接口，也被称作向量操作。

NumPy 中的向量操作的通过通用函数实现的。通用函数的主要目的是对 NumPy 数组中的值执行更快的重复操作。

3.2、探索 NumPy 的通用函数

通用函数有两种存在形式：一元通用函数对单个输入操作，二元通用函数对两个输入操作。

3.2.1、数组的运算

NumPy 通用函数的使用方式非常自然，因为它用到了 Python 原生的算术运算符，标准的加、减、乘、除都可以使用：

x = np.arange(4)
print("x       =",x)	# x = [0 1 2 3]
print("x + 5 =",x + 5)	# x + 5 = [5 6 7 8]
print("x - 5 =",x - 5)	# x - 5 = [-5 -4 -3 -2]
print("x * 2 =",x * 2)	# x * 2 = [0 2 4 6]
print("x / 2 =",x / 2)	# x / 2 = [0.  0.5 1.  1.5]
print("x // 2 =",x // 2)	# x // 2 = [0 0 1 1]

还有求负数、** 表示的指数运算和 % 表示的求模运算的一元通用函数：

print("-x =",-x)	# -x = [ 0 -1 -2 -3]
print("x ** 2 =",x ** 2)	# x ** 2 = [0 1 4 9]
print("x % 2 =",x % 2)	# x % 2 = [0 1 0 1]

所有这些算术运算符都是 NumPy 内置函数的简单封装器：

运算符	对应的通用函数	描述
+	np.add	加法运算
-	np.subtract	减法运算
-	np.negative	负数运算
*	np.multiply	乘法运算
/	np.divide	除法运算
//	np.floor_divide	向下整除运算
**	np.power	指数运算
%	np.mod	模/取余

3.2.2、绝对值

正如 NumPy 能理解 Python 内置的运算操作，NumPy 也可以理解 Python 内置的绝对值函数：

x = np.array([-2,-1,0,1,2])
print(abs(x))	# [2 1 0 1 2]

对应的通用函数是 np.absolute，该函数也可以用别名 np.abs 来访问：

print(np.absolute(x))	# [2 1 0 1 2]
print(np.abs(x))	# [2 1 0 1 2]

这个通用函数也可以用来处理复数。当处理复数时，绝对值返回的是该复数的模：

x = np.array([3-4j,4-3j,2+0j,0+1j])
print(np.abs(x))	#[5. 5. 2. 1.]

3.2.3、三角函数

定义的角度数组：

theta = np.linspace(0,np.pi,3)

现在可以对这些值进行三角函数的计算：

print("theta =",theta)	# theta = [0.         1.57079633 3.14159265]
print("sin(theta) =",np.sin(theta))	# sin(theta) = [0.0000000e+00 1.0000000e+00 1.2246468e-16]
print("cos(theta) =",np.cos(theta))	# cos(theta) = [ 1.000000e+00  6.123234e-17 -1.000000e+00]
print("tan(theta) =",np.tan(theta))	# tan(theta) = [ 0.00000000e+00  1.63312394e+16 -1.22464680e-16]

逆三角函数同样可以使用：

x = [-1,0,1]	
print("x =",x)		# x = [-1, 0, 1]
print("arcsin(x) =",np.arcsin(x))	# arcsin(x) = [-1.57079633  0.          1.57079633]
print("arccos(x) =",np.arccos(x))	# arccos(x) = [3.14159265 1.57079633 0.        ]
print("arctan(x) =",np.arctan(x))	# arctan(x) = [-0.78539816  0.          0.78539816]

3.2.4、指数和对数

指数运算：

x = [-1,0,1]
print("x =",x)		# x = [1, 2, 3]
print("arcsin(x) =",np.arcsin(x))	# e^x = [ 2.71828183  7.3890561  20.08553692]
print("arccos(x) =",np.arccos(x))	# 2^x = [2. 4. 8.]
print("arctan(x) =",np.arctan(x))	# 3^x = [ 3  9 27]

对数运算：

x = [1,2,4,10]
print("x =",x)	# x = [1, 2, 4, 10]
print("ln(x) =",np.log(x))	# ln(x) = [0.         0.69314718 1.38629436 2.30258509]
print("log2(x) =",np.log2(x))	# log2(x) = [0.         1.         2.         3.32192809]
print("log10(x) =",np.log10(x))	# log10(x) = [0.         0.30103    0.60205999 1.        ]

还有一些特殊的版本，对于非常小的输入值可以保持较好的精度：

x = [0,0.001,0.01,0.1]
print("exp(x) - 1 =",np.expm1(x))	# exp(x) - 1 = [0.         0.0010005  0.01005017 0.10517092]
print("log(1+x) =",np.log1p(x))	# log(1+x) = [0.         0.0009995  0.00995033 0.09531018]

3.3、高级的通用函数特性

3.3.1、指定输出

所有的通用函数都可以通过 out 参数来指定计算结果的存放位置：

x = np.arange(5)
y = np.empty(5)
np.multiply(x,10,out=y)
print(y)	# [ 0. 10. 20. 30. 40.]

这个特性也可以被用作数组视图，例如可以将计算结果写入指定数组的每隔一个元素的位置：

y = np.zeros(10)
np.power(2,x,out=y[::2])
print(y)	# [ 1.  0.  2.  0.  4.  0.  8.  0. 16.  0.]

慎重使用 out 可以有效地节约内存。

3.3.2、聚合

有些聚合功能可以直接在对象上计算。例如，如果我们希望用一个特定的运算 reduce 一个数组，那么可以用任何通用函数的 reduce 方法。一个 reduce 方法会对给定的元素和操作重复执行，直至得到单个元素。

例如，对 add 通用函数调用 reduce 方法会返回数组中所有元素的和：

x = np.arange(1,6)
print(x)	# [1 2 3 4 5]
print(np.add.reduce(x))	# 15

同样，对 multiply 通用函数调用 reduce 方法会返回数组中所有元素的乘积：

print(np.multiply.reduce(x))	# 120

如果需要存储每次计算的中间结果，可以使用 accumulate：

print(np.add.accumulate(x))		# [ 1  3  6 10 15]
print(np.multiply.accumulate(x))	# [  1   2   6  24 120]

3.3.3、外积

任何通用函数都可以用 outer 方法获得两个不同输入数组所有元素对的函数运算结果。这意味着，你可以用一行代码实现一个乘法表：

x = np.arange(1,6)
print(np.multiply.outer(x,x))
'''
[[ 1  2  3  4  5]
 [ 2  4  6  8 10]
 [ 3  6  9 12 15]
 [ 4  8 12 16 20]
 [ 5 10 15 20 25]]
'''

通用函数另外一个非常有用的特性是它能够操作不同大小和形状的数组，一组这样的操作被称作广播。

4、聚合：最小值、最大值和其他值

4.1、数组值求和

NumPy 的 sum 函数在编译码中执行操作，所以 NumPy 的操作计算得更快一些。

big_array = np.random.random(1000000)
print(np.sum(big_array))	# 500209.12067471276

4.2、最小值和最大值

print(np.max(big_array))	# 0.9999994392723005
print(np.min(big_array))	# 1.4057692298008462e-06

一种更简洁的语法形式是数组对象直接调用这些方法：

print(big_array.min(),big_array.max(),big_array.sum())	
# 1.4057692298008462e-06 0.9999994392723005 500209.12067471276

4.2.1、多维度的聚合

一种常见的聚合操作是沿着一行或一列聚合。例如，假如你有一些数据存在二维数组上：

M = np.random.random((3,4))
print(M)
'''
[[0.0049466  0.25863997 0.62346477 0.90474173]
 [0.71661557 0.699582   0.80401456 0.60471376]
 [0.43905815 0.73525983 0.3703232  0.57361603]]
'''

默认情况下，每一个 NumPy 聚合函数将会返回对整个数组的聚合结果：

print(M.sum())	# 6.734976167538792

聚合函数还有一个参数，用于指定沿着哪条轴方向进行聚合。例如，可以通过指定 axis = 0 找到找到每一列的最小值：

print(M.min(axis = 0))	# [0.0049466  0.25863997 0.3703232  0.57361603]

axis 关键字指定的是数组将会被折叠的维度，而不是将要返回的维度。因此指定 axis = 0 意味着第一个轴将要被折叠——对于二维数组，这意味着每一列的值将被聚合。

4.2.2、其他聚合函数

函数名称	NaN 安全版本	描述
np.sum	np.nansum	计算元素的和
np.prob	np.nanprob	计算元素的积
np.mean	np.nanmmean	计算元素的平均值
np.std	np.nanstd	计算元素的标准差
np.var	np.nanvar	计算元素的方差
np.min	np.nanmin	找出最小值
np.max	np.nanmax	找出最大值
np.argmin	np.nanargmin	找出最小值的索引
np.argmax	np.nanargmax	找出最大值的索引
np.median	np.nanmedia	计算元素的中位数
np.percentile	np.nanpercentile	计算基于元素排序的统计值
np.any	N/A	验证是否存在元素为真
np.all	N/A	验证所有元素是否为真

5、广播

广播可以简单理解为用于不同大小数组的二元通用函数（加、减、乘等）的一组规则。

5.1、广播的介绍

广播允许二元运算符可以用于不同大小的数组。例如，可以简单地将一个标量（可以认为是一个零维的数组）和一个数组相加。

a = np.array([0,1,2])
print(a + 5)	# [5 6 7]

5.2、广播的规则

NumPy 的广播遵循一组严格的规则，设定这组规则是为了决定两个数组间的操作。

规则1：如果两个数组的维度数不一样，那么小维度数组的形状将会在最左边补 1；
规则 2：如果两个数组的形状在任何一个维度上都不匹配，那么数组的形状会沿着维度为 1 的维度扩展以匹配另外一个数组的形状；
规则 3：如果两个数组的形状在任何一个维度上都不匹配并且没有任何一个维度等于 1，那么会引发异常。

5.3、广播的实际应用

5.3.1、数组的归一化

通用函数可以避免用户写一些很慢的 Python 循环。数组的归一化进一步扩展了这个功能。假设你有一个有 10 个观测值的数组，每个观测值包含 3 个数值。按照惯例，我们将用一个 10 × 3 的数组存放该数据：

X = np.random.random((10,3))

我们可以计算每个特征的均值，计算方法是利用 mean 函数沿着第一个维度聚合：

Xmean = X.mean(0)
print(Xmean)	# [0.51985373 0.29768565 0.38901366]

现在通过从 X 数组的元素中减去这个均值实现归一化（该操作是一个广播操作）：

X_centered = X - Xmean

为了进一步核对我们的处理是否正确，可以查看一下归一化的数组的均值是否接近 0：

print(X_centered.mean(0))	# [-1.11022302e-17  3.88578059e-17  0.00000000e+00]

5.3.2、画一个二维数组

我们希望定义一个函数 z = f(x,y)，可以用广播沿着数值区间计算该函数：

# x 和 y 表示 0~50 个步长的序列
x = np.linspace(0,5,50)
y = np.linspace(0,5,50)[:,np.newaxis]

z = np.sin(x) ** 10 + np.cos(10 + y * x) * np.cos(x)

我们将用 Matplotlib 来画这个二维数组：

import matplotlib.pyplot as plt
plt.imshow(z,origin='lower',extent=[0,5,0,5],cmap='viridis')
plt.colorbar()

6、比较、掩码和布尔逻辑

用掩码开查看和操作 NumPy 数组中的值。当你想基于某些准则来抽取、修改、计数或对一个数组中的值进行其他操作时，掩码就可以派上用场了。

6.1、和通用函数类似的比较操作

NumPy 不仅实现了 +、-、×、/ 和其他一些运算符的数组逐个元素操作，还实现了如 < 和 > 的逐个元素的比较的通用函数。这些比较运算的结果是一个布尔数据类型的数组。一种有 6 种这种操作：

x = np.array([1,2,3,4,5])
print(x < 3)	# [ True  True False False False]
print(x > 3)	# [False False False  True  True]
print(x <= 3)	# [ True  True  True False False]
print(x >= 3)	# [False False  True  True  True]
print(x != 3)	# [ True  True False  True  True]
print(x == 3)	# [False False  True False False]

运算符	对应的通用函数
==	np.equal
!=	np.not_equal
<	np.less
<=	np.less_equal
>	np.greater
>=	np.greater_equal

和算术运算通用函数一样，这些比较运算通用函数也可以用于任意形状、大小的数组。

6.2、操作布尔数组

首先给定一个二维数组：

x = np.array([[5,0,3,3],
              [7,9,3,5],
              [2,4,7,6]])
print(x)

6.2.1、统计记录的个数

如果要统计布尔数组中 True 记录的个数，可以使用 np.count_nonzero 函数：

#统计有多少值小于 6
print(np.count_nonzero(x < 6))	# 8

也可以使用 sum，使用 sum 的好处是可以和其他 NumPy 聚合函数一样，这个求和可以沿着行或列进行：

#每行有多少值小于 6
print(np.sum(x < 6,axis=1))		# [4 2 2]

如要快速检查任意或所有这些值是否为 True，可以用 np.any() 或 np.all() ：

#有没有大于 8 的
print(np.any(x > 8))	# True

#是否所有的值都小于 10
print(np.all(x < 10))	# True

6.2.2、布尔运算

运算符	对应的通用函数
&	np.bitwise_and
\|	np.bitwise_or
^	np.bitwise_xor
~	np.bitwise_not

6.3、将布尔数组作为掩码

通过掩码选择数据的子数据集。例如，我们希望抽取出 x 矩阵中小于 5 的元素：

x = np.array([[5,0,3,3],
              [7,9,3,5],
              [2,4,7,6]])

如前面的方法，利用比较运算符可以得到一个布尔数组：

print(x < 5)
'''
[[False  True  True  True]
 [False False  True False]
 [ True  True False False]]
'''

现在为了将这些值选出，可以进行简单的索引，即掩码操作：

print(x[x < 5])		# [0 3 3 3 2 4]

现在返回的是一个一维数组，它包含了所有满足条件的值。

7、花哨的索引

7.1、探索花哨的索引

它意味着传递一个数组来一次性获得多个数组元素。

rand = np.random.RandomState(42)

x = rand.randint(100,size=10)
print(x)	# [51 92 14 71 60 20 82 86 74 74]

假设我们希望获得三个不同的元素，可以用下列方式实现:

print([x[3],x[7],x[2]])		# [71, 86, 14]

另一种方法是通过传递索引的单个列表或数组来获得同样的结果：

ind = [3,7,2]
print(x[ind])	# [71 86 14]

利用花哨的索引，结果的形状与索引数组的形状一致，而不是与被索引数组的形状一致：

ind = np.array([[3,7],
               [4,5]])
print(x[ind])	
'''
[[71 86]
 [60 20]]
'''

花哨的索引也对多个维度适用。假设我们有以下数组：

X = np.arange(12).reshape((3,4))
print(X)
'''
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
'''

和标准索引一样，第一个索引指的是行，第二个索引指的是列：

row = np.array([0,1,2])
col = np.array([2,1,3])
print(X[row,col])		# [ 2  5 11]

7.2、组合索引

print(X)
'''
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
'''

可以将花哨的索引与简单的索引相组合使用：

print(X[2,[2,0,1]])		# [10  8  9]

也可以将花哨的索引获和切片组合使用：

print(X[1:,[2,0,1]])
'''
[[ 6  4  5]
 [10  8  9]]
'''

更可以将花哨的索引与掩码组合使用：

mask = np.array([1,0,1,0],dtype=bool)
print(X[row[:,np.newaxis],mask])
'''
[[ 0  2]
 [ 4  6]
 [ 8 10]]
'''

7.3、用花哨的索引修改值

假设我们有一个索引数组，并且希望设置数组中对应的值：

x = np.arange(10)
i = np.array([2,1,8,4])
x[i] = 99
print(x)	# [ 0 99 99  3 99  5  6  7 99  9]

可以用任何的赋值操作来实现：

x[i] -= 10
print(x)	# [ 0 89 89  3 89  5  6  7 89  9]

不过操作重复的索引可能会产生一些出乎意料的结果：

x = np.zeros(10)
x[[0,0]] = [4,6]
print(x)		# [6. 0. 0. 0. 0. 0. 0. 0. 0. 0.]		4 被覆盖了

i = [2,3,3,4,4,4]
x[i] += 1
print(x)		# [6. 0. 1. 1. 1. 0. 0. 0. 0. 0.]

没有发生累加。改变的方法是使用 at() 方法：

x = np.zeros(10)
np.add.at(x,i,1)
print(x)		# [0. 0. 1. 2. 3. 0. 0. 0. 0. 0.]

8、数组的排序

8.1、NumPy 中的快速排序：np.sort 和 np.argsort

默认情况下，np.sort 的排序算法是快速排序。

如果想在不修改原始输入数组的基础上返回一个排好序的数组，可以用 np.sort：

x = np.array([2,1,4,3,5])
print(np.sort(x))	# [1 2 3 4 5]

如果希望用排好序的数组替代原始数组，可以使用数组的 sort 方法：

x.sort()
print(x)	# [1 2 3 4 5]

另外一个相关的函数是 argsort，该函数返回的是原始数组排好序的索引值：

x = np.array([2,1,4,3,5])
i = np.argsort(x)
print(i)		# [1 0 3 2 4]

这些索引可以被用于（通过花哨的索引）创建有序数组：

print(x[i])		# [1 2 3 4 5]

沿着行或列进行排序

NumPy 排序算法的一个有用的功能是通过 axis 参数，沿着多维数组的行或列进行排序：

rand = np.random.RandomState(42)
X = rand.randint(0,10,(4,6))
print(X)
'''
[[6 3 7 4 6 9]
 [2 6 7 4 3 7]
 [7 2 5 4 1 7]
 [5 1 4 0 9 5]]
'''

对 X 的每一列进行排序：

print(np.sort(X,axis=0))
'''
[[2 1 4 0 1 5]
 [5 2 5 4 3 7]
 [6 3 7 4 6 7]
 [7 6 7 4 9 9]]
'''

对 X 的每一行进行排序：

print(np.sort(X,axis=1))
'''
[[3 4 6 6 7 9]
 [2 3 4 6 7 7]
 [1 2 4 5 7 7]
 [0 1 4 5 5 9]]
'''

8.2、部分排序：分隔

有时候我们并不希望对整个数组进行排序，仅仅希望找到数组中第 K 小的值，NumPy 的 np.partition 函数提供了该功能。np.partition 函数输入的数组和数字 K，输出结果是一个新数组，最左边的是第 K 小的值，往右的任意顺序的其他值。

x = np.array([7,2,3,1,6,5,4])
print(np.partition(x,3))	# [2 1 3 4 6 5 7]

注意，结果数组中前三个值是数组中最小的三个值，剩下的位置是原始数组中剩下的值。在这两个分隔区中，元素都是任意排序的。

与排序类似，也可以沿着多维数组任意的轴进行分隔：

print(X)
'''
[[6 3 7 4 6 9]
 [2 6 7 4 3 7]
 [7 2 5 4 1 7]
 [5 1 4 0 9 5]]
'''
print(np.partition(X,2,axis=1))
'''
[[3 4 6 7 6 9]
 [2 3 4 7 6 7]
 [1 2 4 5 7 7]
 [0 1 4 5 9 5]]
'''

9、结构化数据：NumPy 的结构化数组

假定现在有关一些人的分类数据（如姓名、年龄和体重），现在需要存储这些数据用于 Python 项目。

通过指定复合数据类型，可以构造一个结构化数组：

data = np.zeros(4,dtype={
     'names':('name','age','weight'),'formats':('U10','i4','f8')})
print(data.dtype)
# [('name', '

现在生成了一个空的数组容器，可以将列表数据放入数组中：

name = ['Alice','Bob','Cathy','Doug']
age = [25,45,37,19]
weight = [55.0,85.5,68.0,61.5]

data['name'] = name
data['age'] = age
data['weight'] = weight
print(data)	
# [('Alice', 25, 55. ) ('Bob', 45, 85.5) ('Cathy', 37, 68. ) ('Doug', 19, 61.5)]

所有的数据都放在了一个内存块中。

结构化数组的方便之处在于，你可以通过索引值或名称查看相应的值：

#获取所有名字
print(data['name'])		# ['Alice' 'Bob' 'Cathy' 'Doug']

#获取数据第一行
print(data[0])		# ('Alice', 25, 55.)

利用布尔掩码，还可以做一些更复杂的操作，如按照年龄进行筛选：

print(data[data['age'] < 30]['name'])	# ['Alice' 'Doug']

9.1、生成结构化数组

结构化数组的数据类型有多种制定方式。此前我们看到的是采用字典的方法：

print(np.dtype({
     'names':('name','age','weight'),
                'formats':('U10','i4','f8')}))
# [('name', '

符合类型也可以是元组列表：

print(np.dtype([('name','S10'),('age','i4'),('weight','f8')]))
# [('name', 'S10'), ('age', '

NumPy 数据类型符号	描述
‘b’	字节型
‘i’	有符号整型
‘u’	无符号整型
‘f’	浮点数
‘c’	复数浮点数
‘S’、‘a’	字符串
‘U’	Unicode 编码字符串
‘V’	原生数据、raw data（空，void）

9.2、更高级的复合类型

你可以创建一种类型，其中每个元素都包含一个数组或矩阵。

tp = np.dtype([('id','i8'),('mat','f8',(3,3))])
X = np.zeros(1,dtype=tp)
print(X[0])		# (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
print(X['mat'][0])	
'''
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
'''

9.3、记录数组：结构化数组的扭转

NumPy 还提供了 np.recarry 类。它和前面介绍的结构化数组几乎相同，但是它有一个独特第特征：域可以像属性一样获取，而不是像字典的键那样获取。前面的例子通过以下方式获取年龄：

print(data['age'])	# [25 45 37 19]

如果将这些数据当做一个记录数组，我们可以用很少的按键获取这个结果：

data_rec = data.view(np.recarray)
print(data_rec.age)		# [25 45 37 19]

记录数组的不好之处在于，即使使用同样的语法，在获取域时也会有一些额外的开销。

你可能感兴趣的:(Python数据科学,机器学习,python)

python基于django/flask网上书城系统Django-SpringBoot-php-Node.js-flask QQ_1963288475 python django flask spring boot php laravel node.js
目录技术栈介绍具体实现截图![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/7b88ca45e7124106a000075acaf2f4e8.png)系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研
使用python反射，实现pytest读取yaml并发送请求南部余额 python python pytest
pytest+yamlyaml-feature:用户模块story:登录title:添加用户request:method:POSTurl:/system/user/listheaders:nullparams:nullvalidate:nullread_yaml_alldefread_yaml_all(path):withopen(path,'r',encoding='utf-8')asf:val
Github2025-03-10 开源项目周报 Top13 老孙正经胡说开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2025-03-10统计)共有13个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7TypeScript项目2JavaScript项目2C++项目1JupyterNotebook项目1Vue项目1文档项目1Rust项目1Svelte项目1从零开始构建你喜爱的技术创建周期：2156天Star数量：253338个For
机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
Python的Numpy数组np.array()基本用法详解（二）苏雨流丰 Python30Days python 开发语言 numpy array
本节主要讲授array获取元素、转置、重塑等方法"""@Date:2022-01-21@Author:苏雨流丰@lang:Python@summary:访问、获取np.array的元素"""导入numpy包importnumpyasnp初始化工作np_34_list=[[1,3,5,7],[2,4,6,8],[1,2,5,6]]np_44_list=[[1,3,5,7],[2,4,6,8],[1,
python-git- GitHub 45度看我 github
python之git-GitHub一：github原文链接二：WhatisGitHub1>创建仓库2>创建分支3>提交修改4>发起PullRequest三：理解GitHub流四：创建你的GitHub主页1>setting-->“Commitchanges”按钮五：典型的项目1>社区（TheCommunity）2>文档（TheDocs）3>Issue创建一个问题单4>PullRequest六：Git
Python基础语法（二）：条件、循环与运算符算法工程师y python 开发语言
本篇Python基础语法（二）将深入讲解编程中至关重要的条件判断、循环结构和运算符，它们是实现复杂逻辑的基石。一、条件语句（if-elif-else）条件语句用于根据不同的条件执行不同的代码块。Python中用if、elif（elseif的缩写）和else实现。1.基本语法age=18ifage（大于）、大于10>5→True=大于等于5>=5→True3)and(2<4)→Trueor任一条件为
【python爬虫实战】——基于全国各城市快递网点的数据采集小L工程师 python爬虫实战爬虫网络爬虫 python selenium 开发语言数据分析数据可视化
一、项目背景随着电子商务的快速发展，快递行业成为了现代物流的重要组成部分。快递网点的分布和服务质量直接影响到用户的物流体验。为了更好地了解快递网点的分布情况、服务范围以及联系方式等信息，本项目通过爬虫技术从公开的快递信息网站上采集相关数据。‘>本文章中所有内容仅供学习交流使用，不用于其他任何目的，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！二、项目目的和意义本项目的主要目的是通
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
学习Web3.0需要具备哪些基础知识？ alankuo 人工智能人工智能
学习Web3.0需要具备以下基础知识：一、计算机科学基础1.编程知识-了解至少一种编程语言，如Python、JavaScript等。这将有助于理解Web3.0应用程序的开发和智能合约的编写。-熟悉编程概念，如变量、数据类型、控制结构、函数等。2.数据结构和算法-掌握常见的数据结构，如数组、链表、栈、队列、树、图等，以及它们的操作和应用。-了解基本的算法，如排序、搜索、递归等，以及它们的时间和空间复
PyTorch中，将`DataLoader`加载的数据高效传输到GPU 大霸王龙 pytorch 人工智能 python
一、数据加载到GPU的核心步骤数据预处理与张量转换若原始数据为NumPy数组或Python列表，需先转换为PyTorch张量：X_tensor=torch.from_numpy(X).float()#转换为浮点张量y_tensor=torch.from_numpy(y).long()#分类任务常用长整型显式指定设备：通过.to(device)将数据移至GPU（需提前定义device对象）：devi
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
cmd运行python脚本找不到包_命令行执行python模块时提示包找不到的问题 weixin_39788960
庄稼人不是专职python开发的道友，虽然与python相识已多年，可惜相识不相知，只是偶尔借助pydev写一些简单的小工具。多年来，一直困惑于这样一个问题：同样的工程，同样的代码，使用pydev可以运行任意一个python脚本，而使用命令行运行却不行？命令行下(或者双击执行)总是提示“ImportError:Nomodulenamedxxx”？pydev究竟做了什么魔术呢？长话短说，以上面工程为
Python报错：moduleNotFoundError:No module named ‘exceptions‘ 南浔Pyer 报错解决 Python编程
报错如下：使用pipinstalldocx安装模块docx后，发现不能正常使用，并报错：fromexceptionsimportPendingDeprecationWarningModuleNotFoundError:Nomodulenamed'exceptions'解决方法卸载原来安装的docxpipuninstalldocx安装python-docx模块即可pipinstallpython-d
Python如何设置工作目录飞起来fly呀 Python python 开发语言
在Python编程中，正确设置工作目录是文件系统操作的关键步骤之一。工作目录影响到相对路径的解析，确保程序能正确访问所需的文件和资源。为方便大家理解和使用，这里详细介绍如何在Python中利用os模块设置工作目录，并以此实现更灵活的文件操作。使用os模块设置工作目录Python的os模块提供了操作系统相关的功能，包括目录和文件操作。你可以用这个模块来更改当前的工作目录，以匹配你项目的需要。1.设置
【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART） SmallBambooCode 机器学习人工智能 python 算法 scikit-learn 决策树机器学习 ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
Python 3.14版本的彩蛋
使用3.14版本的Python创建一个虚拟环境，会看到在虚拟环境的bin目录中，不仅有python3、python3.14等常规文件，竟然还存在一个特殊的文件thon。/tmp/venv/bin$lltotal72...-rwxr-xr-x1useruser290BMar510:57pip3.14*lrwxr-xr-x1useruser10BMar510:57python@->python.exe
【Python】执行脚本的时，如何指定运行根目录，而不是指定脚本的父级目录 jwensh #Python python
author:jwensh&gptdate:2024.09.23python执行脚本的时，如何指定运行根目录，而不是指定脚本的父级目录prompt：python执行脚本的时候，如何指定他的运行根目录，而不是指定脚本的父级目录在执行Python脚本时，如果你想指定一个自定义的运行根目录，而不是默认的脚本所在目录，可以使用以下几种方式：1.通过os.chdir()修改当前工作目录在脚本中使用os.ch
python系列：解决：ModuleNotFoundError: No module named ‘exceptions’ 坦笑&&life #python python 开发语言
解决：ModuleNotFoundError:Nomodulenamed‘exceptions’解决：ModuleNotFoundError:Nomodulenamed‘exceptions’背景报错问题报错位置代码报错原因解决方法其他解决办法注意：此时有以下几种解决办法：1.升级代码或模块以支持Python3。2.如果你必须使用Python2，请确保你的代码或模块与Python2兼容。3.如果你
使用Python Flask构建Web应用程序代码快速拳 python flask 前端 Python
Flask是一个轻量级的PythonWeb框架，它提供了构建Web应用程序所需的基本功能。它简单易用，非常适合小型项目和原型开发。本文将介绍如何使用Flask构建一个简单的Web应用程序，并提供相应的源代码。首先，我们需要安装Flask。可以使用以下命令使用pip安装Flask：pipinstallflask一旦安装完成，我们就可以开始构建我们的Web应用程序了。首先，创建一个Python文件，命
2024年一文1800字从0到1使用Python Flask实战构建Web应用(1) 2401_84564025 程序员 python flask 前端
现在我也找了很多测试的朋友，做了一个分享技术的交流群，共享了很多我们收集的技术文档和视频教程。如果你不想再体验自学时找不到资源，没人解答问题，坚持几天便放弃的感受可以加入我们一起交流。而且还有很多在自动化，性能，安全，测试开发等等方面有一定建树的技术大牛分享他们的经验，还会分享很多直播讲座和技术沙龙可以免费学习！划重点！开源的！！！qq群号：110685036第三部分：运行Flask应用在app.
【python web】一文掌握 Flask 的基础用法数据知道 python 前端 flask
文章目录一、Flask介绍1.1安装Flask二、Flask的基本使用2.1创建第一个Flask应用2.2路由与视图函数2.3请求与响应2.4响应对象2.5模板渲染2.6模板继承2.7静态文件管理2.8Blueprint蓝图2.9错误处理三、Flask扩展与插件四、部署Flask应用五、总结Flask是一个轻量级的PythonWeb框架，因其简单易用、灵活性高而受到广泛欢迎。本文将全面介绍Flas
python绘制密度散点图龟速前进 anaconda 可视化 python
头大，外行人做个图咋这么难，趋势线还没有研究出来怎么加上去，哎importmatplotlib.pyplotaspltfromscipy.statsimportgaussian_kdefrommpl_toolkits.axes_grid1importmake_axes_locatableimportnumpyasnpimportpandasaspdfromdbfreadimportDBFdata=
python colorama_Python colorama 模块使用说明 weixin_39682697 python colorama
1Colorama模块说明在上篇博客我们了解了prettytable的使用,如下：https://www.cndba.cn/cndba/dave/article/3564使用prettytable模块之后，输出的内容格式看上去会非常整齐，但如果我们想要对部分内容重点显示，那么可以使用两种方法：1)直接使用Python控制输出颜色2)使用colorama模块Colorama是一个python专门用来
python colorama模块失效怎么办_python – 由于模块colorama,无法使用aws CLI 金牛远望号 python colorama模块失效怎么办
我已经安装了AWSCLI,并尝试在MacOSSierra上使用它.它抱怨没有模块colorama：$awsTraceback(mostrecentcalllast):File"/usr/local/bin/aws",line19,inimportawscli.clidriverFile"/Library/Python/2.7/site-packages/awscli/clidriver.py",l
数据可视化：python画散点图scatter 西红柿爱吃小番茄 python python 数据可视化 matplotlib
数据可视化：python画散点图scatter我想遍历一幅图的所有像素的h分量的值，然后用散点图表示出来。观察这幅图的h分量的值得变化范围。scatter函数的原型matplotlib.pyplot.scatter(x,y,s=20,c='b',marker='o',cmap=None,norm=None,vmin=None,vmax=None,linewidths=None,vert=None,
Python Colorama 库详解：终端输出美化的神器萧鼎 python基础到进阶教程 python
PythonColorama库详解：终端输出美化的神器在开发命令行工具或调试程序时，我们可能会希望通过颜色来区分重要信息，比如警告、错误、提示等。而Colorama是一个简单易用的Python库，可以帮助我们轻松地为终端输出添加颜色，提升用户体验。1.Colorama是什么？Colorama是一个Python库，用于在终端中实现跨平台的彩色文本输出。它主要提供以下功能：为文本添加前景色、背景色。控
Python之colorama PlutoZuo Python python 开发语言
Python之colorama文章目录Python之colorama1.安装Colorama库2.导入Colorama库3.初始化Colorama4.设置文本颜色和样式5.自定义颜色和样式Colorama是一个Python库，用于在控制台（终端）上输出彩色文本。它提供了一些方便的函数和类，用于在命令行界面中添加颜色和样式。以下是一些使用Colorama库的详细示例：1.安装Colorama库首先，
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
python进阶语法，函数的基本使用胡萝卜糊了 python java 服务器
#函数定义：#格式：def函数标识符（参数列表）：#定义无参函数defsay_hello():print("helloworld!")print("helloeveryone!")#定义有参函数defmymax(a,b):ifa>b:print("最大值是",a)else:print("最大值是",b)#函数调用#格式：函数名（实际参数列表）#函数调用时需要注意实参要和形参数量一致say_hell
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$