琴酒网络

Python数据分析：Numpy

一：Numpy简介
二：Numpy基础数据结构
三：创建数组
- 3.1 linspace
- 3.2 zeros创建数据
- 3.3 eye创建数组
四：Numpy通用函数
- 4.1 转置 (T)
- 4.2 reshape
- 4.3 resize
五：数组的复制
六：数组类型转换（astype）
七：数组堆叠
- 7.1 hstack
- 7.2 vstack
- 7.3 stack
八：数组的拆分
- 8.1 hsplit
- 8.2 vsplit
九：数组的算术运算
十：数组的切片操作
十一：聚合函数
十二：矩阵操作
十三：矩阵的算术运算
十四：矩阵的切片和聚合
十五：NumPy中的公式应用示例
十六：用NumPy表示日常数据
十七：图像
十八：语言
十九：Numpy随机数
- 19.1 normal
- 19.2 rand
- 19.3 randint
二十：Numpy数据的输入输出

一：Numpy简介

NumPy是Python中用于数据分析、机器学习、科学计算的重要软件包。它极大地简化了向量和矩阵的操作及处理。python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分（例如scikit-learn、SciPy、pandas和tensorflow）。除了数据切片和数据切块的功能之外，掌握numpy也使得开发者在使用各数据处理库调试和处理复杂用例时更具优势。

安装Numpy：

pip install numpy

二：Numpy基础数据结构

Numpy数组是一个多维数组对象，称为ndarray，由两部分组成

实际的数据
描述这些数据的元数据

import numpy as np
arr = np.array(
    [
        [1,2,3,4,5,6],
        [7,8,9,10,11,12]
    ]
)
print(arr, type(arr))				# [[ 1  2  3  4  5  6] [ 7  8  9 10 11 12]] 
print(arr.ndim)						# 2，输出数组维度的个数（轴数），或者说“秩”，维度的数量也称为rank
print(arr.shape)					# (3, 6)，三行六列
print(arr.size)						# 18，总元素个数
print(arr.dtype)					# int32，元素的数据类型
print(arr.itemsize)					# 4，每个元素的字节大小
print(arr.data)						# ，整个数组元素的缓冲区

三：创建数组

我们可以通过将python列表传入np.array来创建一个NumPy数组（也就是强大的ndarray）。在下面的例子里，创建出的数组如右边所示，通常情况下，我们希望NumPy为我们初始化数组的值，为此NumPy提供了诸如ones，zeros和random.random之类的方法。我们只需传入元素个数即可：

arr1 = np.array(range(10))
print(arr1)
arr2 = np.arange(10)
print(arr2)
arr3 = np.array([[1,2,3,4],[5,6,7,8]])
# arr3元素中只要有一个元素为str类型，那么所有的元素都会被转换为str类型数据
# arr3中如果两个列表中的元素个数相等，就是二维数组；如果元素个数不相等，会变成一维数组
print(arr3)
arr4 = np.random.rand(10).reshape(2,5)
# arr4：先给数组随机生成10个元素，然后将形状改变为2行5列
print(arr4)

3.1 linspace

# linspace()：返回在间隔【开始，停止】上计算的num个均匀间隔的样本
arr6 = np.linspace(10,20,num = 21)	# num=21将10-20平均分成20份
print(arr6)
# [10.  10.5 11.  11.5 12.  12.5 13.  13.5 14.  14.5 15.  15.5 16.  16.5
# 17.  17.5 18.  18.5 19.  19.5 20. ]
# np.linspace(10, 20, num=21, endpoint=False)	# endpoint默认为True，即包含20；如为False则不包含20，即10-19
arr6 = np.linspace(10,20,num = 21, retstep=True)	# retstep为True，表示显示步长
print(arr6)
# (array([10. , 10.5, 11. , 11.5, 12. , 12.5, 13. , 13.5, 14. , 14.5, 15. ,
#       15.5, 16. , 16.5, 17. , 17.5, 18. , 18.5, 19. , 19.5, 20. ]), 0.5)

3.2 zeros创建数据

# 创建元素都为0的数组
arr1 = np.zeros((3,5))		# 元素默认为浮点数类型，第一个参数为指定数组形状
print(arr1)
arr2 = np.zeros((3,5), dtype=np.int)		# 元素为整型，默认为int32

还有一个与zeros用法相似的np.ones

# 创建元素都为1的数组
arr = np.ones(9)
arr1 = np.ones((2,3,4))
print(arr)
print(arr1)

3.3 eye创建数组

arr1 = np.eye(5)		# 创建一个正方的N*N的单位矩阵，对角线值为1，其余为0
print(arr1)
#[[1. 0. 0. 0. 0.]
# [0. 1. 0. 0. 0.]
# [0. 0. 1. 0. 0.]
# [0. 0. 0. 1. 0.]
# [0. 0. 0. 0. 1.]]

四：Numpy通用函数

4.1 转置 (T)

T方法：转置。如：原shape为（3，4）/（2，3，4），转置后为（4，3）/（4，3，2），所以一维数组转置后结果不变

arr1 = np.arange(10)
arr2 = np.zeros((2,5))	# 2行5列的数组
print(arr1.shape)		# (10,)
print(arr2.shape)		# (2, 5)
print(arr1.T)
print(arr2.T)

arr2原shape为两行五列的数组：

[
	[0. 0. 0. 0. 0.]
 	[0. 0. 0. 0. 0.]
]

经过T方法转置后变成五行两列的数组：

[
	[0. 0.]
 	[0. 0.]
 	[0. 0.]
 	[0. 0.]
 	[0. 0.]
]

4.2 reshape

重置数组的形状，但是注意：重置前后数组中的元素个数必须要保持一致。

arr1 = np.arange(10)
print(arr1)
print(arr1.reshape(2,5))
print(arr1.reshape(5,2))

[0 1 2 3 4 5 6 7 8 9]
[[0 1 2 3 4]
 [5 6 7 8 9]]
[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]

带三个参数的reshape：

arr1 = np.arange(12).reshape(3,2,2)    # 三个两行两列的数组
print(arr1)

[[[ 0  1]
  [ 2  3]]

 [[ 4  5]
  [ 6  7]]

 [[ 8  9]
  [10 11]]]

4.3 resize

arr1 = np.arange(5)
print(arr1)
print(np.resize(arr1, (3,4)))

[0 1 2 3 4]
[[0 1 2 3]
 [4 0 1 2]
 [3 4 0 1]]

resize返回一个新的形状的数组，不要元素个数相等。
如果元素个数少于resize指定的元素个数（3,4），即3*4=12个元素，那么resize会将元素随机排序形成新的数组元素；如果多于resize指定的元素个数，那么resize会将多于的元素丢弃。

五：数组的复制

arr1 = np.arange(10)
arr2 = arr1
print(arr1 is arr2)
arr1[2] = 100
print(arr1 is arr2)
# True
# True

通过上面的实例可以看出，赋值操作，arr1数组与arr2数组是完全一样的，改变两个数组中的任何一个元素，另一个数组中的元素也会随着改变。
如果想得到一个新的数组，可以使用copy方法

arr1 = np.arange(10)
arr2 = arr1.copy()
print(arr1 is arr2)
arr1[2] = 100
print(arr1)
print(arr2)

False
[  0   1 100   3   4   5   6   7   8   9]
[0 1 2 3 4 5 6 7 8 9]

六：数组类型转换（astype）

arr1 = np.arange(10, dtype = float)
print(arr1)
arr2 = arr1.astype(np.int64)
print(arr2, arr2.dtype)

[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]
[0 1 2 3 4 5 6 7 8 9] int64

七：数组堆叠

7.1 hstack

数组横向连接：

arr1 = np.arange(5)
arr2 = np.arange(5,9)
print(arr1)
print(arr2)
print(np.hstack((arr1,arr2)))   # 横向连接

[0 1 2 3 4]
[5 6 7 8]
[0 1 2 3 4 5 6 7 8]

7.2 vstack

数组竖向连接（元素个数必须要相同）：

arr3 = np.array([[1],[2],[3]])
arr4 = np.array([['a'],['b'],['c']])
print(np.vstack((arr3,arr4)))   # 竖向连接

[['1']
 ['2']
 ['3']
 ['a']
 ['b']
 ['c']]

7.3 stack

任意堆叠（stack）：

arr1 = np.arange(5)
arr2 = np.arange(5,10)
print(arr1)
print(arr2)
# [0 1 2 3 4]
# [5 6 7 8 9]

print(np.stack((arr1,arr2)))   # 参数axis值默认为0
[[0 1 2 3 4]
 [5 6 7 8 9]]

print(np.stack((arr1,arr2), axis = 1))
[[0 5]
 [1 6]
 [2 7]
 [3 8]
 [4 9]]

八：数组的拆分

8.1 hsplit

arr1 = np.arange(16).reshape(4,4)
print(arr1)
print(np.hsplit(arr1,2))

[
	[ 0  1  2  3]
 	[ 4  5  6  7]
 	[ 8  9 10 11]
 	[12 13 14 15]
]
[
	array([
		[ 0,  1],
       	[ 4,  5],
       	[ 8,  9],
       	[12, 13]]), 
   array([
   		[ 2,  3],
       	[ 6,  7],
       	[10, 11],
       	[14, 15]])
]

8.2 vsplit

print(np.vsplit(arr1,2))

[
	array([
	[0, 1, 2, 3],
    [4, 5, 6, 7]]), 
    array([
    [ 8,  9, 10, 11],
    [12, 13, 14, 15]])
]

九：数组的算术运算

让我们创建两个NumPy数组，分别称作data和ones：

若要计算两个数组的加法，只需简单地敲入data + ones，就可以实现对应位置上的数据相加的操作（即每行数据进行相加），这种操作比循环读取数组的方法代码实现更加简洁。

许多情况下，我们希望进行数组和单个数值的操作（也称作向量和标量之间的操作）。比如：如果数组表示的是以英里为单位的距离，我们的目标是将其转换为公里数。可以简单的写作data * 1.6：

NumPy通过数组广播（broadcasting）知道这种操作需要和数组的每个元素相乘。

十：数组的切片操作

我们可以像python列表操作那样对NumPy数组进行索引和切片，如下图所示：

arr = np.array([
    [1,2,3,4],
    [5,6,7,8],
    [11,22,33,44],
    [55,66,77,12],
    [88,99,78,79]
])
# 取行
print(arr[2])           # 取第3行
print(arr[2:])          # 取第3行到末行
print(arr[[2,4]])       # 取不连续的行，第3行与第5行
print('=' * 100)
# 取列（逗号前表示行，后表示列）
print(arr[:,0])         # 第1列
print(arr[:, 2:])       # 取第3列到最后列
print(arr[:, [0,2]])    # 取第1列，第3列
print('=' * 100)
# 取行又取列
print(arr[2:4,1:3])     # 取第3行到第5行，第2列到第4列（含头不含尾）

输出结果：

[11 22 33 44]
[[11 22 33 44]
 [55 66 77 12]
 [88 99 78 79]]
[[11 22 33 44]
 [88 99 78 79]]
====================================================================================================
[ 1  5 11 55 88]
[[ 3  4]
 [ 7  8]
 [33 44]
 [77 12]
 [78 79]]
[[ 1  3]
 [ 5  7]
 [11 33]
 [55 77]
 [88 78]]
====================================================================================================
[[22 33]
 [66 77]]

十一：聚合函数

NumPy为我们带来的便利还有聚合函数，聚合函数可以将数据进行压缩，统计数组中的一些特征值：

除了min，max和sum等函数，还有mean（均值），prod（数据乘法）计算所有元素的乘积，std（标准差），等等。上面的所有例子都在一个维度上处理向量。除此之外，NumPy之美的一个关键之处是它能够将之前所看到的所有函数应用到任意维度上。

十二：矩阵操作

我们可以通过将二维列表传给Numpy来创建矩阵。

np.array([[1,2],[3,4]])

除此外，也可以使用上文提到的ones、zeros和random.random来创建矩阵，只需传入一个元组来描述矩阵的维度：

十三：矩阵的算术运算

对于大小相同的两个矩阵，我们可以使用算术运算符（±*/）将其相加或者相乘。NumPy对这类运算采用对应位置（position-wise）操作处理：

对于不同大小的矩阵，只有两个矩阵的维度同为1时（例如矩阵只有一列或一行），我们才能进行这些算术运算，在这种情况下，NumPy使用广播规则（broadcast）进行操作处理：

与算术运算有很大区别是使用点积的矩阵乘法。NumPy提供了dot方法，可用于矩阵之间进行点积运算：

十四：矩阵的切片和聚合

索引和切片功能在操作矩阵时变得更加有用。可以在不同维度上使用索引操作来对数据进行切片。

不仅可以聚合矩阵中的所有值，还可以使用axis参数指定行和列的聚合：

处理矩阵时经常需要对矩阵进行转置操作，常见的情况如计算两个矩阵的点积。NumPy数组的属性T可用于获取矩阵的转置。

在较为复杂的用例中，你可能会发现自己需要改变某个矩阵的维度。这在机器学习应用中很常见，例如模型的输入矩阵形状与数据集不同，可以使用NumPy的reshape方法。只需将矩阵所需的新维度传入即可。也可以传入-1，NumPy可以根据你的矩阵推断出正确的维度：

上文中的所有功能都适用于多维数据，其中心数据结构称为ndarray（N维数组）。

很多时候，改变维度只需在NumPy函数的参数中添加一个逗号，如下图所示：

十五：NumPy中的公式应用示例

NumPy的关键用例是实现适用于矩阵和向量的数学公式。这也Python中常用NumPy的原因。例如，均方误差是监督机器学习模型处理回归问题的核心：

在NumPy中可以很容易地实现均方误差：

这样做的好处是，numpy无需考虑predictions与labels具体包含的值。文摘菌将通过一个示例来逐步执行上面代码行中的四个操作：

预测（predictions）和标签（labels）向量都包含三个值。这意味着n的值为3。在我们执行减法后，我们最终得到如下值：

十六：用NumPy表示日常数据

日常接触到的数据类型，如电子表格，图像，音频…等，如何表示呢？Numpy可以解决这个问题。
电子表格或数据表都是二维矩阵。电子表格中的每个工作表都可以是自己的变量。python中类似的结构是pandas数据帧（dataframe），它实际上使用NumPy来构建的。

音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。CD质量的音频每秒可能有44,100个采样样本，每个样本是一个-65535到65536之间的整数。这意味着如果你有一个10秒的CD质量的WAVE文件，你可以将它加载到长度为10 * 44,100 = 441,000个样本的NumPy数组中。想要提取音频的第一秒？只需将文件加载到我们称之为audio的NumPy数组中，然后截取audio[:44100]。

时间序列数据也是如此（例如，股票价格随时间变化的序列）。

十七：图像

图像是大小为（高度×宽度）的像素矩阵。如果图像是黑白图像（也称为灰度图像），则每个像素可以由单个数字表示（通常在0（黑色）和255（白色）之间）。如果对图像做处理，裁剪图像的左上角10 x 10大小的一块像素区域，用NumPy中的image[:10,:10]就可以实现。

如果图像是彩色的，则每个像素由三个数字表示：红色，绿色和蓝色。在这种情况下，我们需要第三维（因为每个单元格只能包含一个数字）。因此彩色图像由尺寸为(高x宽x 3）的ndarray表示。

十八：语言

如果我们处理文本，情况就会有所不同。用数字表示文本需要两个步骤，构建词汇表（模型知道的所有唯一单词的清单）和嵌入（embedding）。让我们看看用数字表示这个（翻译的）古语引用的步骤：“Have the bards who preceded me left any theme unsung?”

模型需要先训练大量文本才能用数字表示这位战场诗人的诗句。我们可以让模型处理一个小数据集，并使用这个数据集来构建一个词汇表（71,290个单词）：

然后可以将句子划分成一系列“词”token（基于通用规则的单词或单词部分）：

然后我们用词汇表中的id替换每个单词：

这些ID仍然不能为模型提供有价值的信息。因此，在将一系列单词送入模型之前，需要使用嵌入（embedding）来替换token/单词（在本例子中使用50维度的word2vec嵌入)：

你可以看到此NumPy数组的维度为[embedding_dimension x sequence_length]。

在实践中，这些数值不一定是这样的，但我以这种方式呈现它是为了视觉上的一致。出于性能原因，深度学习模型倾向于保留批数据大小的第一维（因为如果并行训练多个示例，则可以更快地训练模型）。很明显，这里非常适合使用reshape。例如，像BERT这样的模型会期望其输入矩阵的形状为：[batch_size，sequence_length，embedding_size]。

这是一个数字合集，模型可以处理并执行各种有用的操作。我留空了许多行，可以用其他示例填充以供模型训练（或预测）。

事实证明，在我们的例子中，那位诗人的话语比其他诗人的诗句更加名垂千古。尽管生而为奴，诗人安塔拉（Antarah）的英勇和语言能力使他获得了自由和神话般的地位，他的诗是伊斯兰教以前的阿拉伯半岛《悬诗》的七首诗之一。

十九：Numpy随机数

numpy.random包含多种概率分布的随机样本，是数据分析辅助的重点工具之一。

19.1 normal

print(np.random.normal(size = (4,4)))	# 生成四行四列的数组

[[ 0.58060145 -1.37796471  0.76148182 -1.57750076]
 [ 0.63511395 -0.80521374 -1.58209363 -1.33898238]
 [-0.12763347 -0.5719946  -0.06165193  0.55572598]
 [ 1.732809    0.32639484 -1.30179119  0.48939601]]

19.2 rand

print(np.random.rand())     # 默认生成0-1之间的随机浮点数
print(np.random.rand(4))    # 生成一维四元素数组
print(np.random.rand(2,4))  # 生成二维四元素数组，元素为0-1的随机浮点数

19.3 randint

numpy.random.randint(low, high=None, size=None, dtype='1');

生成一个整数或N维整数数组
若high不为None时，取[low,high]之间随机整数，否则取值[0, low]之间随机数，且hight必须大于low
dtype参数：只能是int类型

print(np.random.randint(2))                 # 0-2之间整数，不包含2
print(np.random.randint(2,10))              # 不包含10
print(np.random.randint(10, size = 10))     # 生成一个一维数组，元素0-10，不包含10，size指定数组中有10个元素
print(np.random.randint(10, size=(2,5)))    # 生成一个两行五列的二维数组，元素大小随机0-10，不包含10

二十：Numpy数据的输入输出

np.loadtxt(frame.dtype=np.float.delimiter=None, skiprows=0, usecols=None, unpack=False)

参数	解释
frame	文件，字符串或产生器，可以是.gz或bz2压缩文件
dtype	数据类型，可选，CSV的字符串以什么数据类型读入数组中，默认np.float
delimiter	分隔字符串，默认是任何空格
skiprows	跳过前x行，一般跳过第一行表头
usecols	读取指定的列，索引，元组类型
unpack	如果True，读入属性将分别写入不同数组变量；False读入数据只写入一个数组变量，默认为False

案例：现在这里有一个英国和美国各自youtube1000多个视频的点击，喜欢，不喜欢，评论数量([“views”,“likes”,“dislikes”,“comment_total”])的csv，尝试对其进行操作

import numpy as np
us_file_path = './files/US_video_data_numbers.csv'
uk_file_path = './files/GB_video_data_numbers.csv'
t1 = np.loadtxt(us_file_path, delimiter = ',', dtype = 'int')
t2 = np.loadtxt(us_file_path, delimiter = ',', dtype = 'int', unpack = True)
# delimiter：不指定分隔符会导致每行数据为一个整体的字符串而报错
# dtype：默认对较大的数据会使用科学计数法进行显示
print(t1)
print('='*50)
print(t2)

输出结果为：

# 注意下面unpack=True与False的区别
[[4394029  320053    5931   46245]
 [7860119  185853   26679       0]
 [5845909  576597   39774  170708]
 ...
 [ 142463    4231     148     279]
 [2162240   41032    1384    4737]
 [ 515000   34727     195    4722]]
==================================================
[[4394029 7860119 5845909 ...  142463 2162240  515000]
 [ 320053  185853  576597 ...    4231   41032   34727]
 [   5931   26679   39774 ...     148    1384     195]
 [  46245       0  170708 ...     279    4737    4722]]

将数组保存为npy文件：

arr1 = np.random.rand(5,5)
print(arr1)
np.save('test.npy', arr1)

从npy文件读取数据：

arr_load = np.load('test.npy')
print(arr_load)

将数据保存为txt文件：

np.savetxt('test.txt', arr1, delimiter = ',', fmt = '%.2f')
# delimiter：指定分隔符为逗号
# 默认保存到txt文件的元素使用的都是科学记数法，fmt设置元素为浮点数且保留两位小数位

从txt文件读取数据：

data = np.loadtxt('test.txt', delimiter = ',')

你可能感兴趣的:(Python数据分析,python,数据分析,Numpy模块)

使用Python实现的Excel像素画
简介：本项目主要使用python语言，将图片转为Excel，图片中的每一个像素转化为Excel中的每一个单元格。主要使用pillow和xlsxwriter这两个模块。项目使用一个python文件即可。一：项目功能和流程介绍项目的主要功能：就是将一张人脸图像，画在Excel表格上，图片的每一个像素点对应Excel的一个格子，俗称像素画。流程：创建Excel表，并设置行高和列宽打开图片遍历图片每一个像
python高并发web框架_Python3中tornado高并发框架 weixin_39788969 python高并发web框架
1.单线程tornado.web：基础web框架模块tornado.ioloop：核心IO循环模块，高效的基础。封装了:1.asyncio协程，异步处理2.epoll模型：水平触发（状态改变就询问，select(),poll()），边缘触发（一直询问，epoll()）3.poll模型：I/O多路复用技术4.BSD（UNIX操作系统中的一个分支的总称）的kqueue（kueue是在UNIX上比较高效
基于python的文字识别系统_基于Python的图片文本识别系统的研究 weixin_39683368 基于python的文字识别系统
龙源期刊网http://www.qikan.com.cn基于Python的图片文本识别系统的研究作者：韩琳来源：《科学与财富》2019年第20期近年来随着计算机技术的不断发展，OpticalCharacterRecognition（光学字符识别，简称“OCR”）应用的领域更加的广泛，而图片文字识别就是其中重要的一个。目前图片文字识别的准确率并没有达到100%，这也成为了图片文字识别发展领域的一大瓶
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
超详细 Conda 指令详解---附有相应的示例
以下是所有conda指令的详细列表，并附有相应的示例超详细Conda指令详解环境管理命令condacreate：创建新环境condacreate--name[package_spec1package_spec2...]示例：condacreate--namemyenvnumpypandascondainstall：安装包到当前环境condainstall[--name][--file][--cha
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
Python类中魔术方法(Magic Methods)完全指南：从入门到精通盛夏绽放 python 开发语言
文章目录Python类中魔术方法(MagicMethods)完全指南：从入门到精通一、魔术方法基础1.什么是魔术方法？2.魔术方法的特点二、常用魔术方法分类详解1.对象创建与初始化2.对象表示与字符串转换3.比较运算符重载4.算术运算符重载5.容器类型模拟6.上下文管理器7.可调用对象三、高级魔术方法1.属性访问控制2.描述符协议3.数值类型转换四、魔术方法最佳实践五、综合案例：自定义分数类Pyt
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
〖Python 数据库开发实战 - Redis篇②〗- Linux系统下安装 Redis 数据库哈哥撩编程 #⑤ -数据库开发实战篇 Python全栈白宝书 python 数据库数据库开发实战 linux安装redis
订阅Python全栈白宝书-零基础入门篇可报销！白嫖入口-请点击我。推荐他人订阅，可获取扣除平台费用后的35%收益，文末名片加V！说明：该文属于Python全栈白宝书专栏，免费阶段订阅数量4300+，购买任意白宝书体系化专栏可加入TFS-CLUB私域社区。福利：加入社区的小伙伴们，除了可以获取博主所有付费专栏的阅读权限之外，还有机会加入星荐官共赢计划，详情请戳我。作者：不渴望力量的哈士奇(哈哥)，
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
上传文件csv并解析list_基于PyQt5表格控件TableWidget的csv文件内容显示
(70后红太阳2020年4月写于成都)一、配置环境开发环境：Win7；开发工具：Python3.8.2IDLE，QtDesigner5.13.2；Python安装目录：D:python；文件保存目录：D:python基于PyQt5表格控件TableWidget的csv文件内容显示；路径配置：在cmd下，运行path=%path%;Dpythonpython38-32scripts;D:python
关于 Excel 学习和数据分析有什么书籍或网站推荐？ cda2024 excel 学习数据分析
在当今信息爆炸的时代，Excel和数据分析已经成为职场人士必备的技能。无论是处理日常工作中的数据、制作报表，还是进行更深入的数据分析，Excel都是一个不可或缺的工具。那么，如何系统地学习Excel和数据分析呢？有哪些书籍或网站能够帮助我们快速上手并掌握这些技能？今天，我们就来探讨一下关于Excel学习和数据分析的书籍与网站推荐。一、Excel学习入门（一）书籍推荐《Excel数据分析与应用实战》
Instagram千号矩阵：亚矩阵云手机破解设备指纹检测的终极方案云云321 矩阵智能手机线性代数
在Instagram的全球化运营中，构建千号矩阵已成为品牌扩大曝光、精准触达用户的核心策略。然而，平台对设备指纹的强监管——通过硬件参数聚类、传感器动态性检测、IP地理一致性校验等200余个维度构建风控模型，使得传统多账号运营面临高封号率、低存活率的双重挑战。亚矩阵云手机通过动态设备指纹重置、智能行为仿真与独立IP池管理三大技术模块，为Instagram千号矩阵提供了安全、高效、低成本的解决方案。
利用时间设置进行有效行动王明鹏
时间设置技巧，其实就是思维决策三种方式之一的目标分解，通过对一个大目标分解，变成一个个小目标，彼此有机衔接，模块组合，叠加完成，既独立又融合。任何活动都是过程，表现出来的就是时间的利用，也可以说活动效果取决于时间的利用效果。当我们试图完成有效行动时候，或者指导求助者完成训练活动时候，较好的技巧之一就是进行合理时间设置，便于培养意志品质。一个很有启发的故事，说的是一个上课调皮捣蛋的小学生，被老师多次
基于pyQt5为前端实现的智能座椅控制系统，集成了人脸识别、语音合成和座椅记忆功能，为用户提供个性化的座椅调节体验，后期可连接智能座椅。渴死的鱼仔 qt 前端开发语言
智能座椅控制系统：基于PyQt5的个性化解决方案界面描述：一、系统概述基于PyQt5开发的智能座椅控制系统，深度融合人脸识别、语音交互与座椅记忆功能，打造个性化舒适体验。系统通过实时用户识别自动调节座椅参数，后期可无缝对接智能座椅硬件，实现"无感式"智能生活场景。二、核心功能模块1.人脸识别引擎高精度识别：基于Dlib库实现亚毫米级人脸特征提取动态管理：支持多人脸特征存储与实时匹配快速响应：毫秒级
告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“ 小张在编程 python 大数据开发语言
引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
Django项目运行报错：ModuleNotFoundError: No module named ‘MySQLdb‘
解决方法：在__init__.py文件下，新增下面这段代码importpymysqlpymysql.install_as_MySQLdb()注意：确保你的python有下载pymysql库，没有的话可以使用pipinstallpymysql安装原理：用pymysql来代替mysqlLab__init__.py文件大致位置在：
[Py026]Snakefile灵活传递param 安哥生个信
snakemake是用python编写的，最近串流程用的比较频繁，所以也归纳在python实用技巧里面。现在需要实现的一个功能是——根据每一个input自身的特点，返回一个值（可能是固定，也可能是随机）；然后将这个返回值传递给下面的运行代码。举例：现在有两个fastq文件20192.fastq.gz20193.fastq.gz，需要通过seqkit转换为fasta文件；如果文件名是奇数，则转换出来
Python日志终极指南：深入探索logging日志管理模块 c01dkit python python 开发语言
在任何一个严谨的软件开发项目中，日志（Logging）都是不可或缺的一环。它不仅是调试代码的利器，更是线上问题追踪、性能分析和数据监控的重要依据。相比于随处可见的print()语句，Python内置的logging模块提供了更为强大、灵活且标准化的解决方案。[1][2]这篇博客将带你由浅入深，全面掌握logging模块的使用，从基础配置到高级技巧，再到企业级项目的最佳实践。一、告别print()：
python大数据论文_大数据环境下基于python的网络爬虫技术 weixin_39775976 python大数据论文
软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
【Python爬虫(26)】Python爬虫进阶：数据清洗与预处理的魔法秘籍奔跑吧邓邓子 Python爬虫 python 爬虫开发语言数据清洗预处理
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、数据清洗的重要性二、数据清洗的常见任务2.1去除噪声数据2.2
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
如何通过linux黑窗口实现对远程服务器的操作
①选择合适的云平台进行设备的租用并复制好远程设备的IP地址②使用管理员权限打开黑窗口③输入命令连接远程的设备：ssh用户名@服务器IP地址，此时得到的是一个什么都没有的设备④由于该设备什么都没有，故先：sudoaptupdate，然后安装gcc编译器：sudoaptinstallbulid-essential，再然后安装python：sudoaptinstallpython-3.8，再然后安装mi
Redis——API的理解和使用莫问以
一、全局命令1、查看所有键keys*下面插入了3对字符串类型的键值对：127.0.0.1:6379>sethelloworldOK127.0.0.1:6379>setjavajedisOK127.0.0.1:6379>setpythonredis-pyOKkeys*命令会将所有的键输出：127.0.0.1:6379>keys*1)"python"2)"java"3)"hello"2、键总数dbsi
PYTHON对接第三方验证码短信接口短信接口开发
PYTHON短信接口对接demo#接口类型：互亿无线触发短信接口，支持发送验证码短信、订单通知短信等。#账户注册：请通过该地址开通账户http://user.ihuyi.com/?DKimmu#注意事项：#（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。#（2）请使用APIID及APIKEY来调用接口，可在会员中心获取；#（3）该代码仅供接入互亿无线
第二十四篇 Requests+BeautifulSoup，秒抓网站信息！你的智能信息收集器！爱分享的飘哥日常效率自动化 beautifulsoup Python爬虫 Requests 数据抓取办公自动化信息收集
python爬虫序言：手动复制粘贴网页数据？效率太低了1.网页数据抓取基础：HTTP请求与网页结构速览1.1HTTP请求：浏览器如何和网页交互？1.2网页结构：HTML，信息的载体2.Requests库：发送网络请求的利器2.1安装与基础用法：你的第一个HTTP请求2.2处理请求头与参数：模拟浏览器访问3.BeautifulSoup：解析网页的利器3.1安装与基础用法：快速解析HTML内容3.2精
Redis 安全加固：从密码保护到高级安全配置 Seal^_^ 数据库专栏 #数据库--Redis redis 安全数据库 Redis 安全加固
Redis安全加固：从密码保护到高级安全配置一、Redis安全概述二、密码认证配置1.设置Redis密码临时设置（重启后失效）永久设置（修改配置文件）2.密码认证流程3.Python连接示例三、网络层安全加固1.绑定内网IP2.修改默认端口3.防火墙配置四、危险命令禁用1.禁用敏感命令2.命令禁用前后对比五、高级安全配置1.TLS加密传输2.客户端证书认证3.ACL细粒度权限控制（Redis6.0
Spring AI 项目实战（十八）：Spring Boot + AI + Vue3 + OSS + DashScope 实现高效语音识别系统（附完整源码）程序员岳彬 SpringAI spring 人工智能 spring boot 语音识别后端 ai java
系列文章序号文章名称1SpringAI项目实战（一）：SpringAI核心模块入门2SpringAI项目实战（二）：SpringBoot+AI+DeepSeek深度实战（附完整源码）3SpringAI项目实战（三）：SpringBoot+AI+DeepSeek打造智能客服系统（附完整源码）4
django连接mysql启动报错：ModuleNotFoundError: No module named ‘MySQLdb‘ chillout_02 django mysql python
安装pymysqlpipinstallpymysql安装cryptographypipinstallcryptography在项目(就是项目最主要的那个模块，有settings.py的那个)的__init__.py里加上：importpymysqlpymysql.install_as_MySQLdb()
【python库对比】路径专题 os.path和pathlib对比尚未想好 python高频库对比 python 开发语言 vscode
专栏收录：python高频库对比本专栏将持续更新在工程领域高频使用的python库之间的对比文章概览：简单介绍路径处理常用的python库及特点对比os.path和pathlib的异同结合代码示例说明两个库的差异.补充：os.path和pathlib高频使用接口见os.path和pathlib高频使用接口及示例1.简介Python中处理路径的库有很多，其中一些常用的包括：os.path模块：os.
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round