明光桥北修狗

【Numpy】北理工python数据分析之Numpy学习笔记

Numpy

因为要学pytorch，准备重学下numpy，第一次是本科的时候看的，印象不深刻，顺便做做笔记以便以后复习。
学习资料来自MOOC北理工嵩天老师的Python数据分析与展示，链接放在下面。
在Ubuntu20.04中使用anaconda3进行学习。其中numpy版本为1.22.3。学习工具有ipython。
Have fun!

课程链接：Python数据分析与展示

Ipython魔术指令

在Ipython中有一些魔术指令，熟悉以下给学习带来便捷

首先，Ipython可以使用shell的一些基本命令，不做举例。

魔术指令：

#输入magic，弹出魔术指令help文档
%magic#同上
%hist#显示历史输入
%pdb#当陷入异常时自动进入pdb调试器
%reset#删除当前所有变量
%who#显示ipython中的所有定义的变量
%time statement#给出代码执行时间，statement表示一段代码
%timeit statement#多次执行代码，计算综合平均时间

引入Numpy

引入Numpy包的默认方法

import numpy as np

Numpy入门

ndarray和普通数据结构列表的区别

#!/usr/bin/python3

def pySum():
	a = [0, 1, 2, 3, 4]
	b = [9, 8, 7, 6, 5]
	c = []

	for i in range(len(a)):
		c.append(a[i]**2 + b[i]**3)

	return c

import numpy as np

def npSum():
	a = np.array([0, 1, 2, 3, 4]) 
	b = np.array([9, 8, 7, 6, 5]) 

	c = a**2 + b**3

	return c

print(pySum())
print(npSum())

pySum函数计算列表a，b返回结果。而npSum函数则是pySum函数的numpy版本。可以看到numpy版本简单许多，并且不需要用到循环，numpy底层是用c语言实现的，效率很高。

运行结果：

[729, 513, 347, 225, 141]
[729 513 347 225 141]

ndarray的属性

以下矩阵其实是数组，因为上面的程序进行的是数组运算

attributes	meanings
.ndim	矩阵的秩
.shape	矩阵的形状，以元组呈现
.size	矩阵的所含元素个数
.dtype	矩阵中数据类型
.itemsize	矩阵中每个数据所占内存大小

ipython中验证：

n [1]: import numpy as np

In [2]: a = np.array([[0, 1, 2, 3, 4], [9, 8, 7, 6, 5]])

In [3]: a.ndim
Out[3]: 2

In [4]: a.shape
Out[4]: (2, 5)

In [5]: a.size
Out[5]: 10

In [6]: a.dtype
Out[6]: dtype('int64')

In [7]: a.itemsize
Out[7]: 8

array中的数据也可以不同质，但是会有想不到的麻烦，在处理大量数据时不建议使用。

In [8]: x = np.array([[0, 1, 2, 3, 4], [9, 8, 7, 6]])

In [9]: x.ndim
Out[9]: 1

In [10]: x.shape
Out[10]: (2,) #shape是很奇怪的元组

In [11]: x.size
Out[11]: 2	#size也只是2，与同质的矩阵不同

In [12]: x.dtype
Out[12]: dtype('O') #这里数据类型是‘O’，就是对象

In [13]: x.itemsize
Out[13]: 8

ndarray的创建

从列表，元组，列表元组混合创建

x = np.array(list/tuple)
x = np.array(list/tuple, dtype=np.float64)

当不指定dtype时，数据类型是numpy中默认的类型，一般是float64

In [64]: x = np.array([0, 1, 2, 3])#从列表创建

In [65]: print(x)
[0 1 2 3]

In [66]: x = np.array((4, 5, 6, 7))#从元组创建

In [67]: print(x)
[4 5 6 7]

In [68]: x = np.array([[1, 2], [9, 8], (0.1, 0.2)])#从列表元组混合创建

In [69]: print(x)
[[1.  2. ]
 [9.  8. ]
 [0.1 0.2]]

从numpy提供的函数创建

1.首先是一些无中生有的方法

function	comment
np.arange(n)	类似range函数，生成从0到n的元素
np.ones(shape)	shape是元组，根据shape生成一个全一数组
np.zeros(shape)	shape是元组，根据shape生成一个全0数组
np.full(shape, val)	根据shape生成一个数组，每个元素都为val
np.eye(n)	创建一个n维单位阵

In [71]: np.arange(10)
Out[71]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [72]: np.ones((3,6))
Out[72]: 
array([[1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.]])

In [73]: np.zeros((3,6), dtype=np.int32)
Out[73]: 
array([[0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0]], dtype=int32)

In [74]: np.eye(5)
Out[74]: 
array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

In [75]: x = np.ones((2, 3, 4))#数组的数组思想

In [76]: print(x)
[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]

In [77]: x.shape
Out[77]: (2, 3, 4)

2.再是一些根据已有的数据生成数组的方法

function	comment
np.ones_like(a)	根据a的形状生成一个全1数组
np.zeros_like(a)	根据a的形状生成一个全0数组
np.full_like(a, val)	根据a的形状生成一个数组，元素都为val

3.其他方法

function	comment
np.linspace()	根据起止数等间距填充数据，形成数组
np.concatenate()	将两个或多个数组合并成一个新数组

In [79]: a = np.linspace(1, 10 ,4)

In [80]: a
Out[80]: array([ 1.,  4.,  7., 10.])

In [81]: b = np.linspace(1, 10 , 4, endpoint=False)

In [82]: b
Out[82]: array([1.  , 3.25, 5.5 , 7.75])
#endpoint表示最后一个数是否在生成的数组中的最后一个元素上

In [84]: c = np.concatenate((a, b))

In [85]: c
Out[85]: array([ 1.  ,  4.  ,  7.  , 10.  ,  1.  ,  3.25,  5.5 ,  7.75])

从字节流创建，从文件读取数据创建

ndarray维度变换

function	comment
.reshape(shape)	不改变数组元素，返回一个shape形状的数组，原数组不变
.resize(shape)	与reshape相似，但是改变原数组，返回引用
.swapaxes(ax1, ax2)	将数组n个维度中两个交换
.flatten()	对数组降维，降成一维

In [87]: a = np.ones((2, 3, 4), dtype=np.int32)

In [88]: a.reshape((3,8))
Out[88]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]], dtype=int32)

In [89]: a
Out[89]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int32)

注意：这里的a数组并没有发生变化

In [90]: a.resize((3,8))

In [91]: a
Out[91]: 
array([[1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1]], dtype=int32)

这里a已经改变了

In [92]: a.flatten()
Out[92]: 
array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1], dtype=int32)

这里a直接降至一维

ndarray类型转换

数组内数据类型的转换

直接上代码：

In [97]: a = np.ones((2, 3, 4), dtype=np.int)

In [98]: a
Out[98]: 
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]])

In [99]: b = a.astype(np.float)

In [100]: b
Out[100]: 
array([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]])

astype(new_type)，该方法一定会生成一个新的数组，拷贝了原数组然后进行了数据类型的改变。

ndarray数组向列表的转换

使用tolist方法

In [104]: a = np.full((2, 3, 4), 25, dtype=np.int32)

In [105]: a
Out[105]: 
array([[[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]],

       [[25, 25, 25, 25],
        [25, 25, 25, 25],
        [25, 25, 25, 25]]], dtype=int32)

In [106]: a.tolist()
Out[106]: 
[[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]],
 [[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]]]

返回的是一个列表，原数组不改变

ndarray索引与切片

一位数组索引切片与列表相同

In [11]: a = np.array([9, 8, 7, 6, 5])

In [12]: a[2]
Out[12]: 7

In [13]: a[1 : 4 : 2]
Out[13]: array([8, 6])

多维数组的操作也大同小异

#首先建立一个2*3*4的数组
In [14]: a = np.arange(24).reshape((2, 3, 4))

In [15]: a
Out[15]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

注意py里的索引都是在一个中括号内完成的，不是数组数组的概念

In [17]: a[1, 2, 3]
Out[17]: 23

In [18]: a[0, 1, 2]
Out[18]: 6

In [19]: a[-1, -2, -3]
Out[19]: 17

切片操作

In [21]: a[:, 1, -3]
Out[21]: array([ 5, 17])

In [22]: a[:, 1:3, :]
Out[22]: 
array([[[ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [23]: a[:, :, ::2]
Out[23]: 
array([[[ 0,  2],
        [ 4,  6],
        [ 8, 10]],

       [[12, 14],
        [16, 18],
        [20, 22]]])

ndarray数组运算

数组与标量的运算

举个例子：求a的平均值

In [10]: a = np.arange(24).reshape((2, 3, 4))

In [11]: a.mean()
Out[11]: 11.5

In [12]: a/a.mean()
Out[12]: 
array([[[0.        , 0.08695652, 0.17391304, 0.26086957],
        [0.34782609, 0.43478261, 0.52173913, 0.60869565],
        [0.69565217, 0.7826087 , 0.86956522, 0.95652174]],

       [[1.04347826, 1.13043478, 1.2173913 , 1.30434783],
        [1.39130435, 1.47826087, 1.56521739, 1.65217391],
        [1.73913043, 1.82608696, 1.91304348, 2.        ]]])

numpy一元函数（只有一个数组参与的函数）

function	comment
np.abs(x) np.fabs(x)	计算数组各元素的绝对值
np.sqrt(x)	计算数组各元素的平方根
np.square(x)	计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x)	计算数组各元素的自然对数，10底对数，2底对数
np.ceil(x) np.floor(x)	计算数组各元素的向上取整和向下取整
np.ring(x)	计算数组各元素的四舍五入
np.modf(x)	将数组的整数部分和小数部分分别返回，但是结果都是浮点数组
np.三角函数	计算各元素的指数值
np.sign(x)	符号函数，取符号数组

老油条看到这么多数学函数，不要怕，用到的时候再看就好了

举几个例子：

In [13]: np.square(a)
Out[13]: 
array([[[  0,   1,   4,   9],
        [ 16,  25,  36,  49],
        [ 64,  81, 100, 121]],

       [[144, 169, 196, 225],
        [256, 289, 324, 361],
        [400, 441, 484, 529]]])

In [14]: a = np.sqrt(a)

In [15]: a
Out[15]: 
array([[[0.        , 1.        , 1.41421356, 1.73205081],
        [2.        , 2.23606798, 2.44948974, 2.64575131],
        [2.82842712, 3.        , 3.16227766, 3.31662479]],

       [[3.46410162, 3.60555128, 3.74165739, 3.87298335],
        [4.        , 4.12310563, 4.24264069, 4.35889894],
        [4.47213595, 4.58257569, 4.69041576, 4.79583152]]])

In [16]: np.modf(a)
Out[16]: 
(array([[[0.        , 0.        , 0.41421356, 0.73205081],
         [0.        , 0.23606798, 0.44948974, 0.64575131],
         [0.82842712, 0.        , 0.16227766, 0.31662479]],
 
        [[0.46410162, 0.60555128, 0.74165739, 0.87298335],
         [0.        , 0.12310563, 0.24264069, 0.35889894],
         [0.47213595, 0.58257569, 0.69041576, 0.79583152]]]),
 array([[[0., 1., 1., 1.],
         [2., 2., 2., 2.],
         [2., 3., 3., 3.]],
 
        [[3., 3., 3., 3.],
         [4., 4., 4., 4.],
         [4., 4., 4., 4.]]]))#这里的结果注意一下，两个数组都是浮点数类型的

需要注意的是这些一元函数都不会返回引用，所以都需要赋值才行

二元函数

function	comment
+ - * / **
np.maximum(x, y) np.fmax() np.minimum(x, y) np.fmin()	元素级的最值
np.mod(x, y)	元素级的模运算
np.copysign(x, y)	将数组y中的各元素符号赋值给数组x对应的元素
> < >= <= == !=	算术比较，产生bool型数组

In [17]: a = np.arange(24).reshape((2, 3, 4))

In [18]: b = np.sqrt(a)

In [19]: a
Out[19]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [20]: b
Out[20]: 
array([[[0.        , 1.        , 1.41421356, 1.73205081],
        [2.        , 2.23606798, 2.44948974, 2.64575131],
        [2.82842712, 3.        , 3.16227766, 3.31662479]],

       [[3.46410162, 3.60555128, 3.74165739, 3.87298335],
        [4.        , 4.12310563, 4.24264069, 4.35889894],
        [4.47213595, 4.58257569, 4.69041576, 4.79583152]]])

In [22]: np.maximum(a, b)
Out[22]: 
array([[[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]],

       [[12., 13., 14., 15.],
        [16., 17., 18., 19.],
        [20., 21., 22., 23.]]])

In [23]: a > b
Out[23]: 
array([[[False, False,  True,  True],
        [ True,  True,  True,  True],
        [ True,  True,  True,  True]],

       [[ True,  True,  True,  True],
        [ True,  True,  True,  True],
        [ True,  True,  True,  True]]])

Numpy数据存取

CSV文件格式

CSV(Comma-Separated Value,逗号分隔值)
用来存储批量数据，以逗号分隔同一行的数据

numpy中读写文件函数

np.savetxt() np.loadtxt()

首先savetxt()函数：

np.savetxt(frame, array, fmt='%.18e', delimiter=None)
'''
frame: 文件，字符串或者生成器，可以是.gz或者.bz2的压缩文件。
array：存入文件的数组
fmt：存入的格式
delimiter：分隔符，None就是默认任何空格，在CSV中一定得是逗号
'''

举例：

In [13]: a = np.arange(100).reshape((5, 20))
In [14]: np.savetxt('a.csv', a, fmt="%d", delimiter=",")

打开a.csv看看

再存一个浮点数的看看：

In [17]: np.savetxt('b.csv', a, fmt="%.1f", delimiter=",")

loadtxt()函数:

np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
'''
frame:文件，字符串或者产生器，可以是gz bz2压缩文件
dtype:数据类型，可选。默认是float类型
delimiter:分割字符串，默认是任何空格
unpack:如果为真，读入属性将分别写入不同的变量
'''

In [18]: np.loadtxt('a.csv', delimiter=',')
Out[18]: 
array([[ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12.,
        13., 14., 15., 16., 17., 18., 19.],
       [20., 21., 22., 23., 24., 25., 26., 27., 28., 29., 30., 31., 32.,
        33., 34., 35., 36., 37., 38., 39.],
       [40., 41., 42., 43., 44., 45., 46., 47., 48., 49., 50., 51., 52.,
        53., 54., 55., 56., 57., 58., 59.],
       [60., 61., 62., 63., 64., 65., 66., 67., 68., 69., 70., 71., 72.,
        73., 74., 75., 76., 77., 78., 79.],
       [80., 81., 82., 83., 84., 85., 86., 87., 88., 89., 90., 91., 92.,
        93., 94., 95., 96., 97., 98., 99.]])
In [21]: b = np.loadtxt('a.csv', dtype=np.int32, delimiter=',')

In [22]: b
Out[22]: 
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
        16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35,
        36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55,
        56, 57, 58, 59],
       [60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75,
        76, 77, 78, 79],
       [80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95,
        96, 97, 98, 99]], dtype=int32)

缺点是这两个函数只能操作一维二维的数组

多维数据的存取

tofile()函数

a.tofile(frmae, sep='', format='%s')
'''
frame:文件，字符串。
sep：数据分割字符串，如果是空串，写入文件为二进制
format：写入数据的格式
'''

In [26]: a = np.arange(100).reshape(5, 10, 2)

In [27]: a.tofile("b.data", sep=",", format="%d")

打开如下：

如果

In [28]: a.tofile('b.data', format="%d")

将是乱码

fromfile函数：

np.fromfile(frame, dtype=float, count=-1, sep='')
'''
frame：文件，字符串
dtype：读取的数据类型
count：读入元素个数，默认-1表示整个文件
sep：分隔符，同上，空串表示二进制
'''

In [29]: a = np.arange(100).reshape(5, 10, 2)

In [30]: a.tofile('b.data', sep=",", format="%d")

In [31]: c = np.fromfile("b.data", dtype=np.int32, sep=",")

In [32]: c
Out[32]: 
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99],
      dtype=int32)

注意：这里fromfile读取进入数组后，数组都是一维的，一般使用reshape进行维度变换

这里进行一个二进制格式存取的演示，并且使用reshape将读入的数组进行变维：

In [40]: a.tofile('b.data', format='%d')

In [41]: c = np.fromfile('b.data', dtype=np.int64).reshape(5, 10, 2)

In [42]: c
Out[42]: 
array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]],

       [[20, 21],
        [22, 23],
        [24, 25],
        [26, 27],
        [28, 29],
        [30, 31],
        [32, 33],
        [34, 35],
        [36, 37],
        [38, 39]],

       [[40, 41],
        [42, 43],
        [44, 45],
        [46, 47],
        [48, 49],
        [50, 51],
        [52, 53],
        [54, 55],
        [56, 57],
        [58, 59]],

       [[60, 61],
        [62, 63],
        [64, 65],
        [66, 67],
        [68, 69],
        [70, 71],
        [72, 73],
        [74, 75],
        [76, 77],
        [78, 79]],

       [[80, 81],
        [82, 83],
        [84, 85],
        [86, 87],
        [88, 89],
        [90, 91],
        [92, 93],
        [94, 95],
        [96, 97],
        [98, 99]]])

注意：使用这一对方法，需要知道数组的维度，一般会再写一个文件存储数组相关信息。

Numpy特有的存取方法

save，savez与load

np.save(frame, array)
np.savez(frame, array)
np.load(frame)
'''
frame：文件名，以.npy为扩展名，压缩扩展名为.npz
array：数组变量
'''

In [44]: np.save("a.npy", a)

In [45]: b = np.load("a.npy")

In [46]: b
Out[46]: 
array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]],

       [[20, 21],
        [22, 23],
        [24, 25],
        [26, 27],
        [28, 29],
        [30, 31],
        [32, 33],
        [34, 35],
        [36, 37],
        [38, 39]],

       [[40, 41],
        [42, 43],
        [44, 45],
        [46, 47],
        [48, 49],
        [50, 51],
        [52, 53],
        [54, 55],
        [56, 57],
        [58, 59]],

       [[60, 61],
        [62, 63],
        [64, 65],
        [66, 67],
        [68, 69],
        [70, 71],
        [72, 73],
        [74, 75],
        [76, 77],
        [78, 79]],

       [[80, 81],
        [82, 83],
        [84, 85],
        [86, 87],
        [88, 89],
        [90, 91],
        [92, 93],
        [94, 95],
        [96, 97],
        [98, 99]]])

为什么可以直接打开不提供维度信息？

因为npy文件第一行中指明了数组相关信息

Numpy 随机数相关功能

numpy子库random提供相关的功能

function	comment
rand(d0, d1…dn)	根据d0-dn创建随机数数组，浮点数，[0, 1),均匀分布
randn(d0, d1…dn)	根据d0-dn创建随机数数组，标准正态分布
randint(low [, high, shape])	根据shape创建随机整数或整数数组，范围是[low,high)
seed(s)	随机数种子，s是给定的种子值

In [1]: import numpy as np

In [2]: a = np.random.rand(3, 4, 5)#生成3*4*5的随机数数组，范围0～1，1取不到，均匀分布

In [3]: a
Out[3]: 
array([[[0.22855554, 0.53895778, 0.8990956 , 0.03460846, 0.80936432],
        [0.38602525, 0.95082778, 0.25007749, 0.88049274, 0.94852455],
        [0.37985729, 0.05092291, 0.12991747, 0.79304105, 0.29923155],
        [0.63284688, 0.90729409, 0.68672494, 0.58729567, 0.65911695]],

       [[0.74592831, 0.0769337 , 0.40885755, 0.67209545, 0.88724064],
        [0.16406816, 0.12169161, 0.86875681, 0.02115887, 0.12646621],
        [0.22963925, 0.31762675, 0.59551248, 0.77621544, 0.02643761],
        [0.1202724 , 0.50328377, 0.16150334, 0.29160171, 0.93511997]],

       [[0.536302  , 0.72972245, 0.62452992, 0.81509939, 0.25614635],
        [0.85667339, 0.4896346 , 0.44260732, 0.02752194, 0.94911712],
        [0.57801131, 0.24271987, 0.97145063, 0.43145098, 0.38722077],
        [0.62954656, 0.5970487 , 0.92360391, 0.80155753, 0.71069473]]])

In [4]: sn = np.random.randn(3, 4, 5) #正态分布

In [5]: sn
Out[5]: 
array([[[-0.80285747, -0.53518958,  0.38004255, -0.99689688,
          0.13284149],
        [ 0.64754759,  1.6824004 ,  1.96022306,  0.66429774,
          0.38430592],
        [ 1.15564303,  0.15239773,  0.74341428, -1.36023864,
          0.76729678],
        [ 1.74108334,  2.23838781, -0.56746454, -0.4348884 ,
          0.09969999]],

       [[ 0.65061914,  1.51382457, -1.03026261, -0.55293345,
          0.51808715],
        [-0.1243385 ,  0.35084291,  0.49323145, -0.97200827,
          0.13647158],
        [-1.59078417, -0.62574367, -0.23666443, -1.95238941,
          0.91223346],
        [ 0.80295509, -0.17089901,  0.48476418, -0.48047162,
         -0.24084512]],

       [[ 1.03365949,  0.13828344,  1.47268197,  0.17788982,
         -0.06274534],
        [-0.04690676,  0.01632059, -0.11124271, -0.40165229,
          1.42563916],
        [ 1.75412661,  2.3482051 , -0.29734503,  0.3106709 ,
          0.66124406],
        [-1.64166232, -0.17699444, -1.1448258 , -0.59836659,
         -0.16537533]]])

In [6]: b = np.random.randint(100, 200, (3, 4))# 生成100～200的整数随机数数组，3*4维

In [7]: b
Out[7]: 
array([[120, 130, 192, 185],
       [114, 109, 126, 111],
       [125, 184, 121, 185]])

In [8]: np.random.seed(10)#指定随机数种子，种子相同，生成的伪随机数数组完全相同

In [9]: np.random.randint(100, 200, (3, 4))
Out[9]: 
array([[109, 115, 164, 128],
       [189, 193, 129, 108],
       [173, 100, 140, 136]])

In [10]: np.random.randint(100, 200, (3, 4))
Out[10]: 
array([[116, 111, 154, 188],
       [162, 133, 172, 178],
       [149, 151, 154, 177]])

In [11]: np.random.seed(10)

In [12]: np.random.randint(100, 200, (3, 4))
Out[12]: 
array([[109, 115, 164, 128],
       [189, 193, 129, 108],
       [173, 100, 140, 136]])

还有

function	comment
shuffle(a)	根据数组a的第一轴进行随机排列，改变a
permutation(a)	根据数组a的第一轴产生一个新的乱序数组，不改变a
choice(a [, size, replace, p])	从一维数组a中以概率p抽取元素，形成size形状数组replace表示是否可以重用元素，默认为False

In [16]: a = np.random.randint(100, 200, (3, 4))#shuffle()

In [17]: a
Out[17]: 
array([[111, 154, 188, 162],
       [133, 172, 178, 149],
       [151, 154, 177, 169]])

In [18]: np.random.shuffle(a)

In [19]: a
Out[19]: 
array([[111, 154, 188, 162],
       [151, 154, 177, 169],
       [133, 172, 178, 149]])

In [19]: a
Out[19]: 
array([[111, 154, 188, 162],
       [151, 154, 177, 169],
       [133, 172, 178, 149]])

In [20]: np.random.permutation(a)#permutation()
Out[20]: 
array([[133, 172, 178, 149],
       [111, 154, 188, 162],
       [151, 154, 177, 169]])

In [21]: a
Out[21]: 
array([[111, 154, 188, 162],
       [151, 154, 177, 169],
       [133, 172, 178, 149]])

In [22]: b = np.random.randint(100, 200, (8,))#choice()

In [23]: b
Out[23]: array([113, 192, 186, 130, 130, 189, 112, 165])

In [24]: np.random.choice(b, (3, 2))
Out[24]: 
array([[165, 192],
       [130, 130],
       [186, 189]])

In [25]: np.random.choice(b, (3, 2), replace=False)#不可重复抽取
Out[25]: 
array([[192, 130],
       [186, 165],
       [130, 113]])

In [26]: np.random.choice(b, (3, 2), p = b/np.sum(b))#这里元素值越大，被抽取的概率越高
Out[26]: 
array([[130, 186],
       [130, 113],
       [112, 130]])

产生分布的函数：

function	comment
uniform(low, high, size)	产生具有均匀分布的数组，low—high指定起始终止，size指定形状
normal(loc, scale, size)	正态分布，loc均值，scale标准差，size形状
poisson(lam, size)	泊松分布，lam随机事件发生率，size形状

复习完概率论再看看吧

Numpy 统计函数介绍

函数是库级别的，也就是可以通过静态np直接调用

function	comment
sum(a, axis=None)	根据给定轴计算数组a相关元素之和，axis是整数或者元组
mean(a, axis=None)	根据给定轴计算数组a相关元素的期望，axis同上
average(a, axis=None, weights=None)	根据给定轴计算数组a相关元素的加权平均值
std(a, axis=None)	标准差
var(a, axis=None)	方差

上例子：

In [1]: import numpy as np

In [2]: a = np.arange(15).reshape(3, 5)

In [3]: a
Out[3]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [4]: np.sum(a)
Out[4]: 105

In [5]: np.mean(a)
Out[5]: 7.0

In [6]: np.mean(a, axis=1)
Out[6]: array([ 2.,  7., 12.])

In [7]: np.mean(a, axis=0)
Out[7]: array([5., 6., 7., 8., 9.])

In [8]: np.average(a, axis=0, weights=[10, 5, 1])
Out[8]: array([2.1875, 3.1875, 4.1875, 5.1875, 6.1875])

In [9]: np.std(a)
Out[9]: 4.320493798938574

In [10]: np.var(a)
Out[10]: 18.666666666666668

这里的axis要说明一下：

axis值定按照哪个轴进行计算，如果axis=0，则说明按照第一个维度进行计算，什么是第一个维度，第一个维度按照c的原理应该是最外层数组的元素，在py中，对于二位数组就是竖着数的元素都算是第一个维度。于是在这个例子中竖着数有五列，所以结果中列表中有五个平均数。

那么当axis=1时，这个维度也就是横着数（c中的内层数组的元素），自然结果中应该有三个平均值。

权重是很好理解的这里的算法应该是这样的(0*10 + 5*5 + 10*1)/(10 + 5 + 1) = 2.1875。

这里还有一些常用的统计函数，看看就好，用的时候再看看

function	comment
min(a) max(a)	计算数组a中元素的最小值，最大值
argmin(a) argmax(a)	计算数组a中元素最小值，最大值的降一维后下标
unravel_index(index, shape)	根据shape将一维下标index转换成多维下标
ptp(a)	计算数组a中元素最大值与最小值
median(a)	计算数组a中元素的中位数

举例：

n [11]: b = np.arange(15, 0, -1).reshape(3, 5)

In [12]: b
Out[12]: 
array([[15, 14, 13, 12, 11],
       [10,  9,  8,  7,  6],
       [ 5,  4,  3,  2,  1]])

In [13]: np.max(b)
Out[13]: 15

In [14]: np.argmax(b)#只有按照一维顺序的下标
Out[14]: 0

In [15]: np.unravel_index(np.argmax(b), b.shape)#转换成数组维度的下标
Out[15]: (0, 0)

In [16]: np.ptp(b)
Out[16]: 14

In [17]: np.median(b)
Out[17]: 8.0

Numpy计算梯度

什么是梯度，就是导数相关的内容

function	comment
np.gradient(f)	计算数组f中元素的梯度，当f为多维时，返回每个维度梯度

计算方法如下：

如果不在数组的边缘，排列为a，b，c，则b的梯度为(c-a)/2.

如果在数组的边缘，排列为a，b，则a的梯度为b-a

In [5]: a = np.random.randint(0, 20, (5,))

In [6]: a
Out[6]: array([10,  9, 11,  4,  3])

In [7]: np.gradient(a)
Out[7]: array([-1. ,  0.5, -2.5, -4. , -1. ])

In [8]: b = np.random.randint(0, 20, (5,))

In [9]: b
Out[9]: array([18, 17, 13, 11,  0])

In [10]: np.gradient(b)
Out[10]: array([ -1. ,  -2.5,  -3. ,  -6.5, -11. ])

二位数组计算梯度：

In [12]: c = np.random.randint(0, 50, (3, 5))

In [13]: c
Out[13]: 
array([[10, 11, 22, 33,  6],
       [10,  3, 45, 43,  7],
       [14, 31, 18, 12,  8]])

In [14]: np.gradient(c)
Out[14]: 
[array([[  0. ,  -8. ,  23. ,  10. ,   1. ],
        [  2. ,  10. ,  -2. , -10.5,   1. ],
        [  4. ,  28. , -27. , -31. ,   1. ]]),#先计算最外层维度的梯度
 array([[  1. ,   6. ,  11. ,  -8. , -27. ],
        [ -7. ,  17.5,  20. , -19. , -36. ],
        [ 17. ,   2. ,  -9.5,  -5. ,  -4. ]])]#再计算第二层维度的梯度

图像的数组表示

典中典之RGB图像。R-red，G-green，B-blue。这里彩色图一个像素用三个字节表示，分别表示三个色彩频道，取值为0～255。

Python提供了一个图像库-PIL（Python Image Library），这是一个第三方库，需要自己安装，当然如果你用的是anaconda，则一般已经安装好了。

(base) leiyunfei@leiyunfei:~/py_prac/learning_numpy$ conda list | grep pillow
pillow                    9.0.1            py39h22f2fdc_0    defaults

注意这里要安装的库叫做pillow而不是PIL

自己安装可以用pip或者conda安装

conda install pillow
pip install pillow#or pip3

引入图像类：

from PIL import Image

Image 是PIL提供的一个图像类，一个Image对象表示一个图像。显然这里是像素图，用numpy二维矩阵表示就行：

In [1]: from PIL import Image

In [2]: import numpy as np

In [4]: im = np.array(Image.open("beijing.jpeg"))

In [5]: print(im.shape, im.dtype)
(180, 309, 3) uint8#可以看到图像是一个三维数组，元素类型为uint8

图像变换

使用numpy处理数据是有他的道理的，正如一开始举的例子，numpy处理数据有他的便捷之处，处理图像也是一样。

In [9]: from PIL import Image

In [10]: import numpy as np

In [11]: a = np.array(Image.open("forbiddencity.jpeg"))

In [12]: print(a.shape, a.dtype)
(180, 247, 3) uint8

In [13]: b = [255, 255, 255] - a

In [14]: im = Image.fromarray(b.astype('uint8'))

In [15]: im.save("forbiddencity2.jpeg")

这里，打开forbiddencity图像存入数组a，用b来存a的反色后图像，在存入forbiddencity2。

这里的In[13]第一次没看懂在干啥。b是用一个有三个整数的列表减去一个numpy数组，并且维度都不相同。于是查了一下资料，看了一下函数说明

help(np.subtract)

摘取重要的说明，原来是这样：

#函数文档：
subtract(x1, x2, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj])
其中x1，x2的类型是array_like，再查看一下array的帮助文档：
help(np.array)
array(...)
    array(object, dtype=None, *, copy=True, order='K', subok=False, ndmin=0,
          like=None)
    
    Create an array.
    
    Parameters
    ----------
    object : array_like
        An array, any object exposing the array interface, an object whose
        __array__ method returns an array, or any (nested) sequence.
#这里的参数Object的类型是array_like，那什么算是array_like，这里说，任何有数组接口的对象，或者对象含有array魔术方法返回一个数组，或者嵌套序列。
#这里我们明白了一个列表或元组作为参数是可以被隐式转换为数组，但是还没有解决我们的问题，为什么一个含有三个整数的列表减去一个图像数组还能得到一个同等大小的图像数组，图像数组是三维的数组，前两维记录图像的高与宽，只有第三维才记录色彩信息。接着看subtract的帮助文档：
x1, x2 : array_like
        The arrays to be subtracted from each other.
        If ``x1.shape != x2.shape``, they must be broadcastable to a common
        shape (which becomes the shape of the output).
    out : ndarray, None, or tuple of ndarray and None, optional
        A location into which the result is stored. If provided, it must have
        a shape that the inputs broadcast to. If not provided or None,
        a freshly-allocated array is returned. A tuple (possible only as a
        keyword argument) must have length equal to the number of outputs.
        
Returns
    -------
    y : ndarray
        The difference of `x1` and `x2`, element-wise.
        This is a scalar if both `x1` and `x2` are scalars.
#如果x1.shape != x2.shape那么如果他们能广播到一个共同形状，返回这个形状的数组，参数中有一个out可以用来指定返回数组的形状，如果没有指定则由numpy库自行指定，numpy库还是比较智能的。原来这里的相减果然是每个像素点都用[255, 255, 255]来减的。那么为什么是减号而不是调用np.subtract()?
Notes
    -----
    Equivalent to ``x1 - x2`` in terms of array broadcasting.
    
    Examples
    --------
    >>> np.subtract(1.0, 4.0)
    -3.0
    
    >>> x1 = np.arange(9.0).reshape((3, 3))
    >>> x2 = np.arange(3.0)
    >>> np.subtract(x1, x2)
    array([[ 0.,  0.,  0.],
           [ 3.,  3.,  3.],
           [ 6.,  6.,  6.]])
    
    The ``-`` operator can be used as a shorthand for ``np.subtract`` on
    ndarrays.
    
    >>> x1 = np.arange(9.0).reshape((3, 3))
    >>> x2 = np.arange(3.0)
    >>> x1 - x2
    array([[0., 0., 0.],
           [3., 3., 3.],
           [6., 6., 6.]]
#好奇，再看看乘除和加法是不是也是这样？
 结果是相同的，可以自行查看帮助文档：
 help(np.add)
 help(np.true_divide)
 help(np.multiply)
 #这些都是数组运算

这里不同维度数组间运算规则属于Numpy广播内容，在之后的Pandas中有详解
代码效果：

In [30]: a = np.array(Image.open("forbiddencity.jpeg").conve
    ...: rt('L'))

In [31]: b = 255 - a

In [32]: im = Image.fromarray(b.astype('uint8'))

In [33]: im.save("forbiddencity3.jpeg")

这里的convert方法是Image中的，convert(‘L’)将彩色图转换为灰度图再反色。

效果如下：

其他变换：

In [35]: c = (100/255)*a + 150#区间变换

In [36]: im = Image.fromarray(c.astype('uint8'))

In [37]: im.save("forbiddencity4.jpeg")


In [38]: d = 255*(a/255)**2#像素平方

In [39]: im = Image.fromarray(d.astype('uint8'))

In [40]: im.save("forbiddencity5.jpeg")

效果：

敲个代码玩玩（手绘图）

手绘图像特点：

黑白灰色
边界线条较重
相同或相近色彩趋于白色
略有光源效果

#!/usr/bin/python3

from PIL import Image
import numpy as np

a = np.asarray(Image.open("forbiddencity.jpeg").convert('L')).astype('float') 

depth = 10					#(0-100)
grad = np.gradient(a)		#取图像灰度的梯度
grad_x, grad_y = grad		#分别取横纵图像梯度值		
grad_x = grad_x*depth/100.		
grad_y = grad_y*depth/100.
A = np.sqrt(grad_x**2 + grad_y**2 + 1.)
uni_x = grad_x/A
uni_y = grad_y/A
uni_z = 1./A

vec_el = np.pi/2.2			#光源的俯视视角，弧度值
vec_az = np.pi/4.			#光源的方位角度，弧度值
dx = np.cos(vec_el)*np.cos(vec_az)#光源对x轴的影响
dy = np.cos(vec_el)*np.sin(vec_az)#光源对y轴的影响
dz = np.sin(vec_el)			#光源对z轴的影响

b = 255*(dx*uni_x + dy*uni_y + dz*uni_z)#光源归一化
b = b.clip(0, 255)

im = Image.fromarray(b.astype('uint8'))#重构图像
im.save("f_sketch.jpeg")

效果：

你可能感兴趣的:(python,数据分析,学习,机器学习)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>