skywuuuu

《利用Python进行数据分析》笔记+整理+案例 NumPy（第一部分）

1. numpy

（0）引入

import numpy as np

import numpy as np
array = np.array([[1,2,3],
                  [2,3,4]])
print(array)
print('number of dimention: ', array.ndim) #查看维度
print('shape: ', array.shape)              #查看形状
print('size: ', array.size)                #查看大小

[[1 2 3]
 [2 3 4]]
number of dimention:  2
shape:  (2, 3)
size:  6

（1）ndarray：多维数组对象

（a）创建ndarray

（i）使用array函数+其他序列比如tuple, list等

data1 = [2,3,4] # 一维的

arr1 = np.array(data1)

arr1

array([2, 3, 4])

arr2 = np.array([[1,2,3,4], #二维的
                 [5,6,7,8]])

arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

查看维度，形状，大小

arr2.ndim

arr2.shape

(2, 4)

arr2.size

（ii）使用zeros/zeros_like

# 定义为0矩阵
b = np.zeros((3,4))
print(b)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

b1 = np.zeros_like(arr2)

b1

array([[0, 0, 0, 0],
       [0, 0, 0, 0]])

（iii）使用ones/ones_like

#定义1矩阵
c = np.ones((2,3))
print(c)

[[1. 1. 1.]
 [1. 1. 1.]]

c1 = np.ones_like(arr2)

c1

array([[1, 1, 1, 1],
       [1, 1, 1, 1]])

（iv）使用empty（定义出来的是一些接近0的没啥意义的值）

#定义空矩阵，一个非常接近于0的数字
d = np.empty((3,5),dtype=np.float64)
print(d)

[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]

（v）使用arange+reshape的组合

#定义从10开始，20结束，步长为2的数组，并且reshape为矩阵
e = np.arange(10,22,1).reshape((3,4))
print(e)

[[10 11 12 13]
 [14 15 16 17]
 [18 19 20 21]]

（vi）使用linspace(start, end, number_of_points)+reshape的组合

#生成一个线段
f = np.linspace(1,10,6).reshape((2,3))
print(f)

[[ 1.   2.8  4.6]
 [ 6.4  8.2 10. ]]

（vii）使用identity/eye（对角线为1，其余为0的N*N矩阵）

g = np.identity(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

g1 = np.eye(4)

g1

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

（viii）随机生成

randn：根据正态分布
random：随机
randint: 生成整肃

还有很多…

np.random.randn(2,3)

array([[ 2.57030105,  1.39206901, -0.30316474],
       [-0.42712186, -0.40631921, -1.71738395]])

np.random.random((2,4))

array([[0.95846336, 0.24449218, 0.70448788, 0.99157708],
       [0.75955074, 0.30768819, 0.4732268 , 0.23431481]])

np.random.randint(100,size=(4,4))

array([[25, 42, 96, 78],
       [22, 40, 82, 37],
       [67, 89, 91, 45],
       [97, 77, 39, 51]])

（b）ndarray的数据类型——dtype

（i）查看dtype

arr1 = np.array([1,2,3],dtype=np.float64)

arr2 = np.array([1,2,3],dtype=np.int32)

arr1.dtype

dtype('float64')

arr2.dtype

dtype('int32')

（ii）转换dtype——astype

arr = np.array([1,2,3,4,5])

arr.dtype

dtype('int32')

float_arr = arr.astype(np.float64)

float_arr.dtype

dtype('float64')

浮点数转换成整数，小数部分会被截断，例如：

arr = np.random.randn(3,4)

arr

array([[ 0.85802555,  0.05701799,  0.077082  , -0.38405232],
       [ 0.20142852, -0.87765168,  1.69069697,  0.99902233],
       [ 0.52238487, -1.7109163 , -0.58673934,  1.68724587]])

arr.astype(np.int32)

array([[ 0,  0,  0,  0],
       [ 0,  0,  1,  0],
       [ 0, -1,  0,  1]])

给当前ndarray的dtype赋值另一个ndarray的dtype

int_arr = np.arange(10)

int_arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

int_arr.astype(float_arr.dtype)

array([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

（c）基础运算（重要性值：vectorization）

a = np.arange(1,13).reshape(3,4)

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

（i）加法

a+a

array([[ 2,  4,  6,  8],
       [10, 12, 14, 16],
       [18, 20, 22, 24]])

（ii）减法

a-a

array([[0, 0, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]])

（iii）乘法

a*a

array([[  1,   4,   9,  16],
       [ 25,  36,  49,  64],
       [ 81, 100, 121, 144]])

（iv）除法（注意不要除0）

a/a

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

（v）传播（类似broadcasting）

ndarray与标量之间的运算会传播到每个元素

1/a

array([[1.        , 0.5       , 0.33333333, 0.25      ],
       [0.2       , 0.16666667, 0.14285714, 0.125     ],
       [0.11111111, 0.1       , 0.09090909, 0.08333333]])

a ** 2

array([[  1,   4,   9,  16],
       [ 25,  36,  49,  64],
       [ 81, 100, 121, 144]], dtype=int32)

（vi）比较

与不同数组的比较
与标量的比较

b = np.array([[1,7,4,3],
              [12,4,54,23],
              [9,7,6,44]])

array([[ 1,  7,  4,  3],
       [12,  4, 54, 23],
       [ 9,  7,  6, 44]])

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

# ndarray与ndarray的比较
a > b

array([[False, False, False,  True],
       [False,  True, False, False],
       [False,  True,  True, False]])

# ndarray与标量的比较，broadcasting机制
a < 6

array([[ True,  True,  True,  True],
       [ True, False, False, False],
       [False, False, False, False]])

（vii）sin/cos/tan …

#sin/cos/tan ...
10*np.sin(a)

array([[ 8.41470985,  9.09297427,  1.41120008, -7.56802495],
       [-9.58924275, -2.79415498,  6.56986599,  9.89358247],
       [ 4.12118485, -5.44021111, -9.99990207, -5.36572918]])

（viii）矩阵乘法

a.T代表矩阵的转置
a.dot(b)或np.dot(a,b)代表矩阵a与矩阵b做矩阵乘法

a.dot(a.T)

array([[ 30,  70, 110],
       [ 70, 174, 278],
       [110, 278, 446]])

np.dot(a,a.T)

array([[ 30,  70, 110],
       [ 70, 174, 278],
       [110, 278, 446]])

与a*b的区别

a*a

array([[  1,   4,   9,  16],
       [ 25,  36,  49,  64],
       [ 81, 100, 121, 144]])

（ix）最小值，最大值，求和

最小值：min
最大值：max
求和：sum
**可以用axis分别对行或列求以上三个值

#最小值，最大值，求和
print(a)
print(np.min(a))
print(np.max(a))
print(np.sum(a))

#定义axis来在某一列或一行求和，求最大值，求最小值；axis = 0代表行，axis = 1代表列
print(np.min(a,axis=0))

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
1
12
78
[1 2 3 4]

（d）索引和切片

arr = np.arange(3,15)

arr

array([ 3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

（i）start：end：step

arr[3]

arr[3:6]

array([6, 7, 8])

arr[3:6]=12 #broadcasting

arr

array([ 3,  4,  5, 12, 12, 12,  9, 10, 11, 12, 13, 14])

arr[3:10:2]

array([12, 12, 10, 12])

对多维数组

arr2d = np.arange(1,10).reshape((3,3))

arr2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

#第1行和第2行
arr2d[:2]

array([[1, 2, 3],
       [4, 5, 6]])

#第2列和第3列
arr2d[:,1:]

array([[2, 3],
       [5, 6],
       [8, 9]])

#[2,2], [2,3], [3,2], [3,3]的内容
arr2d[1:,1:]

array([[5, 6],
       [8, 9]])

（ii）浅复制而非深复制

arr_slice = arr[3:6] #直接用代表这是个浅复制

arr_slice[2]=20

arr

array([ 3,  4,  5, 12, 12, 20,  9, 10, 11, 12, 13, 14])

arr_slice2 = arr[3:6].copy() #用copy()代表这是个深复制

arr_slice2[2]=200

arr

array([ 3,  4,  5, 12, 12, 20,  9, 10, 11, 12, 13, 14])

（iii）索引

arr3d = np.arange(1,13).reshape((2,2,3))

arr3d

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

arr3d[0]

array([[1, 2, 3],
       [4, 5, 6]])

arr3d[0][1]
# arr3d[0,1]也行

array([4, 5, 6])

arr3d[0,1]

array([4, 5, 6])

arr3d[0,1,2]

（iv）bool型索引

names = np.array(['Bob','Joe','Will','Bob','Joe','Will','Joe'])

data = np.random.randn(7,4)

names

array(['Bob', 'Joe', 'Will', 'Bob', 'Joe', 'Will', 'Joe'], dtype='

 
  data
 
  array([[-0.67049599, -0.26062926, -2.18117138, -0.12773764],
       [-0.58401462, -1.32029132,  2.58490103,  0.70486619],
       [-0.88625639,  0.5378594 ,  1.43502916,  0.16710821],
       [ 2.37130421,  0.24034913,  1.3959    , -0.66045837],
       [ 1.56083756,  0.55371859, -0.79279555,  1.38047116],
       [ 0.69331481, -0.48217467,  0.04360928,  0.38047942],
       [ 0.09901121,  0.43095669, -0.20241129,  0.13803783]])
 
  names == 'Bob'
 
  array([ True, False, False,  True, False, False, False])
 
  data[names == 'Bob'] #布尔型数组可用作索引
 
  array([[-0.67049599, -0.26062926, -2.18117138, -0.12773764],
       [ 2.37130421,  0.24034913,  1.3959    , -0.66045837]])
 
  data[~(names == 'Bob')] #反选
 
  array([[-0.58401462, -1.32029132,  2.58490103,  0.70486619],
       [-0.88625639,  0.5378594 ,  1.43502916,  0.16710821],
       [ 1.56083756,  0.55371859, -0.79279555,  1.38047116],
       [ 0.69331481, -0.48217467,  0.04360928,  0.38047942],
       [ 0.09901121,  0.43095669, -0.20241129,  0.13803783]])
 
  data[names!='Bob'] #反选，同上
 
  array([[-0.58401462, -1.32029132,  2.58490103,  0.70486619],
       [-0.88625639,  0.5378594 ,  1.43502916,  0.16710821],
       [ 1.56083756,  0.55371859, -0.79279555,  1.38047116],
       [ 0.69331481, -0.48217467,  0.04360928,  0.38047942],
       [ 0.09901121,  0.43095669, -0.20241129,  0.13803783]])
 
  # 配合&，|等其他布尔算数运算符使用
mask = (names=='Bob')| (names =='Will')
 
  Python关键字and和or在布尔型数组中⽆效。要是⽤& 和|。 
  mask
 
  array([ True, False,  True,  True, False,  True, False])
 
  data[mask]
 
  array([[-0.67049599, -0.26062926, -2.18117138, -0.12773764],
       [-0.88625639,  0.5378594 ,  1.43502916,  0.16710821],
       [ 2.37130421,  0.24034913,  1.3959    , -0.66045837],
       [ 0.69331481, -0.48217467,  0.04360928,  0.38047942]])
 
  通过布尔型数组设置值 
  #不想有小于0的数
data[data<0]=0
 
  data
 
  array([[0.        , 0.        , 0.        , 0.        ],
       [0.        , 0.        , 2.58490103, 0.70486619],
       [0.        , 0.5378594 , 1.43502916, 0.16710821],
       [2.37130421, 0.24034913, 1.3959    , 0.        ],
       [1.56083756, 0.55371859, 0.        , 1.38047116],
       [0.69331481, 0.        , 0.04360928, 0.38047942],
       [0.09901121, 0.43095669, 0.        , 0.13803783]])
 
  通过一维布尔数组设置行和列的值 
  data[names != 'Joe']=6
 
  data
 
  array([[6.        , 6.        , 6.        , 6.        ],
       [0.        , 0.        , 2.58490103, 0.70486619],
       [6.        , 6.        , 6.        , 6.        ],
       [6.        , 6.        , 6.        , 6.        ],
       [1.56083756, 0.55371859, 0.        , 1.38047116],
       [6.        , 6.        , 6.        , 6.        ],
       [0.09901121, 0.43095669, 0.        , 0.13803783]])
 
  （v）花式索引（Fancy indexing） 
   
   利用整数数组进行索引 
   
  arr = np.zeros((8,4))
 
  for i in range(8):
    arr[i]=i
 
  arr
 
  array([[0., 0., 0., 0.],
       [1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.],
       [5., 5., 5., 5.],
       [6., 6., 6., 6.],
       [7., 7., 7., 7.]])
 
  arr[[4,3,0,6]] #[4,3,0,6]代表取第4，3，0，6行
 
  array([[4., 4., 4., 4.],
       [3., 3., 3., 3.],
       [0., 0., 0., 0.],
       [6., 6., 6., 6.]])
 
  arr[[-3,-1,-2]] #负数就代表逆向取，和下标的负数是一样的
 
  array([[5., 5., 5., 5.],
       [7., 7., 7., 7.],
       [6., 6., 6., 6.]])
 
  arr = np.arange(32).reshape((8,4))
 
  arr
 
  array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])
 
  arr[[4,3,0,6],[0,3,1,2]] #取[4,0], [3,3], [0,1], [6,2]，也就是行坐标是[4,3,0,6]，纵坐标是[0,3,1,2]，行纵坐标一一对应
 
  array([16, 15,  1, 26])
 
  arr[[1,5,7,2]][:,[0,3,1,2]] #按顺序取[[1,5,7,2]]行，[:,[0,3,1,2]]的“:”代表取[[1,5,7,2]]的全部行，按[0,3,1,2]顺序排列
#多理解！
 
  array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])
 
  （vi）数组转置和轴对换（在计算部分有提到过） 
  arr = np.arange(15).reshape((3,5))
 
  arr
 
  array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
 
  arr.T
 
  array([[ 0,  5, 10],
       [ 1,  6, 11],
       [ 2,  7, 12],
       [ 3,  8, 13],
       [ 4,  9, 14]])
 
  np.dot(arr,arr.T)
 
  array([[ 30,  80, 130],
       [ 80, 255, 430],
       [130, 430, 730]])
 
  转置 
   
   arr.T（简单的轴对换） 
   transpose()（需要轴编号） 
   swapaxes() （需要轴编号） 
   
  arr=np.arange(16).reshape((2,2,4))
 
  arr
 
  array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]]])
 
  arr.transpose((1,0,2)) #(1,0,2)代表axis=0，1，2的交换，这边是0轴和1轴进行交换
 
  array([[[ 0,  1,  2,  3],
        [ 8,  9, 10, 11]],

       [[ 4,  5,  6,  7],
        [12, 13, 14, 15]]])
 
  arr.swapaxes(1,2)
 
  array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]],

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]]])
 
  arr.swapaxes(1,2).shape
 
  (2, 4, 2)
 
  （2）通用函数（用来做基础运算） 
   
   对ndarray中元素执行元素级运算的函数 
   快速，简单 
   
  （a）一元通用函数（unary ufunc） 
  arr = np.arange(10)
 
  arr
 
  array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
 
  （i）求square root 
  np.sqrt(arr)
 
  array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])
 
  （ii）求exponential 
  np.exp(arr)
 
  array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])
 
  （b）二元通用函数（binary ufunc） 
  x = np.random.randn(8)
 
  y = np.random.randn(8)
 
  x
 
  array([ 1.69534398, -0.20536174,  1.23043455,  1.96227903, -0.79695811,
        0.47007701, -0.06528047,  2.29325038])
 
  y
 
  array([ 0.40641935,  1.22983554, -0.18501079,  0.92984369,  1.01300343,
        0.11191783, -1.83815574, -1.67414424])
 
  （i）元素最大值/最小值 
  np.maximum(x,y)
 
  array([ 1.69534398,  1.22983554,  1.23043455,  1.96227903,  1.01300343,
        0.47007701, -0.06528047,  2.29325038])
 
  np.minimum(x,y)
 
  array([ 0.40641935, -0.20536174, -0.18501079,  0.92984369, -0.79695811,
        0.11191783, -1.83815574, -1.67414424])
 
  （ii）modf函数——返回remainder和quotient 
  arr = np.random.randn(7)*5
 
  arr
 
  array([ 5.39802994, -4.68762509,  6.4421605 , -1.19891402, 12.72916784,
        0.49999429, 10.21618861])
 
  remainder, quotient = np.modf(arr)
 
  remainder
 
  array([ 0.39802994, -0.68762509,  0.4421605 , -0.19891402,  0.72916784,
        0.49999429,  0.21618861])
 
  quotient
 
  array([ 5., -4.,  6., -1., 12.,  0., 10.])
 
  （3）利用ndarray进行数据处理 
  （a）例子 
  
points = np.arange(-5,5,0.01)
 
  xs, ys = np.meshgrid(points,points)
 
  z = np.sqrt(xs**2+ys**2)
 
  import matplotlib.pyplot as plt
 
  plt.title("Image of $\sqrt{x^2+y^2}$")
plt.imshow(z,cmap=plt.cm.gray)
 
  
 
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A0f87ZX2-1603093279106)(output_184_1.png)] 
  （b）将条件逻辑表述为数组运算（np.where） 
   
   where里面可以传数组，也可以传标量 
   
  （i）对数组操作 
  xarr = np.arange(1.1,1.6,0.1)
 
  yarr = np.arange(2.1,2.6,0.1)
 
  cond = np.array([True, False, True, True, False])
 
  result = np.where(cond,xarr,yarr)
 
  result
 
  array([1.1, 2.2, 1.3, 1.4, 2.5])
 
  （ii）使用标量：正值全部换成2，负值全部换成-2 
  arr = np.random.randn(4,4)
 
  arr
 
  array([[-1.09102617,  0.14488428,  0.39996343, -0.58025741],
       [ 0.16935005, -0.35147731,  0.12913876, -1.627593  ],
       [-0.91612171, -1.43681774, -0.20800336, -0.25200059],
       [-0.73166757,  1.37763498,  0.31321662, -0.44070821]])
 
  np.where(arr > 0, 2, -2)
 
  array([[-2,  2,  2, -2],
       [ 2, -2,  2, -2],
       [-2, -2, -2, -2],
       [-2,  2,  2, -2]])
 
  （iii）数组+标量 
  np.where(arr > 0, 2, arr) #arr的元素大于0的就换成2，否则不变
 
  array([[-1.09102617,  2.        ,  2.        , -0.58025741],
       [ 2.        , -0.35147731,  2.        , -1.627593  ],
       [-0.91612171, -1.43681774, -0.20800336, -0.25200059],
       [-0.73166757,  2.        ,  2.        , -0.44070821]])
 
  （c）数学和统计方法 
   
   通过数组上的⼀组数学函数对整个数组或某个轴向的数据进⾏统计计算 
   
  arr = np.arange(20).reshape(5,4)
 
  arr
 
  array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])
 
  （i）计算平均值 
  arr.mean()
 
  9.5
 
  np.mean(arr)
 
  9.5
 
  np.average(arr)
 
  9.5
 
  在某个axis求平均值 
  arr.mean(0) #0轴上的平均值->平均值在横轴上->每列的所有数的平均值
 
  array([ 8.,  9., 10., 11.])
 
  np.mean(arr,axis=0)
 
  array([ 8.,  9., 10., 11.])
 
  （ii）求和 
  arr.sum()
 
  190
 
  np.sum(arr)
 
  190
 
  在某个axis求和 
  np.sum(arr,axis=1)
 
  array([ 6, 22, 38, 54, 70])
 
  arr.sum(1)
 
  array([ 6, 22, 38, 54, 70])
 
  （iii）计算累加值/累乘值 
  arr.cumsum()
 
  array([  0,   1,   3,   6,  10,  15,  21,  28,  36,  45,  55,  66,  78,
        91, 105, 120, 136, 153, 171, 190], dtype=int32)
 
  np.cumprod(arr) #第一个数字是0
 
  array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
      dtype=int32)
 
  在axis上求累加值/累乘值 
  arr.cumsum(1)
 
  array([[ 0,  1,  3,  6],
       [ 4,  9, 15, 22],
       [ 8, 17, 27, 38],
       [12, 25, 39, 54],
       [16, 33, 51, 70]], dtype=int32)
 
  np.cumprod(arr,axis=1)
 
  array([[    0,     0,     0,     0],
       [    4,    20,   120,   840],
       [    8,    72,   720,  7920],
       [   12,   156,  2184, 32760],
       [   16,   272,  4896, 93024]], dtype=int32)
 
  （iv）求中位数 
  np.median(arr)
 
  9.5
 
  (v)求最大值/最小值 
  np.max(arr)
 
  19
 
  np.min(arr)
 
  0
 
  np.max(arr,axis=0)
 
  array([16, 17, 18, 19])
 
  （vi）求最大值最小值的索引 
  np.argmin(arr)
 
  0
 
  np.argmax(arr)
 
  19
 
  （vii）求标准差和方差 
  np.std(arr)
 
  5.766281297335398
 
  np.var(arr)
 
  33.25
 
  （d）用于布尔型数组的方法 
  arr = np.random.randn(100)
 
  （i）常用sum计数 
  (arr > 0).sum() #arr元素大于0的有几个
 
  52
 
  （ii）全部是True/部分是True 
  bools = arr>0
 
  bools
 
  array([False, False, False, False,  True,  True,  True,  True,  True,
       False, False, False,  True, False,  True, False,  True, False,
       False, False, False, False, False, False,  True,  True,  True,
        True, False,  True, False,  True,  True,  True,  True,  True,
       False,  True, False,  True,  True, False, False, False,  True,
       False,  True, False,  True,  True,  True,  True,  True, False,
       False, False,  True, False,  True,  True, False,  True, False,
        True,  True, False,  True,  True,  True, False, False,  True,
        True, False,  True,  True, False,  True, False,  True, False,
       False, False, False,  True, False,  True, False,  True, False,
       False,  True,  True,  True, False,  True,  True, False,  True,
       False])
 
  bools.any()
 
  True
 
  bools.all()
 
  False
 
  （iii）排序 
  arr = np.array(np.random.randn(6)*10, dtype=np.int32)
 
  arr
 
  array([ 2, 21, -9, -7,  7, -2])
 
  arr.sort()
 
  arr
 
  array([-9, -7, -2,  2,  7, 21])
 
  在axis上排序 
  arr = np.array(np.random.randn(5,3)*10,dtype=np.int32)
 
  arr
 
  array([[  4,   9,   9],
       [-11,   3, -18],
       [  8,   9,   5],
       [ -5,   7,  -1],
       [ 16,   3, -10]])
 
  arr.sort(1)
 
  arr
 
  array([[  4,   9,   9],
       [-18, -11,   3],
       [  5,   8,   9],
       [ -5,  -1,   7],
       [-10,   3,  16]])
 
  （e）唯一化以及它的集合逻辑 
  （i）np.unique 
  names = np.array(['Amy','Bob','Carol','Dark','Amy','Carol','Sky','Dark'])
 
  np.unique(names) #排序+唯一
 
  array(['Amy', 'Bob', 'Carol', 'Dark', 'Sky'], dtype='
 
  （ii）np.in1d 
  values1 = np.array(np.random.randn(5)*10,dtype=np.int32)
 
  values1
 
  array([ 0,  9, -9, 11, -4])
 
  values2 = np.arange(6)
 
  values2
 
  array([0, 1, 2, 3, 4, 5])
 
  np.in1d(values1,values2) #values2的元素是否在values1中
 
  array([ True, False, False, False, False])
 
  （4）用于数组的文件输入输出 
   
   save：保存 
   savez：将多个数组保存 
   savez_compressed：如果数据压缩得很好就可以用这个 
   load：加载 
   
  arr = np.arange(10)
 
  np.save('some_array',arr) # 保存，如果⽂件路径末尾没有.npy，则该扩展名会被⾃动加上
 
  np.load('some_array.npy') #读取磁盘上的数组
 
  array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
 
  np.savez('mul_arrays.npz',a=arr,b=arr)
 
  arch = np.load('mul_arrays.npz')
 
  arch['a']
 
  array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
 
  arch['b']
 
  array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
 
  （5）线性代数 
  之前有提到过不少方法了 
  x = np.arange(1,7).reshape(2,3)
 
  y = np.array([[6., 23.],
              [-1,7],
              [8,9]])
 
  x
 
  array([[1, 2, 3],
       [4, 5, 6]])
 
  y
 
  array([[ 6., 23.],
       [-1.,  7.],
       [ 8.,  9.]])
 
  （a）矩阵乘法 
  x.dot(y)
 
  array([[ 28.,  64.],
       [ 67., 181.]])
 
  np.dot(x,y)
 
  array([[ 28.,  64.],
       [ 67., 181.]])
 
  x@y
 
  array([[ 28.,  64.],
       [ 67., 181.]])
 
  （b）numpy.linalg 
  from numpy.linalg import inv, qr
 
  x = np.random.randn(5,5)
 
  mat = x.T.dot(x)
 
  （i）inv() 
  inv(mat) # invert 逆
 
  array([[ 891.89281934, -170.61175297,  309.30921484,  -20.04646306,
         331.54866714],
       [-170.61175297,   34.31559149,  -58.38536593,    4.86214551,
         -63.16345462],
       [ 309.30921484,  -58.38536593,  108.49295298,   -6.21220496,
         115.01146399],
       [ -20.04646306,    4.86214551,   -6.21220496,    1.31252171,
          -7.36221202],
       [ 331.54866714,  -63.16345462,  115.01146399,   -7.36221202,
         123.49445396]])
 
  a = mat.dot(inv(mat))
 
  a # 有误差，所以看起来不太像I
 
  array([[ 1.00000000e+00, -7.89016539e-15,  2.58787478e-14,
        -5.90488249e-15,  3.81666466e-14],
       [ 2.88347099e-16,  1.00000000e+00, -1.53280197e-14,
        -5.64103998e-15, -2.88340488e-14],
       [-3.41925805e-14,  7.92307257e-15,  1.00000000e+00,
         3.11646821e-15, -1.01181538e-15],
       [-1.21304008e-13, -5.78606747e-16, -1.37942448e-14,
         1.00000000e+00, -2.22511130e-14],
       [ 3.98501266e-14,  1.39518727e-14,  5.26455377e-14,
         3.24456882e-15,  1.00000000e+00]])
 
  a.dtype
 
  dtype('float64')
 
  a.round()
 
  array([[ 1., -0.,  0., -0.,  0.],
       [ 0.,  1., -0., -0., -0.],
       [-0.,  0.,  1.,  0., -0.],
       [-0., -0., -0.,  1., -0.],
       [ 0.,  0.,  0.,  0.,  1.]])
 
  （ii）qr() 
   
   Compute the qr factorization of a matrix. 
   Factor the matrix a as qr, where q is orthonormal and r is upper-triangular. 
   
  q, r = qr(mat)
 
  r
 
  array([[-2.96659044e+00, -3.21767296e+00,  3.93922588e-01,
         2.99766871e+00,  6.13702819e+00],
       [ 0.00000000e+00, -3.82625378e+00, -2.29884715e+00,
         7.41479928e+00,  6.24315251e-01],
       [ 0.00000000e+00,  0.00000000e+00, -1.40167295e+00,
         1.16181054e+00,  1.37841479e+00],
       [ 0.00000000e+00,  0.00000000e+00,  0.00000000e+00,
        -6.45930290e-01, -3.89372289e-02],
       [ 0.00000000e+00,  0.00000000e+00,  0.00000000e+00,
         0.00000000e+00,  2.64955879e-03]])
 
  q
 
  array([[-0.43313575,  0.09964799,  0.17103318,  0.03903137,  0.87845768],
       [-0.34127079, -0.46320476,  0.42064025, -0.68119717, -0.16735529],
       [ 0.21554375, -0.27033019, -0.7555402 , -0.46557635,  0.30472964],
       [ 0.13012615,  0.81285083,  0.0841993 , -0.5611334 , -0.01950661],
       [ 0.79532116, -0.2042223 ,  0.46462772, -0.05305607,  0.32720582]])
 
  （6）伪随机数生成（numpy.random） 
  Python内置的random模块则只能⼀次⽣成⼀个样本值，如果需要产⽣⼤量样本值，numpy.random快了不⽌⼀个数量级，以下是测试： 
  from random import normalvariate
 
  N = 1000000
 
  %timeit samples = [normalvariate(0,1) for i in range(N)]
 
  1.87 s ± 140 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
 
  %timeit np.random.normal(size=N)
 
  55 ms ± 3.45 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
 
  （a）标准正态分布（normal distribution） 
  samples = np.random.normal(size=(4,4))
 
  samples
 
  array([[ 1.79400576, -0.34332551, -0.7315326 ,  0.37596174],
       [ 0.68897482, -1.01607419, -0.18746967,  0.03575278],
       [ 0.04196738,  0.96214581, -1.3443093 ,  1.14355111],
       [ 0.32311173, -1.22932036,  0.14297192,  1.8289397 ]])
 
  （b）均匀分布（uniform distribution） 
  samples2 = np.random.uniform(size=(4,4))
 
  samples2
 
  array([[0.33197232, 0.50249425, 0.20872139, 0.44100725],
       [0.79970626, 0.8493364 , 0.38371009, 0.80270876],
       [0.81254287, 0.80318489, 0.18548665, 0.48484211],
       [0.60264807, 0.41739885, 0.62637336, 0.27848417]])
 
  （7）随机漫步 
  简单的随机漫步的例⼦：从0开始，步⻓1和－1出现的概率相等 
  import random
position = 0
walk = [position]
steps = 1000
for i in range(steps):
    step = 1 if random.randint(0,1) else -1
    position += step
    walk.append(position)
 
  plt.plot(walk[:100])
 
  []
 
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7fGfelnv-1603093279110)(output_306_1.png)] 
  不难看出，这其实就是随机漫步中各步的累计和，可以⽤⼀个数组运算来实现。 
  nsteps = 1000
 
  draws = np.random.randint(0,2,size = nsteps)
 
  steps = np.where(draws>0,1,-1)
 
  walk = steps.cumsum()
 
  plt.plot(walk[:100])
 
  []
 
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mCojaA3b-1603093279111)(output_312_1.png)] 
  一次模拟多个随机漫步 
  nwalks = 50 #模拟50个随机漫步
 
  nsteps = 1000
 
  draws = np.random.randint(0,2,size = (nwalks, nsteps))
 
  steps = np.where(draws>0,1,-1)
 
  walks = steps.cumsum(1) #沿着列找累加值，也就是求行累加值
 
  walks
 
  array([[ -1,  -2,  -3, ...,  -2,  -1,  -2],
       [ -1,   0,   1, ...,  12,  11,  12],
       [ -1,  -2,  -1, ..., -18, -17, -18],
       ...,
       [  1,   0,   1, ...,   8,   7,   8],
       [  1,   2,   3, ..., -42, -41, -42],
       [ -1,   0,  -1, ...,  16,  15,  16]], dtype=int32)
 
  walks.max()#计算所有随机漫步过程的最大值
 
  79
 
  walks.min()#计算所有随机漫步过程的最小值
 
  -100
 
  hits30 = (np.abs(walks) >= 30).any(1) #沿着列找有到达过一次±30的随机漫步
 
  hits30
 
  array([False, False,  True,  True, False,  True,  True,  True,  True,
        True,  True,  True,  True,  True, False,  True,  True,  True,
       False,  True, False, False,  True,  True,  True, False,  True,
        True, False,  True,  True, False,  True, False,  True,  True,
        True, False,  True, False, False,  True,  True,  True,  True,
       False,  True, False,  True, False])
 
  hits30.sum() #求所有True的数量
 
  33
 
  （8）numpy的合并 
  A=np.array([1,1,1])
B=np.array([2,2,2])
 
  # vertical stack
print(np.vstack((A,B)))
print(np.vstack((A,B)).shape)
 
  [[1 1 1]
 [2 2 2]]
(2, 3)
 
  # horizontal stack
print(np.hstack((A,B)))
print(np.hstack((A,B)).shape)
 
  [1 1 1 2 2 2]
(6,)
 
  #如何实现把横向数列改成竖的数列，transpose不能实现
print(A[:,np.newaxis])#给横轴每一项在纵向加维度

A1 = np.array([1,1,1])[:,np.newaxis]
B1 = np.array([2,2,2])[:,np.newaxis]
print(A1)
print(B1)
C1 = np.vstack((A1,B1))
print(C1)
print(C1.shape)
D1 = np.hstack((A1,B1,B1,A1))
print(D1)
print(D1.shape)
 
  [[1]
 [1]
 [1]]
[[1]
 [1]
 [1]]
[[2]
 [2]
 [2]]
[[1]
 [1]
 [1]
 [2]
 [2]
 [2]]
(6, 1)
[[1 2 2 1]
 [1 2 2 1]
 [1 2 2 1]]
(3, 4)
 
  #多个array纵向或横向的合并
C2 = np.concatenate((A1,B1,B1,A1),axis=0)
print(C2)
 
  [[1]
 [1]
 [1]
 [2]
 [2]
 [2]
 [2]
 [2]
 [2]
 [1]
 [1]
 [1]]
 
  （9）numpy array 的分割 
  A = np.arange(12).reshape(3,4)
 
  A
 
  array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
 
  # 均等分割，可以控制维度
np.split(A,2,axis=1)
 
  [array([[0, 1],
        [4, 5],
        [8, 9]]),
 array([[ 2,  3],
        [ 6,  7],
        [10, 11]])]
 
  # 不等量的分割，可以控制维度
np.array_split(A,3,axis=1)
 
  [array([[0, 1],
        [4, 5],
        [8, 9]]),
 array([[ 2],
        [ 6],
        [10]]),
 array([[ 3],
        [ 7],
        [11]])]
 
  #纵向均等分割
np.vsplit(A,3)
 
  [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]
 
  #纵向均等分割
np.hsplit(A,2)
 
  [array([[0, 1],
        [4, 5],
        [8, 9]]),
 array([[ 2,  3],
        [ 6,  7],
        [10, 11]])]
 
  （10）浅复制和深复制 
  a = np.arange(4)
 
  a
 
  array([0, 1, 2, 3])
 
  #赋值运算符的浅复制
b = a
c = a
d = b
a[0]=100
print(b is a)
print("b: ",b)
print(c is a)
print("c: ",c)
print(d is a)
print("d: ",d)
 
  True
b:  [100   1   2   3]
True
c:  [100   1   2   3]
True
d:  [100   1   2   3]
 
  #copy()深复制
b=a.copy()
print(b is a)
print("b: ",b)
 
  False
b:  [100   1   2   3]

python文本处理beautifulsoup4库安装与使用范哥来了 python 开发语言
BeautifulSoup4（通常简称为bs4）是一个非常强大的Python库，用于从HTML和XML文件中提取数据。它能够解析文档，并提供方便的方法来遍历、搜索和修改解析树。下面是如何安装以及一些基本的使用示例。安装beautifulsoup4首先，确保你的环境中已经安装了Python和pip（Python的包管理工具）。然后，在命令行中运行以下命令来安装beautifulsoup4：pipin
【python】协程（coroutine） atwdy Python python coroutine 协程 asyncio
协程（coroutine）可以理解为一个可以中途暂停保存当前执行状态信息并可以从此处恢复执行的函数，多个协程共用一个线程执行，适合执行需要“等待”的任务。所以严格意义上，多个协程同一时刻也只有一个在真正的执行，因为线程是任务调度的基本单位。注意这里的执行指的是占用CPU计算，不包括等待阻塞等场景。python中实现协程的标准库是asyncio，标准库的实现中大致可以由底层到顶层分为下面几个对象：c
基于阿里云调用deepseek大模型 atwdy 大模型 deepseek deepseek-r1 deepseek API 阿里云
文章目录1.单轮对话2.多轮对话参考文档选择需要调用的模型，每个模型的详细信息中会有API示例（deepseek-r1），需要做的就是申请自己的APIkey就行了，过程中可能需要实名认证。python中安装OpenAISDK：pipinstallopenai。安装后如果出现ImportError，可能是python的版本低了，升级下版本。当前测试环境是Python3.9.7，openai==1.6
01计算机视觉学习计划依旧阳光的老码农计算机视觉计算机视觉人工智能
计算机视觉系统学习计划（3-6个月）本计划按照数学→编程→图像处理→机器学习→深度学习→3D视觉→项目实战的顺序，确保从基础到高级，结合理论和实践。第一阶段（第1-2个月）：基础夯实✅目标：掌握数学基础、Python/C++编程、基本图像处理1️⃣数学基础（2周）每日2小时线性代数：矩阵运算、特征值分解（推荐《线性代数及其应用》）概率统计：高斯分布、贝叶斯定理微积分：偏导数、梯度下降傅里叶变换：图
python-Scrapy爬虫框架介绍（整个数据的流程） onesalatree Scrapy框架爬虫 python 软件框架爬虫 scrapy
python-Scrapy爬虫框架介绍随着在家的线上教育的进行，课程的深入学习，所要学习的内容和作业也在不断的增多，所以没有过多的自己的时间去学习新的爬虫知识，但疫情逐渐的在好转，我也很是期待开学的那一天，毕竟线上教育的效果没有在学校的更为显著，主要是老师们录课很辛苦今天我想和兄弟们分享一下Scrapy爬虫的原理，也是自己最近刚学习的，有什么不足的地方兄弟们可以评论你或者私信喔。Python爬虫的
Conda操作使用教程迷鹿鹿鹿鹿鹿 conda
声明：该文章仅为学习使用，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！如有侵权，请私信联系本人删帖！Conda操作使用教程Conda是一个开源的包管理和环境管理工具，支持多种编程语言（以Python为主）。它能够帮助用户快速安装、运行和更新软件包，并创建相互隔离的虚拟环境，避免项目之间的依赖冲突。目录Conda的安装基础命令虚拟环境管理包管理环境导出与共享常见问题总结一、安装1
使用 Dlib 库进行人脸检测和人脸识别萧鼎 python基础到进阶教程计算机视觉人工智能 python 人脸识别人脸检测
使用Dlib库进行人脸检测和人脸识别什么是Dlib？Dlib是一个广泛使用的C++库，提供了多种用于机器学习和计算机视觉的工具。它包含了人脸检测、人脸识别、物体检测、图像处理等功能。Dlib具有高效、易用的Python接口，因此它也被广泛应用于Python中进行深度学习和计算机视觉任务。安装Dlib首先，我们需要在Python环境中安装Dlib库。你可以通过pip进行安装：pipinstalldl
Python图形界面开发：PyQt与Tkinter对比分析萧鼎 python基础到进阶教程 python pyqt 数据库
Python图形界面开发：PyQt与Tkinter对比分析图形用户界面（GUI）是应用程序中不可或缺的一部分，可以帮助用户更直观地与程序进行交互。Python拥有许多开发GUI的库，其中PyQt和Tkinter是最受欢迎的两个选择。本篇博客将从功能、易用性、性能、社区支持、学习曲线等角度对比分析这两个库，并通过一个简单的实战项目帮助你更直观地理解它们的差异。一、PyQt与Tkinter简介1.Py
网页自动化测试和爬虫：Selenium库入门与进阶萧鼎 python基础到进阶教程爬虫 selenium 测试工具
网页自动化测试和爬虫：Selenium库入门与进阶在现代Web开发和数据分析中，自动化测试和数据采集成为了开发流程中的重要部分。Python的Selenium库是一种强大的工具，不仅用于网页自动化测试，也在网页爬虫中得到了广泛的应用。本文将带你从Selenium的基础用法入手，逐步深入到进阶技巧，帮助你轻松应对网页自动化任务。一、Selenium简介与安装Selenium是一个浏览器自动化工具，可
Python中的PDF处理工具：PyPDF2和ReportLab使用指南萧鼎 python基础到进阶教程 python pdf pypdf2 reportlab
Python中的PDF处理工具：PyPDF2和ReportLab使用指南在日常工作和项目中，PDF文件处理是个常见需求，不论是合并报告、加密文档、填充表单，还是生成发票。Python中有许多用于操作PDF文件的库，其中PyPDF2和ReportLab是两个广泛使用的工具：前者用于PDF文档的读取和修改，后者用于从头生成PDF文件。在这篇博客中，我们将介绍如何使用PyPDF2和ReportLab完成
DevOps落地实践点滴和踩坑记录-(1) xuhss_com 计算机 devops 运维计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统记录初衷本人一直在从事企业内DevOps落地实践的工作，走了不少弯路，也努力在想办法解决面临的问题，期间也经历过不少人和事
一分钟教会你如何把 DeepSeek 接入 WPS，开启智能办公新体验！多模态大模型 wps 人工智能 chatgpt 自然语言处理产品经理大模型 deepseek
在数字化办公的时代，如何高效地处理文档、生成创意内容以及进行数据分析，是每一个职场人士的刚需。DeepSeek作为一款强大的AI助手，能够帮助我们快速完成这些任务。而WPS作为国内最受欢迎的办公软件之一，其与DeepSeek的结合，无疑是提升办公效率的绝佳选择。今天，就让我们一起来学习如何将DeepSeek接入WPS，让你的办公效率瞬间提升！一、入门知识点：DeepSeek是什么？DeepSeek
一文读懂！OpenCV 实时人脸识别从 0 到 1，小白也能轻松实操的超详细教程（完整教程及源码） AI_DL_CODE opencv 人工智能计算机视觉人脸识别
摘要：本文围绕使用OpenCV实现实时人脸识别展开。从环境搭建入手，详细介绍Python及相关库的安装。数据准备环节涵盖收集、标注及预处理步骤。深入阐述特征提取、模型训练方法，包含传统与深度学习方式，还介绍OpenCV预训练模型的使用与评估。详细讲解实时识别过程，包括打开摄像头、逐帧处理及结果显示优化。针对复杂场景，提出光照、姿态、遮挡等问题的解决办法及模型更新维护策略。通过丰富代码示例与解释，助
Python爬虫丨批量下载必应4K壁纸凌小添 Python爬虫项目 python 爬虫开发语言
1.项目背景经常用电脑的朋友应该会发现，电脑锁屏页面是微软必应每天更新的精美壁纸，偶尔还能看到一些十分惊艳的壁纸，于是我去寻找如何下载他们，我在GitHub上闲逛时，还真发现一个自动归档这些壁纸的仓库。该项目由GitHub用户niumoo维护，项目地址：niumoo/bing-wallpaper。该项目每天自动归档必应首页美图！但当我点开README.md时，发现仓库仅保存图片Markdown索引
练习题：70 狐凄练习算法
Python题目题目编写一个函数，接受两个参数，进行除法运算，如果除数为0，使用try-except语句捕获异常并返回错误信息。题目分析需求理解本题要求使用Python编写一个函数，该函数接收两个参数，对这两个参数进行除法运算。在运算过程中，需要考虑除数为0的特殊情况，当除数为0时，不能让程序崩溃，而是要使用try-except语句捕获异常，并返回相应的错误信息。关键知识点函数定义：在Python
Python OCR库：自动化测试验证码识别神器！测试大大怪 python ocr selenium appium 功能测试测试用例测试工具
在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库，包括pyocr、pytesseract和python-tesseract、EasyOCR。本文将对它们进行比较，并提供一些示例代码来演示它们在实际接口自动化工作中的应用。1、pyocrPyOCR是一
python量化交易——金融数据管理最佳实践——使用qteasy大批量自动拉取金融数据 QTEASY量化交易 qteasy 量化交易 python python 金融量化交易
文章目录使用数据获取渠道自动填充数据QTEASY数据拉取功能数据拉取接口`refill_data_source()`数据拉取API的功能特性多渠道拉取数据实现下载流量控制实现错误重试日志记录其他功能qteasy是一个功能全面且易用的量化交易策略框架，Github地址在这里。使用它，能轻松地获取历史数据，创建交易策略并完成回测和优化，还能实盘运行。项目文档在这里。使用qteasy,您可以非常容易地在
初学者如何用 Python 写第一个爬虫？陆鳐LuLu python 爬虫开发语言
编写第一个Python爬虫并不难，以下是一个简单的步骤指南，帮助从零开始。1.安装必要的库首先，你需要安装requests和BeautifulSoup这两个库。requests用于发送HTTP请求，BeautifulSoup用于解析HTML内容。pipinstallrequestsbeautifulsoup42.导入库在你的Python脚本中导入所需的库。importrequestsfrombs4
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe statistics.insight 数据科学持续学习机器学习数据挖掘数据分析人工智能 python
python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe目录python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库#python使用pandas创建dataframe仿真数据、将字典数据转化为dataframe#导入包和库importpandasaspdimportnumpyasnp#不显示关于在切片副本上设
第十五届蓝桥杯python组 Rainbow一定行蓝桥杯python组蓝桥杯
填空题试题A:拼正方形【问题描述】小蓝正在玩拼图游戏，他有7385137888721个2×2的方块和10470245个1×1的方块，他需要从中挑出一些来拼出一个正方形，比如用3个2×2和4个1×1的方块可以拼出一个4×4的正方形，用9个2×2的方块可以拼出一个6×6的正方形，请问小蓝能拼成的最大的正方形的边长为多少。【答案提交】这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数
(二)使用Pandas进行数据分析 - 查询数据的几种方法数据人章同学数据分析数据挖掘机器学习
Pandas查询数据的几种方法df.loc方法，根据行、列的标签值查询（#.loc既能查询，又能覆盖写入）df.iloc方法，根据行、列的数字位置查询df.where方法df.query方法Pandas使用df.loc查询数据的方法使用单个label值查询数据使用值列表批量查询数据使用数值区间进行范围查询使用条件表达式查询调用函数查询Attention！以上查询方法，既适用于行，也适用于列注意观察
python中的numpy库有什么优缺点_python中关于numpy库的介绍 weixin_34938347
1.Numpy是什么？NumPy(NumericalPython的缩写)是一个开源的Python科学计算库。使用NumPy，就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数，涵盖线性代数运算、傅里叶变换和随机数生成等功能。这个库的前身是1995年就开始开发的一个用于数组运算的库。经过了长时间的发展，基本上成了绝大部分Python科学计算的基础包，当然也包括所有提供Python接口的深
Python 记录日志报警的方式 Tipriest_ Python学习 python 前端 logging 报警 alarm mail
在Python标准库中，可以列举出如下常见场景日志报警解决方案：方案1：简单日志告警（推荐基础方案）importloggingdefsend_alert(message):logging.error(f"ALERT:{message}")#可扩展：同时写入文件/发送到日志服务器#配置日志格式logging.basicConfig(level=logging.ERROR,format='%(asct
工业级Pandas性能优化：Dask/Modin实战教程闲人编程 Python数据分析实战精要 pandas 性能优化分布式 GPU加速 Dask Modin 数据分析
目录工业级Pandas性能优化：Dask/Modin实战教程1.引言与背景1.1Pandas的局限性1.2分布式计算与GPU加速的需求1.3Dask与Modin简介2.数据集介绍3.工业级数据处理理论基础3.1内存优化3.2计算并行化3.3GPU加速4.实验环境与依赖库5.数据处理与分析流程6.Dask实战：分布式计算与GPU加速7.Modin实战：简洁易用的并行Pandas接口8.数据分析领域的
python numpy学习黄小猿 python numpy meshgrid
目录np.meshgridnp.where1.np.meshgrid可以生成一对协调的点，x=np.arange(-5,5,1)y=np.arange(-5,5,1)xx,yy=np.meshgrid(x,y,sparse=True)xx#输出：array([[-5,-4,-3,-2,-1,0,1,2,3,4]])yy#输出：array([[-5],[-4],[-3],[-2],[-1],[0],
栈的应用--括号匹配(python篇) Nanhuiyu 数据结构python描述 python pycharm 数据结构
这篇文章将使用python实现栈的应用之括号匹配首先，明确需求，需求是：1,通过控制台输入一串字符串，判断是否全为括号；2,将括号分为左括号和右括号；3,创建一个栈，将左括号入栈，同时从字符串中取出右括号，进行匹配，若匹配成功，则该左括号出栈，否则右括号入新栈；4,当字符串匹配完成时，对两个栈的长度进行匹配，若长度相等且为零，则表示匹配成功，若长度相等且不为零，则对栈内元素进行匹配，若重新匹配使得
深度学习主流经典框架PyTorch（day2） inquisitor.dom 深度学习 pytorch 人工智能
五、Tensor数据转换5.1张量转numpy浅拷贝调用numpy()方法可以把Tensor转换为Numpy，此时内存是共享的。#张量转numpydata_tensor=torch.tensor([[1,2,3],[4,5,6]])data_numpy=data_tensor.numpy()print(type(data_tensor),type(data_numpy))#他们内存是共享的data
conda的作用一只积极向上的小咸鱼 conda
一概览Conda是一个开源的包管理和环境管理工具，主要用于Python及其他编程语言的依赖管理和环境隔离。它的核心作用有以下几点：1.包管理可以安装、更新、卸载Python及其依赖包（类似于pip）。支持多语言（不仅限于Python，还支持C/C++,R,Ruby,Lua等）。依赖自动管理，能解决复杂的库依赖问题，例如：condainstallnumpypandas2.环境管理允许创建多个独立的虚
python如何获取期权行情数据 python自动化工具量化投资 python 区块链开发语言
最近几天股指期权日内趋势比较明显，但是期权行情数据不易获得，好在akshare库为提供了一个便捷的途径来获取期权行情数据。本文将介绍如何使用Python和akshare库来获取交易所金融期权标的物当日行情数据、返回品种所有合约以及期权行情分钟数据。1.获取上海证券交易所金融期权标的物当日行情数据需要导入akshare库，并使用ak.option_finance_sse_underlying函数来获
多版本Python共存后端架构魔法构筑者 python 开发语言 Python
多版本Python共存Python是一种非常流行的编程语言，有许多不同版本的Python可供使用。在某些情况下，您可能需要在同一台计算机上安装多个版本的Python，以便能够运行不同版本的Python脚本或应用程序。本文将介绍如何在Windows和Linux操作系统上安装和配置多个Python版本。Windows系统在Windows上安装多个Python版本非常容易。您可以从Python官方网站下
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

《利用Python进行数据分析》笔记+整理+案例 NumPy（第一部分）

1. numpy

（0）引入

（1）ndarray：多维数组对象

（a）创建ndarray

（i）使用array函数+其他序列比如tuple, list等

（ii）使用zeros/zeros_like

（iii）使用ones/ones_like

（iv）使用empty（定义出来的是一些接近0的没啥意义的值）

（v）使用arange+reshape的组合

（vi）使用linspace(start, end, number_of_points)+reshape的组合

（vii）使用identity/eye（对角线为1，其余为0的N*N矩阵）

（viii）随机生成

（b）ndarray的数据类型——dtype

（i）查看dtype

（ii）转换dtype——astype

（c）基础运算（重要性值：vectorization）

（i）加法

（ii）减法

（iii）乘法

（iv）除法（注意不要除0）

（v）传播（类似broadcasting）

（vi）比较

（vii）sin/cos/tan …

（viii）矩阵乘法

（ix）最小值，最大值，求和

（d）索引和切片

（i）start：end：step

（ii）浅复制而非深复制

（iii）索引

（iv）bool型索引

（v）花式索引（Fancy indexing）

（vi）数组转置和轴对换（在计算部分有提到过）

（2）通用函数（用来做基础运算）

（a）一元通用函数（unary ufunc）

（i）求square root

（ii）求exponential

（b）二元通用函数（binary ufunc）

（i）元素最大值/最小值

（ii）modf函数——返回remainder和quotient

（3）利用ndarray进行数据处理

（a）例子

（b）将条件逻辑表述为数组运算（np.where）

（i）对数组操作

（ii）使用标量：正值全部换成2，负值全部换成-2

（iii）数组+标量

（c）数学和统计方法

（i）计算平均值

（ii）求和

（iii）计算累加值/累乘值

（iv）求中位数

(v)求最大值/最小值

（vi）求最大值最小值的索引

（vii）求标准差和方差

（d）用于布尔型数组的方法

（i）常用sum计数

（ii）全部是True/部分是True

（iii）排序

（e）唯一化以及它的集合逻辑

（i）np.unique

（ii）np.in1d

（4）用于数组的文件输入输出

（5）线性代数

（a）矩阵乘法

（b）numpy.linalg

（i）inv()

（ii）qr()

（6）伪随机数生成（numpy.random）

（a）标准正态分布（normal distribution）

（b）均匀分布（uniform distribution）

（7）随机漫步

一次模拟多个随机漫步

（8）numpy的合并

（9）numpy array 的分割

（10）浅复制和深复制

你可能感兴趣的:(python,numpy,数据分析)