wuzlun

利用Python进行数据分析笔记－Numpy基础

跟着教程学习了一段时间数据分析，越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下，方便自己查看。

import matplotlib.pyplot as plt
import numpy as np

创建n维数组

1、使用array函数

最简单的方法使用array函数，输入一个序列即可，比如list

# 随机生成数据
data = np.random.randn(2, 3)
data

array([[ 1.8878077 , -0.09071248, -0.17286876],
       [-1.39093014, -1.82384125,  0.82493751]])

每一个数组都有一个shape，来表示维度大小。而dtype，用来表示data type：

# 多维数组
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

print('维度大小：',arr2.shape)
print('维度值：', arr2.ndim)
print('数据类型：',arr2.dtype)

维度大小： (2, 4)
维度值： 2
数据类型： int32

除非主动声明，否则np.array会自动给data搭配适合的类型，并保存在dtype里

也可以指定数据类型

arr1 = np.array([1, 2, 3], dtype=np.float64)
arr2 = np.array([1, 2, 3], dtype=np.int32)
print('arr1数据类型：',arr1.dtype)
print('arr2数据类型：',arr2.dtype)

arr1数据类型： float64
arr2数据类型： int32

用astype来转换类型，astype总是会返回一个新的数组

把float变为int，小数点后的部分会被丢弃

int_arr1 = arr1.astype(np.int)
int_arr1.dtype

dtype('int32')

2、其它方法

除了np.array，还有一些其他函数能创建数组。比如zeros,ones,另外还可以在一个tuple里指定shape

np.zeros((3, 6))

array([[0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.]])

# np.empty并不能保证返回所有是0的数组，某些情况下，会返回为初始化的垃圾数值，如下面
np.empty((2, 3, 2))

array([[[5.63e-322, 0.00e+000],
        [0.00e+000, 0.00e+000],
        [0.00e+000, 0.00e+000]],

       [[0.00e+000, 0.00e+000],
        [0.00e+000, 0.00e+000],
        [0.00e+000, 0.00e+000]]])

np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

数组计算

数组之所以重要，是因为不用写for循环就能表达很多操作，这种特性叫做vectorization(向量化)。任何两个大小相等的数组之间的运算，都是element-wise（点对点）

data = np.arange(5)
print('*:', data*10)
print('+:',data+data)

*: [ 0 10 20 30 40]
+: [0 2 4 6 8]

# 两个数组的比较会产生布尔数组：
arr1 = np.array([[1., 2., 3.], [4., 5., 6.]])
arr2 = np.array([[0., 4., 1.], [7., 2., 12.]])
arr2 > arr1

array([[False,  True, False],
       [ True, False,  True]])

索引和切片

一维数组操作同list，array的切片后的结果只是一个views（视图），用来代表原有array对应的元素，而不是创建了一个新的array。但list里的切片是产生了一个新的list

arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d[2]

array([7, 8, 9])

arr2d[2][1]

arr2d[:2]

array([[1, 2, 3],
       [4, 5, 6]])

# 前两行，第二列之后
arr2d[:2, 1:]

array([[2, 3],
       [5, 6]])

arr2d[:2, 2]

array([3, 6])

# 冒号表示提取整个axis（轴）
arr2d[:, :1]

array([[1],
       [4],
       [7]])

# 多维数组
arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
arr3d

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

arr3d[1, 0]   # 该操作相当于 x = arr3d[1]， x[0]的结果

array([7, 8, 9])

布尔索引

data = np.random.randn(7, 4)
data

array([[-1.33904841, -1.4637553 , -1.377123  ,  0.09439955],
       [ 1.40173772,  2.63681109, -2.11408761, -1.19171294],
       [-1.58056578,  0.22323485,  1.85082002, -0.76870622],
       [ 0.18076579, -0.24595339,  1.21591539,  0.30617942],
       [-0.80319239,  0.64991022, -0.46159542, -1.23788867],
       [ 1.16571902,  0.98157039, -1.3452736 ,  0.22940809],
       [-0.01013532, -0.31661346,  1.57364789,  0.05199267]])

# 让所有负数变为0
data[data < 0] = 0
data

array([[0.        , 0.        , 0.        , 0.09439955],
       [1.40173772, 2.63681109, 0.        , 0.        ],
       [0.        , 0.22323485, 1.85082002, 0.        ],
       [0.18076579, 0.        , 1.21591539, 0.30617942],
       [0.        , 0.64991022, 0.        , 0.        ],
       [1.16571902, 0.98157039, 0.        , 0.22940809],
       [0.        , 0.        , 1.57364789, 0.05199267]])

# ~表示反转
data[~(data < 0)] = 0
data

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

花式索引

不论数组有多少维，花式索引的结果总是一维，要记住，fancy indexing和切片不同，得到的是一个新的array。

# 创建一个8 x 4的空数组
arr = np.empty((8, 4))
for i in range(8):
    arr[i] = i
arr

array([[0., 0., 0., 0.],
       [1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.],
       [5., 5., 5., 5.],
       [6., 6., 6., 6.],
       [7., 7., 7., 7.]])

# 按一定顺序选出几行，索引值
arr[[4, 3, 0, 6]]

array([[4., 4., 4., 4.],
       [3., 3., 3., 3.],
       [0., 0., 0., 0.],
       [6., 6., 6., 6.]])

#　负号来从后选择
arr[[-3, -5, -7]]

array([[5., 5., 5., 5.],
       [3., 3., 3., 3.],
       [1., 1., 1., 1.]])

arr = np.arange(32).reshape((8, 4))
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

# 可以看到[ 4, 23, 29, 10]分别对应(1, 0), (5, 3), (7, 1), (2, 2)
arr[[1, 5, 7, 2], [0, 3, 1, 2]]

array([ 4, 23, 29, 10])

arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]

array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

上面的意思是，先从arr中选出[1, 5, 7, 2]这四行：

array([[ 4,  5,  6,  7],
       [20, 21, 22, 23],
       [28, 29, 30, 31],
       [ 8,  9, 10, 11]])

然后[:, [0, 3, 1, 2]]表示选中所有行，但是列的顺序要按0,3,1,2来排。于是得到：

array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

数组转置和轴交换

转置也是返回一个view，而不是新建一个数组。有两种方式，一个是transpose方法，一个是T属性：

arr = np.arange(15).reshape((3, 5))
arr

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

arr.T

array([[ 0,  5, 10],
       [ 1,  6, 11],
       [ 2,  7, 12],
       [ 3,  8, 13],
       [ 4,  9, 14]])

arr = np.arange(8).reshape((4, 2))
print('转换后',arr.T)
print('原始值',arr)

转换后 [[0 2 4 6]
 [1 3 5 7]]
原始值 [[0 1]
 [2 3]
 [4 5]
 [6 7]]

np.dot(arr.T, arr)

array([[56, 68],
       [68, 84]])

上面的例子是 (2x4) x (4x2) = (2x2)。得到的结果是2x2维，就是普通的矩阵乘法。

对于多维数组，transpose会接受由轴数字组成的tuple，来交换轴：

arr = np.arange(16).reshape((2, 2, 4))
arr

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]]])

arr.transpose((1, 0, 2))

array([[[ 0,  1,  2,  3],
        [ 8,  9, 10, 11]],

       [[ 4,  5,  6,  7],
        [12, 13, 14, 15]]])

这里，secode axis(1)被设为第一个，first axis(0)第二个，最后的axis没边。

使用.T来转置swapping axes(交换轴)的一个特殊情况。ndarray有方法叫做swapaxes, 这个方法取两个axis值，并交换这两个轴：

arr

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]]])

# 直交换second axis和last axis
# swapaxes也是返回view，不生成新的data。
arr.swapaxes(1, 2)

array([[[ 0,  4],
        [ 1,  5],
        [ 2,  6],
        [ 3,  7]],

       [[ 8, 12],
        [ 9, 13],
        [10, 14],
        [11, 15]]])

　通用函数

1、一元通用函数

arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

# 取根号
np.sqrt(arr)

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

# 指数
np.exp(arr)

array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])

2、二元通用函数

x = np.random.randn(8)
y = np.random.randn(8)
print('x=',x)
print('y=',y)

x= [ 1.62629116  0.50042105  0.88487288 -0.51454008 -0.89496779 -0.08716105
 -0.89026276 -0.15930902]
y= [ 1.20995668  1.57812313  0.75357992  0.27981496 -1.21836378 -2.21635872
  0.46375206  0.12810278]

# 取最大值
np.maximum(x, y)

array([ 1.62629116,  1.57812313,  0.88487288,  0.27981496, -0.89496779,
       -0.08716105,  0.46375206,  0.12810278])

尽管不常见，但ufunc也能返回多个数组。例如modf，这是一个向量版的divmod（python内建函数），modf会返回小数部分和整数部分：

本函数是实现a除以b，然后返回商与余数的元组。如果两个参数a,b都是整数，那么会采用整数除法，结果相当于（a//b, a % b)。如果a或b是浮点数，相当于（math.floor(a/b), a%b)。

arr = np.random.randn(7) * 5
arr

array([ 0.23231361,  1.94750024, -5.65093763, -7.51480076, -0.34334917,
        6.57644177,  1.85733655])

remainder, whole_part = np.modf(arr)
# 返回小数部分
remainder

array([ 0.23231361,  0.94750024, -0.65093763, -0.51480076, -0.34334917,
        0.57644177,  0.85733655])

# 返回整数部分
whole_part

array([ 0.,  1., -5., -7., -0.,  6.,  1.])

伪随机数

之所以称之为伪随机数，是因为随机数生成算法是根据seed来生成的。也就是说，只要seed设置一样，每次生成的随机数是相同的：

相对的，python内建的random模块一次只能生成一个样本。在生成大量样本方法，numpy.random是非常快的：

np.random.seed(2018)
samples = np.random.normal(size=(4, 4))
samples

array([[-0.2767676 ,  0.581851  ,  2.14839926, -1.279487  ],
       [ 0.50227689,  0.8560293 , -0.14279008,  0.11007867],
       [-0.68806479,  0.43356408,  0.510221  , -0.16513097],
       [-1.35177905,  0.54663075,  1.23065512,  1.0764461 ]])

seed是全局的，如果想要避免全局状态，可以用numpy.random.RandomState来创建一个独立的生成器

rng = np.random.RandomState(2017)
samples = np.random.normal(size=(4, 4))
samples

array([[-1.21062488, -0.30667657, -1.05741884,  0.40205692],
       [ 0.28916512,  1.28273322, -1.0656958 , -1.70663287],
       [-0.17279739,  0.06371017,  0.37062839, -1.60454294],
       [-2.16572937,  0.38037013, -0.27650109, -0.57568194]])

下面是是写numpy.random里的函数：

数组导向编程

# [X,Y] = meshgrid(x,y) 将向量x和y定义的区域转换成矩阵X和Y
# 其中矩阵X的行向量是向量x的简单复制，而矩阵Y的列向量是向量y的简单复制
m, n = (5, 3)
x = np.linspace(0, 1, m)  #  linspace() 线性等分向量（linear space）
y = np.linspace(0, 1, n)
X, Y = np.meshgrid(x, y)
print('x=',x)
print('y=',y)
print()
print('X=',X)
print('Y=',Y)

x= [0.   0.25 0.5  0.75 1.  ]
y= [0.  0.5 1. ]

X= [[0.   0.25 0.5  0.75 1.  ]
 [0.   0.25 0.5  0.75 1.  ]
 [0.   0.25 0.5  0.75 1.  ]]
Y= [[0.  0.  0.  0.  0. ]
 [0.5 0.5 0.5 0.5 0.5]
 [1.  1.  1.  1.  1. ]]

逻辑条件

np.where(a,b,c)
np.where中第二个和第三个参数不用必须是数组
- a为真返回b
- a为假返回c

xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])

result = np.where(cond, xarr, yarr)
result

array([1.1, 2.2, 1.3, 1.4, 2.5])

# 把所有的正数变为2，所有的负数变为-2
arr = np.random.randn(4, 4)
print('arr= ', arr)

np.where(arr > 0, 2, -2)

arr=  [[-1.69790361  1.14692981  2.01866833  1.19685501]
 [-1.29768641  0.96410493  0.51591302 -0.04725618]
 [ 0.97338591 -0.88312949  0.53144571  1.0647404 ]
 [-0.60385003 -1.21294763  0.70985062  0.23991391]]





array([[-2,  2,  2,  2],
       [-2,  2,  2, -2],
       [ 2, -2,  2,  2],
       [-2, -2,  2,  2]])

# 只把整数变为2，其他仍未原来的数字
np.where(arr > 0, 2, arr)

array([[-1.69790361,  2.        ,  2.        ,  2.        ],
       [-1.29768641,  2.        ,  2.        , -0.04725618],
       [ 2.        , -0.88312949,  2.        ,  2.        ],
       [-0.60385003, -1.21294763,  2.        ,  2.        ]])

数学和统计方法

arr = np.random.randn(5, 4)
arr

array([[ 0.42185431,  0.7047803 ,  0.04540116,  0.53069007],
       [ 0.13812536,  0.37046313, -0.0538778 ,  1.072796  ],
       [ 0.41525259, -0.79155701, -0.80337487,  0.00400008],
       [ 0.8381884 ,  0.04708372, -2.22118689,  0.44879045],
       [-0.01343378,  0.78704248,  0.18833414, -1.58023087]])

print('平均值：', arr.mean())
print('平均值：', np.mean(arr)) # 同上
print('中位数：', np.median(arr))

print('求和：', arr.sum())
print('方差：',arr.var())
print('标准差', arr.std())

print('最小值：',arr.min())
print('最大值：',arr.max())
print('最大值与最小值之间的差值：', np.ptp(arr))
print()
print('数组中最小元素的索引值：',arr.argmin())
print('数组中最大元素的索引值：',arr.argmax())

print('\n绝对值：\n', np.abs(arr))

print()
print('返回一个由相邻数组元素的差值构成的数组：\n', np.diff(arr))

平均值： 0.02745704812129939
平均值： 0.02745704812129939
中位数： 0.16322975085704675
求和： 0.5491409624259878
方差： 0.6344954097327102
标准差 0.7965522015114328
最小值： -2.2211868856516417
最大值： 1.0727959997704182
最大值与最小值之间的差值： 3.29398288542206

数组中最小元素的索引值： 14
数组中最大元素的索引值： 7

绝对值：
 [[0.42185431 0.7047803  0.04540116 0.53069007]
 [0.13812536 0.37046313 0.0538778  1.072796  ]
 [0.41525259 0.79155701 0.80337487 0.00400008]
 [0.8381884  0.04708372 2.22118689 0.44879045]
 [0.01343378 0.78704248 0.18833414 1.58023087]]

返回一个由相邻数组元素的差值构成的数组：
 [[ 0.28292599 -0.65937913  0.48528891]
 [ 0.23233777 -0.42434094  1.1266738 ]
 [-1.2068096  -0.01181786  0.80737495]
 [-0.79110468 -2.26827061  2.66997733]
 [ 0.80047625 -0.59870834 -1.76856501]]

# axis作为参数来计算统计数字
print('横向：',arr.mean(axis=1))  # 横向
print('横向：',arr.mean(1))
print()
print('纵向：',arr.mean(axis=0))  # 纵向
print('纵向：',arr.mean(0))
print()
print('横向：',arr.sum(axis=1))  # 横向
print('纵向：',arr.sum(0))  # 纵向

横向： [-1.47618477 -0.40924536  0.27245489  0.22881218  1.1980545 ]
横向： [-1.47618477 -0.40924536  0.27245489  0.22881218  1.1980545 ]

纵向： [-0.22275301  0.02190233 -0.6217432   0.67370703]
纵向： [-0.22275301  0.02190233 -0.6217432   0.67370703]

横向： [-5.90473907 -1.63698144  1.08981957  0.91524871  4.79221799]
纵向： [-1.11376504  0.10951164 -3.10871598  3.36853515]

# 元素累计和
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7])
arr.cumsum()

array([ 0,  1,  3,  6, 10, 15, 21, 28], dtype=int32)

arr = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
arr

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

# 纵向相加
arr.cumsum(axis=0) # 纵向

array([[ 0,  1,  2],
       [ 3,  5,  7],
       [ 9, 12, 15]], dtype=int32)

# 横向相乘
arr.cumprod(axis=1) # 横向

array([[  0,   0,   0],
       [  3,  12,  60],
       [  6,  42, 336]], dtype=int32)

布尔数组的方法

# 数组中大于0的个数
arr = np.random.randn(100)   # 返回符合正态分布的数值
(arr > 0).sum()

any检测数组中只要有一个ture返回就是true
all检测数组中都是true才会返回true

bools = np.array([False, False, True, False])
print('any结果：', bools.any())
print('all结果：', bools.all())

any结果： True
all结果： False

排序

直接调用数组的arr.sort()方法，会改变原有数组的顺序。
如果使用np.sort(arr)函数的话，会生成一个新的排序后的结果。

arr = np.random.randn(10)
print('排序前：\n', arr)
arr.sort()
print('排序后：\n', arr)

排序前：
 [ 1.59249466  0.6515314  -0.22653    -2.09396182  1.98428654 -0.41047994
  0.4461693   0.53309987  0.50317313  0.45538713]
排序后：
 [-2.09396182 -0.41047994 -0.22653     0.4461693   0.45538713  0.50317313
  0.53309987  0.6515314   1.59249466  1.98428654]

如果是多维数组，还可以按axis来排序：

arr = np.random.randn(5, 3)  # 5行3列
arr

array([[ 0.64807367,  0.64734467, -0.57956506],
       [ 1.30009271, -1.0096845 , -0.90608046],
       [ 0.96544172, -0.82934629, -0.1372017 ],
       [ 1.2585547 ,  0.90157093,  1.55362495],
       [-1.22715482, -1.68016336, -1.31421393]])

# arr.sort(1) # 横向
# arr.sort(0) # 纵向
arr.sort(axis=1)  # 同上
arr

array([[-0.57956506,  0.64734467,  0.64807367],
       [-1.0096845 , -0.90608046,  1.30009271],
       [-0.82934629, -0.1372017 ,  0.96544172],
       [ 0.90157093,  1.2585547 ,  1.55362495],
       [-1.68016336, -1.31421393, -1.22715482]])

# 一个计算分位数的快捷方法是先给数组排序，然后选择某个排名的值：
large_arr = np.random.randn(1000)
large_arr.sort()
large_arr[int(0.05 * len(large_arr))] # 5% quantile

-1.5947780268732517

Numpy也有一些基本的集合操作用于一维数组。np.unique，能返回排好序且不重复的值：

names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
np.unique(names)

array(['Bob', 'Joe', 'Will'], dtype='

 
  ints = np.array([3, 3, 3, 2, 2, 1, 1, 4, 4])
np.unique(ints) 
  array([1, 2, 3, 4])
 
  线性代数 
  矩阵乘法 
  # 矩阵乘法
x = np.array([[1., 2., 3.], [4., 5., 6.]])
y = np.array([[6., 23.], [-1, 7], [8, 9]])
print('x:\n',x)
print('y:\n',y)

# x.dot(y)等同于np.dot(x, y)
x.dot(y) 
  x:
 [[1. 2. 3.]
 [4. 5. 6.]]
y:
 [[ 6. 23.]
 [-1.  7.]
 [ 8.  9.]]





array([[ 28.,  64.],
       [ 67., 181.]])
 
  一个二维数组和一个一维数组的矩阵乘法，得到一个一维数组： 
  np.dot(x, np.ones(3))  
# 这里应该是用狂了boradcasting，x中的每一行与[1, 1, 1]点对点乘积后求和 
  array([ 6., 15.])
 
  # @作为一个中缀计算符，也能实现矩阵乘法：
x @ np.ones(3) 
  array([ 6., 15.])
 
  矩阵分解 
  np.linalg能用来做矩阵分解，以及比如转置和求秩之类的事情： 
  from numpy.linalg import inv, qr

# X = np.round(np.random.randn(5, 5), 3) # 这里我们用np.round控制小数点后的位数，看起来更舒服一些
X = np.random.randn(5, 5)
X 
  array([[-0.24821301, -0.73158913,  1.89565751, -1.23795063, -0.63359619],
       [ 0.29635489,  0.50478366, -0.31098479, -1.34502933,  0.17482175],
       [ 2.02590827, -1.15869345, -0.8894822 ,  0.266318  ,  1.07333646],
       [-1.31303883, -1.40763291, -0.4048509 , -1.92894314, -0.86348757],
       [ 0.2866783 ,  0.73102305,  0.11381171, -1.74766983,  0.77151067]])
 
  # X.T.dot(X)计算的是X和X的转置的矩阵乘法。
mat = X.T.dot(X)
np.round(mat, 2) 
  array([[ 6.06,  0.04, -1.8 ,  2.48,  3.74],
       [ 0.04,  4.65,  0.14,  1.36,  1.09],
       [-1.8 ,  0.14,  4.66, -1.58, -1.77],
       [ 2.48,  1.36, -1.58, 10.19,  1.15],
       [ 3.74,  1.09, -1.77,  1.15,  2.92]])
 
  np.round(inv(mat), 2) 
  array([[ 2.22,  0.9 , -0.58, -0.37, -3.38],
       [ 0.9 ,  0.62, -0.3 , -0.18, -1.48],
       [-0.58, -0.3 ,  0.45,  0.13,  1.07],
       [-0.37, -0.18,  0.13,  0.17,  0.55],
       [-3.38, -1.48,  1.07,  0.55,  5.65]])
 
  np.round(mat.dot(inv(mat)), 2) 
  array([[ 1.,  0.,  0.,  0., -0.],
       [-0.,  1.,  0.,  0.,  0.],
       [ 0., -0.,  1.,  0.,  0.],
       [-0., -0.,  0.,  1., -0.],
       [ 0.,  0., -0., -0.,  1.]])
 
  q, r = qr(mat)
np.round(r, 2) 
  array([[-7.75, -0.98,  3.85, -6.13, -5.12],
       [ 0.  , -4.87, -0.19, -3.13, -0.96],
       [ 0.  ,  0.  , -3.97,  1.72,  0.59],
       [ 0.  ,  0.  ,  0.  , -8.08,  0.83],
       [ 0.  ,  0.  ,  0.  ,  0.  ,  0.15]])
 
  一些常用的numpy.linalg函数：

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
python读写CSV文件 bcbobo21cn .Net python 开发语言机器学习 CSV
做数据分析，有时候要分析的数据在CSV文件里；先看一下python读写CSV文件；importpandasaspddf=pd.read_csv('test1.csv')print(df)print('')print(df.head(2))companyname=["A1","B2","E3","F4"]legperson=["lier","yanqi","wangwu","zhangsan"]le
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
python数据分析知识点大全编程零零七 python数据分析 python 开发语言 python数据分析数据分析知识点大全 python数据分析知识点 python教程 python基础
Python数据分析知识点大全可以归纳为以下几个主要方面：一、基础概念与目的数据分析定义：数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论，对数据加以详细研究和概括总结的过程。其目的在于从数据中挖掘规律、验证猜想、进行预测。Python在数据分析中的优势：Python因其易学性、快速开发、丰富的扩展库（如NumPy、Pandas等）和成熟的框架，成为数据分析领域的
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
OmicsTools除b站教学视频外已整理的零代码生信全流程分析文档邢博士谈科教医学科研生信分析 r语言数据可视化数据挖掘数据分析生信医学生信分析
OmicsTools软件介绍和下载安装配置软件简介我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools，欢迎大家使用OmicsTools进行生物医学科研数据分析和作图，该软件件能让大家在不需要任何编程和代码编写的基础上，分析次数没有限制，可以无限使用，让您在自己电脑上快速进行大量的生信分析和加速大家的科研。OmicsTools生信分析电脑软件可以做医学生物生信各个
【数据分析】利用Python+AI+工作流实现自动化数据分析-全流程讲解 z千鑫 AI领域 FLASK基础 Python基础人工智能数据分析 python AI编程 AI工作流 ai 自动化
文章目录一、为什么要用AI进行自动化分析？二、AI自动化分析场景三、编写Python脚本示例1、用flask实现让AI分析数据内容使用说明：示例2、用定时任务的方式，定时处理AI数据代码说明四、把AI分析的数据，放到AI工作流中做展示五、openAI的key结尾在信息爆炸的时代，如何快速获取有价值的洞察力成为了各行各业的迫切需求。传统的内容分析方法往往又耗时又费力，并且难以满足快速变化的市场需求。
Mall4j商城实战 - 部署 canal 数据库增量日志解析 yueerba126 Mall4j商城实战数据库 spring cloud 微服务架构
Canal简介Canal是基于MySQL数据库增量日志解析的工具，主要用于增量数据的订阅和消费。Canal主要用途基于MySQL数据库增量日志解析详细功能：实时解析MySQL的二进制日志（Binlog）。捕获数据库中的所有增量变更，如插入、更新和删除操作。使用场景：适用于实时监控数据库变化的应用，比如数据复制、数据备份或实时数据分析等。提供增量数据订阅和消费服务
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
Rust: duckdb和polars读csv文件比较 songroom rust 开发语言后端
duckdb在数据分析上，有非常多不错的特质。1、快；2、客户体验好，特别是可以同时批量读csv（在一个目录下的csv等文件）。polars的性能比pandas有非常多的超越。但背后的一些基于arrow的技术栈有很多相同之类。今天想比较一下两者在csv数据读写的情况。一、文件准备csv样本内容，是N行9列的csv标准格式，有字符串，有浮点数，有整型。具体如下：本次准备了两个csv文件，一个大约是2
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
Python最全的股票数据API接口 w_traveler python 开发语言大数据
python最全的股票数据API接口使用python是一种有效的方式来获取高频股票数据，以便进行股票行情数据分析和量化交易。python是一种广泛应用于金融数据领域的编程语言，可用于与股票数据API接口进行交互。通过调用股票数据API接口，我们可以获取实时的股票数据，包括tick数据和k线历史数据。tick数据提供了每次交易的详细信息，而k线历史数据则提供了一段时间内港股、美股、A股、沪深行情数据
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
新质农业-再生农业的应用橙蜂智农人工智能制造创业创新
橙蜂智能公司致力于提供先进的人工智能和物联网解决方案，帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。橙蜂智农的智慧农业产品涵盖了多方面的功能，如智能化推荐、数据分析、远程监控和决策支持系统。用户可以通过应用获得个性化的作物种植建议、实时的生长状态监控以及精确的灌溉和施肥指导，提升农业生产效率。文
利用发电量和气象数据分析来判断光伏仿真系统的准确性鹧鸪云光伏与储能软件开发数据分析数据挖掘光伏发电大数据光伏新能源
随着光伏产业的迅速发展，光伏仿真系统通过集成气象数据分析、发电量分析、投融资分析及损耗估算等功能，为光伏项目的全生命周期管理提供了科学依据。光伏仿真系统集成了气象数据分析、发电量预测、投融资分析、损耗估算及光伏设计等功能。其中，气象数据分析是仿真系统的基石，通过整合权威的气象数据（如Meteonorm、Nasa等），模拟光伏电站所在区域的历史气象条件及未来气象预测。基于这些气象数据，发电量分析功能
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

利用Python进行数据分析笔记－Numpy基础

创建n维数组

1、使用array函数

2、其它方法

数组计算

索引和切片

布尔索引

花式索引

数组转置和轴交换

通用函数

1、一元通用函数

2、二元通用函数

伪随机数

数组导向编程

逻辑条件

数学和统计方法

布尔数组的方法

排序

线性代数

矩阵乘法

矩阵分解

你可能感兴趣的:(数据分析,利用Python进行数据分析)

　通用函数