愤怒的可乐

一文弄懂广播机制以及NumPy和Torch中的乘法操作

引言

当我们要计算向量或矩阵a 乘以b 时，numpy和pytorch提供了各种方法傻傻分不清。我们今天就来把它们梳理清楚。

广播

在这之前，必须先弄懂广播机制。在NumPy和PyTorch中都有广播机制。

当要进行运算(不仅仅是乘法)的两个向量的形状不同时，如果符合某种条件，小向量会被广播成大的向量，使得它们的维度一致。

当要进行广播时，会逐元素地比较它们的形状。如果两个向量a和b的形状相同。那么像a*b就是对应元素相乘。

> a = np.array([1.0, 2.0, 3.0])
> b = np.array([2.0, 2.0, 2.0])
> a * b
array([2., 4., 6.])

当运算中的两个向量形状不同，但满足某些条件时，将触发广播机制。

> a = np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
> b = np.array([1,2,3]) #  (3,) -> (1,3) -> (4,3)
> a + b
array([[ 1,  2,  3],
       [11, 12, 13],
       [21, 22, 23],
       [31, 32, 33]])

下图很好的图示了上面的计算过程：

这里b是一个元素个数为3的数组，把它从左边添加一个维度，变成 $\times 3)$ 的向量，然后在第1个维度上重复4次，变成了 $\times 3)$ 的矩阵，使得a和b的维度一致，再进行对应元素相加的加法运算。

上面说的某些条件是，首先让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在维度左边加 1 补齐，然后比较对应维度值，需要满足：

它们是相等的
其他一个为1

如果不满足该条件，就无法进行广播。

理论总是枯燥的，需要通过实例来理解。

还是以上面的例子为例，

a # (4,3)
b = np.array([1,2,3]) #  (3,) -> (1,3) -> (4,3)

a的形状是 $\times 3)$ ，b的形状是 $(3,)$ ，b需要向a看齐，首先在其维度左边加1，直到它们拥有相同的维度个数(即a.ndim == b.ndim 为True)，因此这里变成 $(1, 3)$ ；

比较它们的第一个维度值，a和b分别是 $4$ 和 $1$ ，此时b在该维度上重复4次，向大佬看齐，b变成了 $\times 3)$ ;

比较它们的第二个维度值，都是 $3$ ，它们是相等的，啥都不做；

它们只有两个维度，比较完了。

然后这里再进行加法操作。

下面看些其他例子：

> a = np.arange(4) # (4,)
> b = np.ones(5) # (5,)
> a + b
ValueError: operands could not be broadcast together with shapes (4,) (5,)

是的，这不合理。它俩的维度值不一样，无法进行对应元素相加，也无法进行广播。

再来看一个相对复杂一点的例子：

> a = np.arange(4).reshape(4,1) # (4,1)
> b = np.ones(5) # (5,)
> (a + b).shape 
(4, 5)
> a + b
array([[1., 1., 1., 1., 1.],
       [2., 2., 2., 2., 2.],
       [3., 3., 3., 3., 3.],
       [4., 4., 4., 4., 4.]])

乍看起来有点奇怪，我们来分析一下。

a的形状是 $\times 1)$ ，b的形状是 $(5,)$ ，b需要向a看齐，首先在其维度左边加1，因此这里变成 $(1, 5)$ ；

比较它们的第一个维度值，a和b分别是 $4$ 和 $1$ ，此时b在该维度上重复4次，向大佬a看齐，b变成了 $\times 5)$ ;

比较它们的第二个维度值，a和b分别是 $1$ 和 $5$ ，嘿，此时b咸鱼翻身成为被仰望的对象了，a向b看齐，a在该维度上重复5次，a变成了 $\times 5)$

它们只有两个维度，比较完了。

然后这里再进行加法操作。

我们通过手动广播来执行一遍上面的例子。

# 先来看下a和b长啥样
> a
array([[0],
       [1],
       [2],
       [3]])
> b
array([1., 1., 1., 1., 1.])

> a_new = np.repeat(a, repeats=5, axis=1) # a需要在第二个维度上重复5次
> a_new # (4,5)
array([[0, 0, 0, 0, 0],
       [1, 1, 1, 1, 1],
       [2, 2, 2, 2, 2],
       [3, 3, 3, 3, 3]])

再看对b对转换。

> b_new = b[np.newaxis, :] # 现在左边插入一个维度，变成了(1,5)
> b_new 
array([[1., 1., 1., 1., 1.]])
> b_new = np.repeat(b_new, repeats=4,axis=0) # 然后在第一个维度上重复4次，变成了(4,5)
> b_new
array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

它们的维度一致了，现在可以执行按元素相加了。

> a_new + b_new
array([[1., 1., 1., 1., 1.],
       [2., 2., 2., 2., 2.],
       [3., 3., 3., 3., 3.],
       [4., 4., 4., 4., 4.]])
> (a_new + b_new ) == (a + b) # 验证一下
array([[ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True]])

Numpy

Numpy里面提供了很多种进行乘法计算的方法，主要讨论的是numpy.dot、numpy.matmul、numpy.multiply。

np.dot

numpy.dot(a,b)

两个数组的点乘

如果a和b都是一维(1-D)数组，计算它们的内积
如果a和b都是二维)(2-D)数组，那么计算的是矩阵积，此时推荐使用matmul或a @ b
如果a或b是标量(0-D)，等同于multiply，推荐使用numpy.multiply(a,b)或a * b
如果a是一个N维(N-D)数组，b是一个一维数组，那么就是计算a和b最后一个维度(轴)上的内积(按元素相乘再求和)
如果a是一个N维数组，b是一个M维(M-D,M>=2)数组，那么就是a最后一个维度(轴)上和b倒数第二个维度上的内积(对应元素相乘再求和)

> np.dot(3, 4) # 两个标量，等同于a*b
12
> a = np.arange(3) # [0 1 2]
> b = np.arange(3,6) # [3 4 5]
> print(a,b)
[0 1 2] [3 4 5]
> print(np.dot(a,b)) # 0*3 + 1*4 + 2*5=14 两个一维数组，计算它们的内积
14
> a = np.arange(6).reshape(-1,2) # (3,2)
> b = np.arange(2).reshape(2,-1) # (2,1)
> print(a)
[[0 1]
 [2 3]
 [4 5]]
> print(b)
[[0]
 [1]]
> print(np.dot(a,b)) # (3,2) x (2,1) -> (3,1) 两个二维数组，计算矩阵乘法
[[1]
 [3]
 [5]]

下面来看一下稍微复杂一点的第4种情况

> a = np.arange(1,7).reshape(-1,3) #(2,3) a是二维数组
[[1 2 3]
 [4 5 6]]
> b = np.array([1,2,3]) # (3,)  b是一维数组
[1 2 3]
> c = np.dot(a,b) # 计算a和b最后一个轴上的内积之和
[14 32]

相当于是用a的最后一个轴，(2,3)中3对应的那个轴去和b的最后一个轴，也是第一个轴(3)去计算内积，即

[1*1 + 2*2 + 3*3, 4*1 + 5*2 + 6*3] = [14,32]

最复杂的是最后一种情况，由于博主无法想象出超过三维的情况(如果你能想象出来，，你应该可以很好理解)，因此这种情况只能根据官网提供的公式去计算，无法打印出具体元素。

其实下面的例子已经简化成三维来，实际上是可以画一个立方体矩阵出来的，上面说的话都是借口，主要是懒。

a = np.arange(3*4*5).reshape((3,4,5)) # （3，4，5）
b = np.arange(5*6).reshape((5,6)) #（5，6）

a是一个三维数组，b是一个二维数组，np.dot(a,b)就是a最后一个维度(轴)上和b倒数第二个维度上的内积(对应元素相乘再求和)

> c = np.dot(a, b) # (3,4,5)  (5,6) ⚠️a的最后一个轴上元素个数是5，b的倒数第二个轴上的元素个数也是5
> print(c.shape)
(3, 4, 6)

sum(a[i,j,:] * b[:,m]) -> [i,j,m]

主要是通过上面这么计算的，证明：

print(c[2,3,5]) # 4905
print(sum(a[2,3,:] * b[:,5])) # 4905

实际上官网给的公式是这样的：

dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m]) -> [i,j,k,m]

窃以为四维有点复杂，因此改成了三维。

为了理解一个复杂的知识点，我们应该把复杂的问题简单化，抓住主要脉络(规律)，理解了之后再去拓展。类似阅读源码，我们应该先理清楚主要流程，一些支流像异常处理，调用某个复杂的函数实现都可以先不管。

计算公式就是这样子，暂时想不到应用场景。

因此为了代码的可读性，建议只有在都是一维数组时，才用np.dot，其他情况使用相应的推荐函数。可能这也是torch对此进行简化的原因。

np.matmul

numpy.matmul(a,b)

计算两个数组的矩阵积：

如果两者都是2-D数组，此时就像我们常见的矩阵乘法
如果任意一个参数的维度是N-D(N > 2)，它将被视为位于最后两个维度中的矩阵的堆叠，并相应地广播。
如果a的维度是1-D，它会通过在左边插入1到它的维度提升为矩阵，然后与b进行矩阵乘法，完了之后插入的1会被移除
如果b的维度是1-D，它会通过在右边插入1到它的维度提升为矩阵，然后与a进行矩阵乘法，完了之后插入的1会被移除

matmul与dot主要有两个不同：

不允许与标量做乘法，用*代替
矩阵堆叠，按元素广播： (n,k) x (k,m) -> (n,m)

情形1:

> a = np.array([[1, 0],
              [0, 1]])
> b = np.array([[4, 1],
              [2, 2]])
> np.matmul(a, b) # 第一行是[1*4+0*2, 1*1+0*2] = [4,1]
array([[4, 1],
       [2, 2]])

情行2:

> a = np.arange(2 * 2 * 4).reshape((2, 2, 4))
> b = np.arange(2 * 2 * 4).reshape((2, 4, 2))
> np.matmul(a,b).shape # （2，2，4）x (2,4,2) -> (2,2,2)
(2, 2, 2)

对于a，它被看成是两个 $\times 4$ 的矩阵的堆叠；

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]]])

同样对于b，也会看成是两个 $\times 2$ 的矩阵的堆叠。

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]]])

因此np.matmul(a,b)则会将a的第一个矩阵和b的第一个矩阵相乘，将a的第二个矩阵b的第二个矩阵相乘，最终得到一个 $\times 2 \times 2$ 的矩阵。

情形3:

> a = np.array([1, 2]) # (2,) -> (1,2)   就像执行了后面的代码 a = a[np.newaxis, ...]
> b = np.array([[1, 0],
              [0, 1]]) # (2,2)

> np.matmul(a, b) # (1,2) x (2,2) -> (1,2) -> (2,)
array([1, 2])

情形4:

> a = np.array([[1, 0],
              [0, 1]]) # (2,2)
> b = np.array([1, 2]) #(2,) -> (2,1)
> np.matmul(a, b)  # (2,2) x (2,1) -> (2,1) -> (2,)
array([1, 2])

不能与标量做乘法：

> np.matmul([1,2], 3)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-36-33405c3e27ac> in <module>()
----> 1 np.matmul([1,2], 3)

ValueError: matmul: Input operand 1 does not have enough dimensions (has 0, gufunc core with signature (n?,k),(k,m?)->(n?,m?) requires 1)

矩阵堆叠，按元素广播。

> a = np.arange(2*2*4).reshape((2,2,4))
> b = np.arange(2*4).reshape((4,2)) # (4,2) -> (1,4,2) --Repeat--> (2,4,2)
> np.matmul(a, b).shape #(2,2,4) x (2,4,2) -> (2,2,2)
(2, 2, 2)

这里涉及到了广播操作。

首先b会从最左边插入维度1，直到维度数量和多的(a)保持一致；然后把b复制一次，堆叠上去，使它的维度和a保持一致；最后进行情形2的计算。

可以用@来代替np.matmul，比如上面可以写成：

> a @ b
array([[[ 28,  34],
        [ 76,  98]],

       [[124, 162],
        [172, 226]]])

numpy.multiply

numpy.multiply(x1,x2)

对两个参数执行按元素相乘(对应元素相乘)。如果它俩的形状不同，必须进行广播以匹配维度。

> np.multiply(2.0, 4.0)
8
> x1 = np.arange(9.0).reshape((3, 3)) # (3,3)
> x1
array([[0., 1., 2.],
       [3., 4., 5.],
       [6., 7., 8.]])
> x2 = np.arange(3.0) # (3,) -> (1,3) --Repeat--> (3,3)
array([0., 1., 2.])
> np.multiply(x1, x2) # (3,3) x (3,3) -> (3,3)
array([[ 0.,  1.,  4.],
       [ 0.,  4., 10.],
       [ 0.,  7., 16.]])

这里再解释一下广播里的repeat，这里复制了2次，堆叠在一起，就像下面这样：

> x2_new = np.array([x2,x2,x2])
> x2_new
array([[0., 1., 2.],
       [0., 1., 2.],
       [0., 1., 2.]])

我们来乘一下验证一下：

> np.multiply(x1, x2_new)
array([[ 0.,  1.,  4.],
       [ 0.,  4., 10.],
       [ 0.,  7., 16.]])

可以用*来代替np.multiply。

好了，NumPy的乘法先探讨这么多，我们下面来看PyTorch中常用的乘法。

Torch

PyTorch里面也提供了很多种进行乘法计算的方法，主要讨论的是torch.dot、torch.matmul、torch.mm和torch.bmm。

torch.dot

⚠️和numpy不同， a和b必须都是一维向量，并且元素个数相同。

> a = torch.tensor([2, 3])
> b = torch.tensor([2, 1])
> print(a.shape)
torch.Size([2])
> print(b.shape)
torch.Size([2])
> print(torch.dot(a,b)) # 2x2 + 3x1
tensor(7)

torch.dot很简单，torch.matmul就会复杂一些了，相当于把np.dot中的相关特性移到此方法了。

torch.matmul

torch.matmul(a,b)

两个张量(Tensor)的矩阵乘法。

乘法的结果取决于两个张量的形状：

如果都是一维的，返回它们的内积，结果是一个标量。
如果都是二维的，返回矩阵积。
如果a是一维的，b是二维的，那么a 会通过在左边插入1到它的维度提升为矩阵，然后进行矩阵乘法，完了之后，插入的维度会被移除。
如果a是二维的，b是一维的，那么会返回矩阵-向量乘法结果。
如果两个参数都至少是一维的，且至少一个参数是N维的(其中N > 2)，则返回一个批量(batched)矩阵乘法。如果a是一维的，为了进行批量矩阵乘法，在维数左边加1，运算之后维度1删除。如果b是一维的，在其维数右边加1，然后删除。非矩阵维度(即批量)会被广播。

下面一个一个来看。

情形1:

# vector x vector
> a = torch.randn(3)
> b = torch.randn(3)
> torch.matmul(a, b).size() # 得到一个标量
torch.Size([])

情形2:

# matrix x matrix
> a = torch.randn(3,2)
> b = torch.randn(2,4)
> torch.matmul(a,b).size() # (3,2) x (2,4) -> (3,4)
torch.Size([3, 4])

情形3:

# vector x matrix
> a = torch.randn(3) # (3) -> (1,3)
> b = torch.randn(3,4) # (3,4)
> torch.matmul(a,b).size()  # (1,3) x (3,4) -> (1,4) -> (4)
torch.Size([4])

情形4：

# matrix x vector
> a = torch.randn(3, 4) # (3,4)
> b = torch.randn(4) # -> (4,1)
> torch.matmul(a, b).size() # (3,4) x (4,1) -> (3,1) -> (3)
torch.Size([3])

情形5 - 批矩阵 ✖️ 广播向量

# batched matrix x broadcasted vector
> a = torch.randn(10, 3, 4) # (10,3,4) 相当于10个（3,4)的矩阵
> b = torch.randn(4) # (4,1) -> (10,4,1) 会复制(4,1)的矩阵9次，得到10个一样的(4,1)矩阵
> torch.matmul(a, b).size() #(10,3,4) x (10,4,1) -> (10,3,1) -> (10,3) 
torch.Size([10, 3])

情形5 - 批矩阵 ✖️ 批矩阵

# batched matrix x batched matrix
> a = torch.randn(10, 3, 4) # (10,3,4) 相当于10个(3,4)的矩阵
> b = torch.randn(10, 4, 5) # (10,4,5) 相当于10个(4,5)的矩阵
> torch.matmul(a, b).size() # (10,3,4) x (10,4,5) -> (10,3,5) 得到10个(3,5)的矩阵
torch.Size([10, 3, 5])

情形5 - 批矩阵 ✖️ 广播矩阵

# batched matrix x broadcasted matrix
> a = torch.randn(10, 3, 4) # (10,3,4)
> b = torch.randn(4, 5) # (4,5) -> (10,4,5)
> torch.matmul(a, b).size() # (10,3,4) x (10,4,5) -> (10,3,5)
torch.Size([10, 3, 5])

可以看到，情形5先把某一参数转换为矩阵，然后进行矩阵运算，对于(10,3,4)这种维度可以理解为堆叠了10个(3,4)的矩阵，也可以理解为该批次内有10个(3,4)的矩阵。

⚠️广播逻辑只应用于批次维度上，而不是矩阵维度上。比如a是一个 $(j\times 1 \times n \times m)$ 的张量，然后b是一个 $(k\times m \times p)$ 的张量。这里的批次维度 $\times 1)$ 和 $(k)$ 是可以被广播的，两者都广播为 $\times k)$ 。因此，最后得到的结果是 $\times k \times n \times p)$ 。

> a = torch.randn(10, 1, 3, 4) # 矩阵维度(3,4) ，批维度(10,1)，广播为(10,2)
> b = torch.randn(2, 4, 5) # 矩阵维度(4,5)，批维度(2)，广播为(10,2)
> torch.matmul(a, b).size()  # (10,2,3,4) x (10,2,4,5) -> (10,2,3,5)
torch.Size([10, 2, 3, 5])

torch.mm

torch.mm(a,b)

在这两个矩阵上进行矩阵乘法。

如果a是 $\times m)$ 张量，b是 $\times p)$ 张量，结果就是 $\times p)$ 的张量。

⚠️ 这个函数不支广播。

> a = torch.randn(2, 3)
> b = torch.randn(3, 3)
> torch.mm(a, b).size() # (2,3)
torch.Size([2, 3])

torch.bmm

torch.bmm(a,b)

进行一个批矩阵-矩阵乘法。

两个参数都必须是3-D张量，并且含有相同的矩阵个数(批次数相同)。

若a是一 $(b\times n \times m)$ 的张量，b是一 $\times m \times p)$ 的张量，输出为 $(b\times n \times p)$ 的张量。

⚠️该函数也不支持广播。

> a = torch.randn(10, 3, 4)
> b = torch.randn(10, 4, 5)
> torch.bmm(a, b).size()
torch.Size([10, 3, 5])

Reference

NumPy官方文档
PyTorch官方文档
Numpy广播

你可能感兴趣的:(人工智能,广播机制,np.dot,torch.matmul,np.matmul,torch.bmm)

人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具学步_技术自动驾驶人工智能人工智能深度学习自动驾驶机器学习
人工智能深度学习系列—深度解析：交叉熵损失（Cross-EntropyLoss）在分类问题中的应用人工智能深度学习系列—深入解析：均方误差损失（MSELoss）在深度学习中的应用与实践人工智能深度学习系列—深入探索KL散度：度量概率分布差异的关键工具人工智能深度学习系列—探索余弦相似度损失：深度学习中的相似性度量神器人工智能深度学习系列—深度学习中的边界框回归新贵：GHM（GeneralizedH
python：使用gdal和numpy进行遥感时间序列最大值合成 _养乐多_ python处理遥感数据 python numpy 开发语言
作者：CSDN@_养乐多_本文将介绍使用python编程语言，进行遥感数据时间序列最大值合成的代码。代码中使用了numpy和gdal，通过numpy广播机制实现时间序列最大值合成，并以NDVI时间序列数据为例。代码方便易运行，逻辑简单，速度快。只需要输入单波段遥感数据，就可输出最大值合成影像。输入输出如下图所示，文章目录一、完整代码一、完整代码importosimportglobimportnum
解读 DeepSeek 关键 RL 算法 GRPO 进一步有进一步的欢喜 LLM 算法 DeepSeek GRPO
DeepSeekGRPO：面向超大规模RLHF的梯度正则化策略优化算法引言在当下人工智能蓬勃发展的浪潮里，DeepSeek无疑是一颗耀眼的明星，频繁出现在各类科技前沿讨论中，热度持续攀升。从惊艳的模型表现，到不断拓展的应用场景，DeepSeek正以强劲之势重塑着行业格局。大家不难发现，无论是复杂的自然语言处理任务，还是充满挑战的智能推理难题，DeepSeek都能展现出卓越的性能。而这斐然成绩的背后
详细介绍人工智能学习框架日记成书反正看不懂系列人工智能
人工智能学习框架是开发者用于构建、训练和部署机器学习模型的核心工具。以下从框架分类、核心框架介绍、学习方法三个维度展开详解：一、主流人工智能框架全景图（一）基础框架层TensorFlow（Google）核心优势：工业级部署能力，支持移动端（TFLite）、浏览器（TF.js）、服务器（TFServing）特色功能：SavedModel格式跨平台兼容，XLA编译器优化计算图适用场景：生产环境部署、大
Python常见库的使用浪子西科 Python python 开发语言
文章目录人工智能与机器学习1.NumPy2.Pandas3.Scikit-learn4.TensorFlow5.PyTorch数据可视化1.Matplotlib2.Seaborn网络请求与爬虫1.Requests2.Scrapy自动化测试1.unittest2.pytest自然语言处理1.NLTK2.SpaCy数据库操作1.SQLite32.SQLAlchemy日期和时间处理1.datetime2
中国AI震撼教育界！DeepSeek让个性化学习“弯道超车”？盼达思文体科创经验分享
引言家人们，最近科技圈简直炸锅了！中国AI的一股强大力量——DeepSeek横空出世，它带来的震撼可远不止于科技领域，更是像一颗重磅炸弹，投向了传统的教育行业。在过去，教育常常是“一刀切”的模式，就像给所有学生都穿上同样尺码的鞋子，合适与否只有学生自己知道。而如今，随着人工智能技术的飞速发展，个性化学习成为了教育界追求的新目标。DeepSeek的出现，无疑为实现这一目标带来了新的曙光。DeepSe
一文读懂智能体架构：模块化设计如何提升效率与灵活性功城师人工智能大语言模型自然语言处理大模型深度学习智能体 LLM
随着人工智能技术的快速发展，智能体在企业知识管理、客户服务、业务数据分析等领域的应用愈加广泛。一个优秀的智能体设计不仅要具备高效处理用户需求的能力，还需要灵活适配不同场景的任务需求。本文将通过一个智能体的具体设计流程图，结合实际案例，详细解析其架构设计、功能实现及背后的技术逻辑，帮助大家深入了解智能体的构建过程。一、智能体设计的核心思路在智能体的设计过程中，最关键的是对用户需求的精准理解和快速响应
CSDN 博客文章：Genesis 安装指南与环境配置（Python 3.9+） qq_27492797 python 开发语言
引言随着人工智能和机器学习的蓬勃发展，各式各样的框架和工具如雨后春笋般涌现，为科研人员和开发者的创新之路提供强大支持。今天，我们聚焦于Genesis——一个在物理模拟、计算机图形学以及机器人领域展现出卓越潜力的先进平台。需要特别说明的是，目前Genesis项目中备受期待的对话式生成AI接口，当前仍处于概念展示阶段，仅存在于PPT之中，尚未对外开放，大家在关注其发展时需留意这一情况。本文将着重介绍如
星河飞雪网络安全学习笔记-安全见闻1-3 芝士布偶网络安全
安全见闻-了解安全知识编程语言日常编程语言C语言：一种通用的、面向过程的编程语言，广泛运用于系统软件呵呵嵌入式开发C++：面向对象的编程语言，常用于游戏开发、高性能计算等领域Java：一种广泛使用的面向对象编程语言、具有跨平台性、应用于企业级应用开发等Python（萌新推荐）：简洁易学，拥有丰富的库，适用于数据分析、人工智能、web开发等Javascript：主要用于网页前端开发，也可用于服务器端
《人工智能之高维数据降维算法：PCA与LDA深度剖析》机器学习人工智能
在人工智能与机器学习蓬勃发展的当下，数据处理成为关键环节。高维数据在带来丰富信息的同时，也引入了计算复杂度高、过拟合风险增大以及数据稀疏性等难题。降维算法应运而生，它能将高维数据映射到低维空间，在减少维度的同时最大程度保留关键信息。主成分分析（PCA）与线性判别分析（LDA）作为两种常用的降维算法，在人工智能领域应用广泛。本文将深入探讨它们的原理。PCA：无监督的降维利器核心思想PCA基于最大方差
物联网+人工智能：发那科、思科、罗克韦尔自动化联合推出FIELD system weixin_33962621 人工智能嵌入式
2016年11月2日，工博会，发那科与全球科技领导厂商思科、全球最大的专注于工业自动化与信息化公司罗克韦尔自动化，共同为FIELDsystem进行中国区的合作发布，实现工厂中设备的智能互联，推动智能制造的发展。发那科株式会社会长稻叶善治、发那科株式会社社长山口贤治、发那科株式会社董事、专务执行役员兼机器人事业本部本部长稻叶清典、上海发那科机器人有限公司总经理钱晖、思科系统（中国）网络技术有限公司副
使用django调用deepseek api，搭建ai网站陈王卜人工智能
一、deepseek简介DeepSeek是一家人工智能公司，专注于开发先进的人工智能模型和技术。以下是关于DeepSeek的一些详细介绍：1.公司背景DeepSeek由杭州深度求索人工智能基础技术研究有限公司开发，致力于通过创新的技术和算法，推动人工智能领域的发展。2.技术与模型DeepSeek-V3：这是DeepSeek开发的一个大型语言模型，具有超过600B的参数，在多项性能指标上与国际顶尖模
AI大模型时代，新手和程序员如何转型入局AI行业？大模型RAG实战人工智能 ai agi 程序员转行
在人工智能（AI）的浪潮中，大模型技术正以前所未有的速度发展，并在各个领域展现出其强大的应用潜力。在近期的全国两会上，“人工智能”再次被提及，并成为国家战略的焦点。这一举措预示着在接下来的十年到十五年里，人工智能将获得巨大的发展红利。技术革命正在从“互联网+”向“人工智能+”逐步迈进，我们将迎来新一轮技术革新和人才需求的增长。毫无疑问，AI工程师将是未来最紧俏的岗位。对于想要进入AI领域的新手或转
深入探索 llama-cpp-python：在 LangChain 中启用本地 LLM 推理 aehrutktrjk llama python langchain
引言在人工智能的迅猛发展中，大语言模型(LLM)扮演着不可或缺的角色。Llama.cpp是一个用于推理许多LLM模型的开源库，它的Python绑定——llama-cpp-python提供了在Python中更加便捷的接口。这篇文章旨在介绍如何在LangChain中运行llama-cpp-python，并探讨其安装和使用中的一些细节。主要内容1.安装llama-cpp-python首先，我们需要选择合
GLake：优化GPU内存管理与IO传输的开源项目 2401_87458718 开源
GLake：突破GPU内存和IO瓶颈的利器在人工智能快速发展的今天，大模型训练和推理正面临着严峻的挑战。随着模型规模的不断扩大，GPU内存容量和IO带宽的增长速度已经远远跟不上AI模型规模的增长速度，形成了所谓的"内存墙"和"IO传输墙"。为了应对这些挑战，一个名为GLake的开源项目应运而生，旨在通过底层优化来突破GPU内存和IO传输的瓶颈。GLake简介GLake是一个专注于优化GPU内存管理
OpenAI: 人工智能领域的领军企业 2401_87458718 人工智能
OpenAI简介OpenAI是一家位于美国旧金山的人工智能研究实验室,成立于2015年。作为人工智能领域的领军企业,OpenAI致力于开发安全友好的通用人工智能(AGI),其使命是确保人工通用智能能够造福全人类。自成立以来,OpenAI在自然语言处理、计算机视觉、强化学习等多个人工智能领域取得了突破性进展,推出了一系列广受关注的AI模型和产品。OpenAI的发展历程OpenAI由埃隆·马斯克、山姆
Nginx + ElasticSearch + Kibana结合周天祥 ElasticSearch 大数据
Nginx+ElasticSearch+Kibana结合操作系统软件下载安装编译工具及库文件安装PCRE安装NginxElasticSearch配置Kibana配置Nginx配置启动Nginx对人工智能感兴趣点下面链接现在人工智能非常火爆，很多朋友都想学，但是一般的教程都是为博硕生准备的，太难看懂了。最近发现了一个非常适合小白入门的教程，不仅通俗易懂而且还很风趣幽默。所以忍不住分享一下给大家。点这
DeepSeek：突破闭源封锁，引领大模型新时代 fanstinmsl 算法语言模型
近年来，人工智能领域蓬勃发展，大模型作为其中的核心技术，其重要性不言而喻。然而，大模型的训练和部署往往面临着硬件依赖性强、成本高昂、效率低下等挑战。DeepSeek的出现，为解决这些问题提供了全新的思路和方案。DeepSeek的核心优势：1.减少硬件依赖：DeepSeek通过算法优化和架构创新，降低了对高性能硬件的依赖，使得大模型的训练和部署可以在更广泛的硬件平台上进行，极大地降低了应用门槛。**
如何通过提示词更好地利用AI lally. 人工智能
如何通过提示词工程释放AI的全部潜力：7个深度优化技巧前言：为什么提示词决定AI的输出质量？在人工智能对话系统的使用中，提示词（Prompt）就像开启宝藏的密码钥匙。研究表明，优化后的提示词可使输出质量提升300%（AIResearchLab,2023）。本指南将系统解析提示词设计的核心方法论，并提供可直接复用的模板库。一、基础构建：打造高效提示词的4大支柱1.1精准目标定位术原理分析：模糊指令导
2024年Agent AI：Agent AI的基本概念、关键技术、应用前景、未来展望大模型部署人工智能 langchain 程序员知识图谱 LLM AI大模型编程
在2024年，人工智能领域迎来了一个新的里程碑——AgentAI的兴起。AgentAI，即代理智能，是一种能够感知并在不同领域和应用中采取行动的系统。它不仅是人工智能研究的一个新方向，更是通向人工通用智能（AGI）的一条充满希望的途径。本文将详细介绍AgentAI的基本概念、关键技术和应用前景。一、AgentAI的基本概念AgentAI，或称代理智能，是指一类能够感知环境、理解情境并在此基础上执行
终于明白了！人工智能、机器学习、深度学习、集成学习及大模型的定义与联系大模型玩家人工智能机器学习深度学习产品经理算法学习方法集成学习
在当今快速发展的科技领域，人工智能（ArtificialIntelligence,AI）、机器学习（MachineLearning,ML）、深度学习（DeepLearning,DL）、集成学习（EnsembleLearning）以及大模型（LargeModels）等概念频繁出现在人们的视野中。它们不仅推动了科技的进步，也深刻影响了社会生活的方方面面。本文将对这些概念进行全面解析，并探讨它们之间的联
学习心得体会：深入探讨大语言模型的世界——读《自然语言处理：大模型理论与实践》（预览版）有感 Nuyoah_610 自然语言处理学习语言模型
《自然语言处理：大模型理论与实践》（预览版）由赵宇教授编写，是一本深入探讨大语言模型世界的专业著作。作为一名正在学习和研究自然语言处理的学生，这本书为我提供了宝贵的理论基础和实践指导。《自然语言处理：大模型理论与实践》教材官网：首页|自然语言处理：大模型理论与实践赵宇教授简介西南财经大学教授，博导，四川省学术和技术带头人后备人选，金融智能与金融工程四川省重点实验室副主任，通用人工智能与数字经济创新
AI工具 | 每个打工人必备的15款人工智能超级工具 Qingmu2024 AIGC（文本图像视频）特训营人工智能 AIGC
咱们得面对一个残酷的事实：大多数“人工智能”工具本质上华而不实，往往没什么用。不过，还是有一些靠谱的人工智能平台，它们可不只是营销噱头。有些AI公司正试图改变游戏规则。人工智能工具让人们能够更聪明地工作，而不是更辛苦地劳作。如果你想知道未来有什么，那就来看看这10款人工智能工具吧，它们将彻底改变我们的工作方式。1.AI驱动的插画和动态设计网址：https://lottiefiles.com/lot
人人都看得懂的DeepSeek入门科普程序员一一涤生
当大家都在好奇下一代AI会怎样改变我们的工作与生活时，中国公司DeepSeek正以惊人的速度和态度闯进大众视野。它究竟是什么，能做什么，又为何能在AI热潮里高调崭露头角？本文带你了解DeepSeek及其最新推出的两款大模型，顺便一起讨论它如何搅动整个AI行业的水面。1.DeepSeek是什么？DeepSeek=AI+国产+免费+开源+强大DeepSeek是一家专注通用人工智能(AGI)的中国科技公
谁才是 AI 的“第一语言”？Python 与 Java 的较量 CarlowZJ 人工智能 python java
在人工智能（AI）领域，编程语言的选择至关重要，它直接影响到开发效率、模型性能和应用部署的便利性。近年来，Python和Java在AI领域的竞争愈发激烈。本文将探讨这两种语言在AI开发中的优劣，并分析谁更有可能成为AI的“第一语言”。一、Python：AI开发的“王者”Python在AI领域的主导地位由来已久。自2021年10月登顶TIOBE榜首以来，Python至今稳居第一，并第六次摘下了TIO
第七个问题 - 什么是AIGC？它和LLM是什么关系？释迦呼呼 AI一千问 AIGC 人工智能机器学习深度学习自然语言处理语言模型
AIGC（人工智能生成内容）和LLM（大语言模型）是当前人工智能领域的两个核心概念，它们既有紧密联系，又有明确区别。以下是详细解析：一、什么是AIGC？AIGC（AI-GeneratedContent，人工智能生成内容）指由人工智能系统自动生成的各类数字化内容，涵盖文本、图像、音频、视频、代码、3D模型等多种形式。其核心是让AI模型学习数据分布后，按需生成符合人类需求的内容。AIGC的关键特点：多
AI赋能软件测试：效率与质量的革命性提升北陌宝宝行业研究发展 #检验检测行业人工智能
近年来，人工智能(AI)技术蓬勃发展，正在深刻改变着各行各业，软件测试领域也不例外。作为一名CSDN软件测试工程师博主，我深刻感受到AI技术为软件测试带来的巨大变革。本文将探讨AI在软件测试中的应用场景、优势以及未来发展趋势，希望能为广大测试同仁提供一些启发。一、AI赋能软件测试的应用场景AI技术在软件测试中的应用场景十分广泛，涵盖了测试的各个环节，主要包括：测试用例生成：传统的测试用例编写耗时耗
边缘计算的发展与应用：腾讯云的技术探索 Anna_Tong 边缘计算腾讯云人工智能云计算物联网数据安全实时计算
随着5G、物联网（IoT）和人工智能（AI）等技术的发展，数据计算的需求正在发生变化。传统的云计算模式依赖于集中式数据中心，虽然提供了强大的算力和存储能力，但在某些场景下，数据传输的延迟、带宽成本和隐私保护等问题仍然存在。边缘计算应运而生，作为云计算的延伸，它可以将数据处理下沉至更靠近数据源的地方，从而提升计算效率，优化网络资源利用。腾讯云作为云计算服务商之一，在边缘计算领域进行了深入探索，结合自
机器人部分专业课栗少机器人
华东理工人工智能与机器人导论IntroductionofArtificialIntelligenceandRobots必修考查0.5880116477012程序设计基础TheFundamentalsofProgramming必修考试3643232147450012算法与数据结构AlgorithmandDataStructure必修考试3564016318746020现代电子技术与系统ModernE
计算：第四部分计算的极限第 12 章机器能思考吗 AlphaGo 与李世石 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
计算：第四部分计算的极限第12章机器能思考吗AlphaGo与李世石作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自从计算机问世以来，人们就不断探讨机器能否具备人类的思维能力。这个问题一直是人工智能领域的重要议题，也是哲学和认知科学领域长期争论的焦点。直到2016年，AlphaGo与李世石的围棋对决，才将这个问题推向了高潮
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，