DLNovice

动手学习深度学习 02：预备知识

文章目录

01 数据操作 + 数据预处理
- 1、数据操作
- - 1.1、创建数组
  - 1.2、访问元素
- 2、数据操作_Code
- - 2.1、张量
  - 2.2、算术运算符
  - 2.3、广播机制
  - 2.4、索引和切片
  - 2.5、节省内存
  - 2.6、转换为其他Python对象
- 3、数据预处理
- - 3.1、读取数据
  - 3.2、除去缺失值
  - 3.3、转换为张量格式
02 线性代数
- 1、标量
- 2、向量
- - 2.1、长度、维度和形状
- 3、矩阵
- - 3.1、张量
  - 3.2、张量算法的基本性质
- 4、线性代数QA
- 5、小结
03 微积分
04 自动微分
05 概率
06 查阅文档

01 数据操作 + 数据预处理

1、数据操作

n维数组，也称为张量（tensor），是机器学习和神经网络的主要数据结构

1.1、创建数组

1.2、访问元素

2、数据操作_Code

代码位置： chapter_preliminaries/ndarray.ipynb

深度学习存储和操作数据的主要接口是张量（n维数组）。它提供了各种功能，包括基本数学运算、广播、索引、切片、内存节省和转换其他Python对象。

2.1、张量

张量表示由一个数值组成的数组，这个数组可能有多个维度。

具有一个轴的张量对应数学上的向量（vector）；
具有两个轴的张量对应数学上的矩阵（matrix）；
具有两个轴以上的张量没有特殊的数学名称。

import torch

x = torch.arange(12)
# tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

1、shape ：

通过张量的shape属性来访问张量（沿每个轴的长度）的形状

import torch

x = torch.arange(12)  # tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
print(x.shape)  # torch.Size([12])

2、numel

张量中元素的总数，即形状的所有元素乘积，可以检查它的大小（size）

import torch

x = torch.arange(12)  # tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
print(x.shape)  # torch.Size([12])
print(x.numel())  # 12

3、reshape

改变一个张量的形状而不改变元素数量和元素值，可以调用reshape函数

import torch

x = torch.arange(12)  # tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
print(x.shape)  # torch.Size([12])
print(x.numel())  # 12
x = x.reshape(4, 3)
"""
tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])
"""

4、zeros

使用全0、全1、其他常量，或者从特定分布中随机采样的数字来初始化矩阵

(1)创建一个形状为（2,3,4）的张量，其中所有元素都设置为0

y = torch.zeros((2, 3, 4))

结果展示：

tensor([[[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]],

        [[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]])

(2)创建一个形状为（2,3,4）的张量，其中所有元素都设置为1

z = torch.ones((2, 3, 4))

tensor([[[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]],

        [[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]])

(3)通过提供包含数值的Python列表（或嵌套列表），来为所需张量中的每个元素赋予确定值

n = torch.tensor([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
print(n)
print(n.shape)
print(n.numel())

结果展示：

tensor([[2, 1, 4, 3],
        [1, 2, 3, 4],
        [4, 3, 2, 1]])
torch.Size([3, 4])
12

（4）通过从某个特定的概率分布中随机采样来得到张量中每个元素的值

m = torch.randn(4, 3)

结果展示：

tensor([[ 1.1251,  0.6748, -0.3697],
        [ 0.7118,  1.1822,  1.3140],
        [-1.1234,  0.8773,  0.2002],
        [-0.0407,  0.3170,  0.6610]])

2.2、算术运算符

1、对于任意具有相同形状的张量，常见的标准算术运算符（+、-、*、/和**）都可以被升级为按元素运算。

import torch

x = torch.tensor([1.0, 2, 4, 8])
y = torch.tensor([2, 2, 2, 2])
print(x + y, x - y, x * y, x / y, x ** y)  # **运算符是求幂运算

结果展示：

tensor([ 3.,  4.,  6., 10.]) 
tensor([-1.,  0.,  2.,  6.]) 
tensor([ 2.,  4.,  8., 16.]) 
tensor([0.5000, 1.0000, 2.0000, 4.0000]) 
tensor([ 1.,  4., 16., 64.])

2、“按元素”方式可以应用更多的计算，包括像求幂这样的一元运算符。

torch.exp(x)

import torch

x = torch.tensor([1.0, 2, 4, 8])
print(torch.exp(x))

tensor([2.7183e+00, 7.3891e+00, 5.4598e+01, 2.9810e+03])

3、除了按元素计算外，我们还可以执行线性代数运算，包括向量点积和矩阵乘法。

cat : 可以把多个张量连结（concatenate）在一起

我们只需要提供张量列表，并给出沿哪个轴连结。

如：

下面的例子分别演示了,当我们

沿行（轴-0，形状的第一个元素）
按列（轴-1，形状的第二个元素）

连结两个矩阵

import torch

X = torch.arange(12, dtype=torch.float32).reshape((3,4))
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
X1 = torch.cat((X, Y), dim=0)  # dim=0 : 按行
Y1 = torch.cat((X, Y), dim=1)  # dim=1 : 按列
print("X:", X)
print("Y:", Y)
print("X1:", X1)
print("Y1:", Y1)

结果展示：

一个输出张量的轴-0长度（6）是两个输入张量轴-0长度的总和（3+3）；

第二个输出张量的轴-1长度（8）是两个输入张量轴-1长度的总和（4+4）。

X: tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])
Y: tensor([[2., 1., 4., 3.],
        [1., 2., 3., 4.],
        [4., 3., 2., 1.]])
X1: tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [ 2.,  1.,  4.,  3.],
        [ 1.,  2.,  3.,  4.],
        [ 4.,  3.,  2.,  1.]])
Y1: tensor([[ 0.,  1.,  2.,  3.,  2.,  1.,  4.,  3.],
        [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
        [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]])

4、我们想通过逻辑运算符构建二元张量。以X == Y为例

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])
print(X == Y)

结果展示：

tensor([[False,  True, False,  True],
        [False, False, False, False],
        [False, False, False, False]])

5、对张量中的所有元素进行求和，会产生一个单元素张量。

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
print(X.sum())

tensor(66.)

2.3、广播机制

在某些情况下，即使形状不同，我们仍然可以通过调用 广播机制（broadcasting mechanism）来执行按元素操作。

这种机制的工作方式如下：

首先，通过适当复制元素来扩展一个或两个数组，以便在转换之后，两个张量具有相同的形状。
其次，对生成的数组执行按元素操作。

# a和b分别是和矩阵
a = torch.arange(3).reshape((3, 1))
b = torch.arange(2).reshape((1, 2))
print(a)
print(b)
print(a + b)

结果展示：

tensor([[0],
        [1],
        [2]])
tensor([[0, 1]])
tensor([[0, 1],
        [1, 2],
        [2, 3]])

2.4、索引和切片

就像在任何其他Python数组中一样，张量中的元素可以通过索引访问。

1、如用[-1]选择最后一个元素，用[1:3]选择第二个和第三个元素

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
print(X)
print(X[-1])
print(X[1:3])

结果展示：

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])
tensor([ 8.,  9., 10., 11.])
tensor([[ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.]])

2、通过指定索引来将元素写入矩阵。

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
X[1, 2] = 9
print(X)

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  9.,  7.],
        [ 8.,  9., 10., 11.]])

3、如果我们想为多个元素赋值相同的值，我们只需要索引所有元素，然后为它们赋值。

例如，[0:2, :]访问第1行和第2行，其中“:”代表沿轴1（列）的所有元素。

虽然我们讨论的是矩阵的索引，但这也适用于向量和超过2个维度的张量。

(1) X[0:2, :]

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
X[0:2, :] = 12
print(X)

tensor([[12., 12., 12., 12.],
        [12., 12., 12., 12.],
        [ 8.,  9., 10., 11.]])

(2) X[0:2, 2:4]

X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
X[0:2, 2:4] = 12
print(X)

tensor([[ 0.,  1., 12., 12.],
        [ 4.,  5., 12., 12.],
        [ 8.,  9., 10., 11.]])

2.5、节省内存

运行一些操作可能会导致为新结果分配内存。

例如，如果我们用Y = X + Y，我们将取消引用Y指向的张量，而是指向新分配的内存处的张量。

id() ：提供了内存中引用对象的确切地址

1、Y = Y + X

before = id(Y)
Y = Y + X
print(id(Y) == before)  # False

这可能是不可取的，原因有两个：

首先，我们不想总是不必要地分配内存。在机器学习中，我们可能有数百兆的参数，并且在一秒内多次更新所有参数。通常情况下，我们希望原地执行这些更新。
其次，如果我们不原地更新，其他引用仍然会指向旧的内存位置，这样我们的某些代码可能会无意中引用旧的参数。

2、可以使用切片表示法将操作的结果分配给先前分配的数组

例如Y[:] = 。为了说明这一点，我们首先创建一个新的矩阵Z，其形状与另一个Y相同，使用zeros_like来分配一个全0的块。

Z = torch.zeros_like(Y)
print('id(Z):', id(Z))
Z[:] = X + Y
print('id(Z):', id(Z))

结果展示：

id(Z): 140316199714544
id(Z): 140316199714544

3、如果在后续计算中没有重复使用X，我们也可以使用X[:] = X + Y或X += Y来减少操作的内存开销。

before = id(X)
X += Y
print(id(X) == before)  # True

2.6、转换为其他Python对象

1、将深度学习框架定义的张量转换为NumPy张量（ndarray）很容易，反之也同样容易。

torch张量和numpy数组将共享它们的底层内存，就地操作更改一个张量也会同时更改另一个张量。

A = X.numpy()
B = torch.tensor(A)
print(type(A), type(B))

(numpy.ndarray, torch.Tensor)

2、要将大小为1的张量转换为Python标量，我们可以调用item函数或Python的内置函数。

a = torch.tensor([3.5])
print(a, a.item(), float(a), int(a))

结果展示：

(tensor([3.5000]), 3.5, 3.5, 3)

3、数据预处理

3.1、读取数据

（1）创建数据

存储在csv文件

import os


# 1、创建数据集
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')

（2）读取数据

要从创建的CSV文件中加载原始数据集，我们导入pandas包并调用read_csv函数。

data = pd.read_csv(data_file)
print(data)

结果展示：

   NumRooms Alley   Price
0       NaN  Pave  127500
1       2.0   NaN  106000
2       4.0   NaN  178100
3       NaN   NaN  140000

进程已结束，退出代码为 0

3.2、除去缺失值

“NaN”项代表缺失值。

为了处理缺失的数据，典型的方法包括插值法和删除法

插值法用一个替代值弥补缺失值

删除法则直接忽略缺失值

在这里，我们将考虑插值法：

通过位置索引iloc，我们将data分成inputs和outputs，其中前者为data的前两列，而后者为data的最后一列。对于inputs中缺少的数值，我们用同一列的均值替换“NaN”项。

关键代码：

# 3、处理缺失值
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
# mean()函数功能：求取均值
# fillna() 使用指定的方法填充NA/NaN值。

运行结果：

   NumRooms Alley
0       3.0  Pave
1       2.0   NaN
2       4.0   NaN
3       3.0   NaN

整体代码：

import os
import pandas as pd


# 1、创建数据集
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')


# 2、读取数据
# 基于pandas
data = pd.read_csv(data_file)
print(data)

# 3、处理缺失值
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
# mean()函数功能：求取均值
# fillna() 使用指定的方法填充NA/NaN值。
print(inputs)

对于inputs中的类别值或离散值，我们将“NaN”视为一个类别。

由于“巷子类型”（“Alley”）列只接受两种类型的类别值“Pave”和“NaN”， pandas可以自动将此列转换为两列“Alley_Pave”和“Alley_nan”。

巷子类型为“Pave”的行会将“Alley_Pave”的值设置为1，“Alley_nan”的值设置为0。

缺少巷子类型的行会将“Alley_Pave”和“Alley_nan”分别设置为0和1。

代码：

inputs = pd.get_dummies(inputs, dummy_na=True)
print(inputs)

处理前：

   NumRooms Alley
0       3.0  Pave
1       2.0   NaN
2       4.0   NaN
3       3.0   NaN

处理后：

   NumRooms  Alley_Pave  Alley_nan
0       3.0           1          0
1       2.0           0          1
2       4.0           0          1
3       3.0           0          1

3.3、转换为张量格式

现在inputs和outputs中的所有条目都是数值类型，它们可以转换为张量格式。

关键代码：

import torch

# 4、转换为张量格式
x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
print(x)
print(y)

结果展示：

tensor([[3., 1., 0.],
        [2., 0., 1.],
        [4., 0., 1.],
        [3., 0., 1.]], dtype=torch.float64)
tensor([127500, 106000, 178100, 140000])

PS：64位浮点数相对较占内存，我们平时使用中使用32位即可

完整代码：

import os
import pandas as pd
import torch


# 1、创建数据集
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')


# 2、读取数据
# 基于pandas
data = pd.read_csv(data_file)
print(data)

# 3、处理缺失值
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
# mean()函数功能：求取均值
# fillna() 使用指定的方法填充NA/NaN值。
print(inputs)

inputs = pd.get_dummies(inputs, dummy_na=True)
print(inputs)

# 4、转换为张量格式
x, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
print(x)
print(y)

02 线性代数

1、标量

我们称仅包含一个数值的叫标量（scalar）。

数学表示法中标量变量由普通小写字母表示（例如，x、y和z）

标量由只有一个元素的张量表示。在下面的代码中，我们实例化两个标量:

import torch

x = torch.tensor(3.0)
y = torch.tensor(2.0)

x + y, x * y, x / y, x**y

结果展示：

(tensor(5.), tensor(6.), tensor(1.5000), tensor(9.))

2、向量

你可以将向量视为标量值组成的列表。我们将这些标量值称为向量的元素（element）或分量（component）。

在数学表示法中，我们通常将向量记为粗体、小写的符号（例如，x、y和z)）

我们通过一维张量处理向量。一般来说，张量可以具有任意长度，取决于机器的内存限制。

x = torch.arange(4)
x

tensor([0, 1, 2, 3])

2.1、长度、维度和形状

len(x)
x.shape

示例程序：

import torch

x = torch.arange(4)
print(x)
print(x[3])

#  2.1、长度、维度和形状
print(len(x))
print(x.shape)

结果展示：

tensor([0, 1, 2, 3])
tensor(3)
4
torch.Size([4])

3、矩阵

创建矩阵
转置矩阵
对称矩阵

示例代码：

import torch


# 3、矩阵
A = torch.arange(20).reshape(5, 4)
print(A)
# 转置矩阵
print(A.T)

# 对称矩阵
B = torch.tensor([[1, 2, 3], [2, 0, 4], [3, 4, 5]])
print(B)
print(B == B.T)

运行结果：

tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11],
        [12, 13, 14, 15],
        [16, 17, 18, 19]])
tensor([[ 0,  4,  8, 12, 16],
        [ 1,  5,  9, 13, 17],
        [ 2,  6, 10, 14, 18],
        [ 3,  7, 11, 15, 19]])
tensor([[1, 2, 3],
        [2, 0, 4],
        [3, 4, 5]])
tensor([[True, True, True],
        [True, True, True],
        [True, True, True]])

3.1、张量

就像向量是标量的推广，矩阵是向量的推广一样，我们可以构建具有更多轴的数据结构。张量（本小节中的“张量”指代数对象）为我们提供了描述具有任意数量轴的n维数组的通用方法。例如，向量是一阶张量，矩阵是二阶张量。张量用特殊字体的大写字母表示（例如，X、Y和Z）

PS:

此时你可能会对“张量、标量、向量”的概念产生疑惑

我们回顾前文：n维数组，也称为张量（tensor），是机器学习和神经网络的主要数据结构

当我们开始处理图像时，张量将变得更加重要，图像以n维数组形式出现，其中3个轴对应于高度、宽度，以及一个通道（channel）轴，用于表示颜色通道（红色、绿色和蓝色）

下面我们先学习一些张量的基础知识：

先创建一个张量：

X = torch.arange(24).reshape(2, 3, 4)
print(X)

结果展示：

tensor([[[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11]],

        [[12, 13, 14, 15],
         [16, 17, 18, 19],
         [20, 21, 22, 23]]])

3.2、张量算法的基本性质

1、同形状矩阵的二元计算

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
B = A.clone()  # 通过分配新内存，将A的一个副本分配给B
print(A)
print(A + B)

运行结果：

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [12., 13., 14., 15.],
        [16., 17., 18., 19.]])
tensor([[ 0.,  2.,  4.,  6.],
        [ 8., 10., 12., 14.],
        [16., 18., 20., 22.],
        [24., 26., 28., 30.],
        [32., 34., 36., 38.]])

2、Hadamard积

两个矩阵的按元素乘法称为Hadamard积

print(A * B)

运行结果：

tensor([[  0.,   1.,   4.,   9.],
        [ 16.,  25.,  36.,  49.],
        [ 64.,  81., 100., 121.],
        [144., 169., 196., 225.],
        [256., 289., 324., 361.]])

3、张量*标量

将张量乘以或加上一个标量不会改变张量的形状

a = 2
A = torch.arange(24).reshape(2, 3, 4)
print(A + a)
print(a * A)

运行结果：

tensor([[[ 2,  3,  4,  5],
         [ 6,  7,  8,  9],
         [10, 11, 12, 13]],

        [[14, 15, 16, 17],
         [18, 19, 20, 21],
         [22, 23, 24, 25]]])
tensor([[[ 0,  2,  4,  6],
         [ 8, 10, 12, 14],
         [16, 18, 20, 22]],

        [[24, 26, 28, 30],
         [32, 34, 36, 38],
         [40, 42, 44, 46]]])

4、降维

4.1、求和

import torch
import numpy as np

# x = np.arange(4)
# x,x.sum()
# 这里规避一个错误，我们调用的是 torch.arange() 而非 numpy ，否则后面代码花里胡哨的错误
x = torch.arange(4, dtype=torch.float32)
x, x.sum()x = np.arange(4)
x,x.sum()

运行结果：

(tensor([0., 1., 2., 3.]), tensor(6.))

我们可以表示任意形状张量的元素和

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
A, A.shape, A.sum()

运行结果：

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [12., 13., 14., 15.],
         [16., 17., 18., 19.]]),
 torch.Size([5, 4]),
 tensor(190.))

4.2、降维

默认情况下，调用求和函数会沿所有的轴降低张量的维度，使它变为一个标量。

我们还可以指定张量沿哪一个轴来通过求和降低维度。

（1）沿轴0

以矩阵为例，为了通过求和所有行的元素来降维（轴0），我们可以在调用函数时指定axis=0。

由于输入矩阵沿0轴降维以生成输出向量，因此输入轴0的维数在输出形状中消失。

A_sum_axis0 = A.sum(axis=0)
A_sum_axis0, A_sum_axis0.shape

运行结果：

(tensor([40., 45., 50., 55.]), torch.Size([4]))

（2）沿轴1

A_sum_axis1 = A.sum(axis=1)
A_sum_axis1, A_sum_axis1.shape

运行结果：

(tensor([ 6., 22., 38., 54., 70.]), torch.Size([5]))

（3）沿行和列

沿着行和列对矩阵求和，等价于对矩阵的所有元素进行求和。

A.sum(axis=[0, 1])

运行结果：

tensor(190.)

（4）求平均值

# 将总和除以元素总数来计算平均值
A.mean(), A.sum() / A.numel()

运行结果：

(tensor(9.5000), tensor(9.5000))

计算平均值的函数也可以沿指定轴降低张量的维度。

(tensor([ 8.,  9., 10., 11.]), tensor([ 8.,  9., 10., 11.]))

4.3、非降维求和

有时在调用函数来计算总和或均值时保持轴数不变会很有用(或者说我们在运算时，不想把维度丢掉，想保持轴数不变)。

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
"""
tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  5.,  6.,  7.],
        [ 8.,  9., 10., 11.],
        [12., 13., 14., 15.],
        [16., 17., 18., 19.]])
"""
sum_A = A.sum(axis=1, keepdims=True)
sum_A

tensor([[ 6.],
        [22.],
        [38.],
        [54.],
        [70.]])

通过广播将A除以sum_A

A / sum_A

tensor([[0.0000, 0.1667, 0.3333, 0.5000],
        [0.1818, 0.2273, 0.2727, 0.3182],
        [0.2105, 0.2368, 0.2632, 0.2895],
        [0.2222, 0.2407, 0.2593, 0.2778],
        [0.2286, 0.2429, 0.2571, 0.2714]])

如果我们想沿某个轴计算A元素的累积总和，比如axis=0（按行计算），我们可以调用cumsum函数。此函数不会沿任何轴降低输入张量的维度。

A.cumsum(axis=0)

tensor([[ 0.,  1.,  2.,  3.],
        [ 4.,  6.,  8., 10.],
        [12., 15., 18., 21.],
        [24., 28., 32., 36.],
        [40., 45., 50., 55.]])

4.4 点积（Dot Product）

点积是相同位置的按元素乘积的和

y = torch.ones(4, dtype = torch.float32)
x, y, torch.dot(x, y)  # 对 x， y两个张量，相同位置的按元素乘积，再求和

(tensor([0., 1., 2., 3.]), tensor([1., 1., 1., 1.]), tensor(6.))

我们可以通过执行按元素乘法，然后进行求和来表示两个向量的点积

x*y, torch.sum(x*y)

(tensor([0., 1., 2., 3.]), tensor(6.))tensor(6.)

4.5、矩阵-向量积

PS：

比如: α=(1,2,3), β=(4,5,6)

则 α, β的内积等于 1 * 4 +2 * 5 + 3 * 6 = 32

示例：

当我们为矩阵A和向量x调用torch.mv(A, x)时，会执行矩阵-向量积。注意，A的列维数（沿轴1的长度）必须与x的维数（其长度）相同。

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
x = torch.arange(4, dtype=torch.float32)
A, x ,A.shape, x.shape

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [12., 13., 14., 15.],
         [16., 17., 18., 19.]]),
 tensor([0., 1., 2., 3.]),
 torch.Size([5, 4]),
 torch.Size([4]))

torch.mv(A, x)

tensor([ 14.,  38.,  62.,  86., 110.])

4.6、矩阵-矩阵乘法

我们可以将矩阵-矩阵乘法AB看作是简单地执行m次矩阵-向量积，并将结果拼接在一起，形成一个n×m矩阵。

A = torch.arange(20, dtype=torch.float32).reshape(5, 4)
B = torch.ones(4, 3)
B, torch.mm(A, B)

(tensor([[1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.],
         [1., 1., 1.]]),
 tensor([[ 6.,  6.,  6.],
         [22., 22., 22.],
         [38., 38., 38.],
         [54., 54., 54.],
         [70., 70., 70.]]))

矩阵-矩阵乘法可以简单地称为矩阵乘法，不应与”Hadamard积”混淆。

4.7、范数

向量的范数可以简单形象的理解为向量的长度，或者向量到零点的距离，或者相应的两个点之间的距离。

向量的范数定义：向量的范数是一个函数||x||,满足非负性||x||>=0，三角不等式||x+y||<=||x||+||y||。

范数在机器学习中的应用：

范数和L2范数，用于机器学习的L1正则化、L2正则化。对于线性回归模型，使用L1正则化的模型叫做Lasso回归，使用L2正则化的模型叫做Ridge回归（岭回归）。

参考博客：范数在深度学习中的应用 - 知乎 (zhihu.com)

4.7.1、范数和目标

在深度学习中，我们经常试图解决优化问题： 最大化分配给观测数据的概率; 最小化预测和真实观测之间的距离。用向量表示物品（如单词、产品或新闻文章），以便最小化相似项目之间的距离，最大化不同项目之间的距离。目标，或许是深度学习算法最重要的组成部分（除了数据），通常被表达为范数。

补充：按特定轴求和

视频链接：按特定轴求和_哔哩哔哩_bilibili

4、线性代数QA

视频链接：线性代数 QA_哔哩哔哩_bilibili

选择框架，学pytorch or tensorflow or …?

==》学开车，选什么车都行，每隔一个时段都有新的流行的工具产生，会用工具，而不限制于工具

5、小结

标量、向量、矩阵和张量是线性代数中的基本数学对象。
向量泛化自标量，矩阵泛化自向量。
标量、向量、矩阵和张量分别具有零、一、二和任意数量的轴。
一个张量可以通过sum和mean沿指定的轴降低维度。
两个矩阵的按元素乘法被称为他们的Hadamard积。它与矩阵乘法不同。
在深度学习中，我们经常使用范数，如L1范数、L2范数和Frobenius范数。
我们可以对标量、向量、矩阵和张量执行各种操作。

03 微积分

1. 导数和微分
2. 偏导数
3. 梯度
4. 链式法则
5. 小结
6. 练习

04 自动微分

1. 一个简单的例子
2. 非标量变量的反向传播
3. 分离计算
4. Python控制流的梯度计算
5. 小结
6. 练习

05 概率

1. 基本概率论
- 1.1. 概率论公理
- 1.2. 随机变量
1. 处理多个随机变量
- 2.1. 联合概率
- 2.2. 条件概率
- 2.3. 贝叶斯定理
- 2.4. 边际化
- 2.5. 独立性
- 2.6. 应用
3. 期望和方差
4. 小结
5. 练习

06 查阅文档

1. 查找模块中的所有函数和类
2. 查找特定函数和类的用法
3. 小结
4. 练习

你可能感兴趣的:(DeepLearning,深度学习,学习,python,deep,learning,pytorch)

机器学习基本库之Pandas 莫名其妙 pandas 机器学习 python 数据分析
Pandas是机器学习中专门用于数据处理的库，遇到很多数据时首先要使用Pandas进行预处理得到我们想要的信息，下面让我们来看一下Pandas中有哪些操作importpandasfood_info=pandas.read_csv("food_info.csv")#将csv文件中的数据进行读取print(type(food_info))#pandas中的核心结构叫做DATAFRAMEprint(fo
DeepSeek模型实战：从理论到应用的深度探索 CodeJourney. 人工智能算法数据库
一、引言在人工智能快速发展的当下，大型语言模型已成为自然语言处理领域的核心力量。DeepSeek模型作为其中的佼佼者，凭借其先进的架构和强大的性能，吸引了众多开发者和研究人员的关注。本文将深入探讨DeepSeek模型的技术原理，并通过实际案例展示其在不同场景下的应用，为读者提供从理论到实践的全面指导。二、DeepSeek模型技术剖析（一）架构基础DeepSeek模型基于Transformer架构构
深度求索（DeepSeek）：中国AGI领域的新锐探索者 .猫的树 AGI-通用人工智能 AGI 人工智能深度学习
文章目录引言：当AGI照进现实一、DeepSeek技术亮点解析1.1模型架构创新1.2性能对标国际巨头二、开源生态建设2.1开源全家桶2.2开发者友好设计三、应用场景展望3.1智能编程助手3.2企业级解决方案四、AGI之路的挑战与思考结语：中国AI的新范式讨论话题：引言：当AGI照进现实在ChatGPT掀起全球AI热潮的今天，一家名为深度求索（DeepSeek）的中国公司正以独特的技术路径冲击AG
centos 编译安装php 7.0 $Elvin php centos
第一步：安装依赖yuminstall-ygccgcc-c++makecmakebisonautoconfwgetlrzszyuminstall-ylibtoollibtool-ltdl-develyuminstall-yfreetype-devellibjpeg.x86_64libjpeg-devellibpng-develgd-develyuminstall-ypython-develpatch
【有啥问啥】DeepSeek 技术原理详解有啥问啥大模型深度学习
DeepSeek技术原理详解DeepSeek是一款具有突破性技术的大型语言模型，其背后的技术原理涵盖了多个方面，以下是对其主要技术原理的详细介绍：架构创新多头潜在注意力机制（MLA）传送门链接:DeepSeekV3中的Multi-HeadLatentAttention(MLA)：技术解析与应用DeepSeek引入了多头潜在注意力机制（Multi-headLatentAttention,MLA），这
解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心盛宴 leluckys AI大模型 AI编程
在拆解DeepSeek源码后，会发现几个颠覆行业认知的真相。这个号称“用十分之一算力吊打GPT-4”的国产大模型，藏着令人拍案叫绝的工程智慧，却也暗藏致命软肋。第一刀：切开开源表象，DeepSeek确实把代码仓库甩上了GitHub,但这套开源策略藏着精妙算计。他们公开的是经过蒸馏的“成品模型”，而非原始训练框架：就像给你组装好的乐高战舰，却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态，又
Python线程安全队列的使用与优化：单队列与多队列处理的对比 kdayjj966 python 开发语言
在多线程编程中，队列（Queue）是一个非常重要的工具，尤其是在需要线程安全时。本文通过一个实际案例，讲解如何在Python中高效使用队列，并介绍优化代码以提升灵活性和可扩展性的方法。问题背景在多线程环境中，我们常常需要共享数据，并对其进行并发操作。例如，一个线程对数据进行加1操作，另一个线程对数据进行减1操作，最终希望数据能正确处理并输出。以下是一个使用单队列的简单案例：代码如下：importt
PostgreSQL认证指南 leegong23111 postgresql 数据库
PostgreSQL作为一款强大的开源关系型数据库，深受开发者和企业的青睐。获得PostgreSQL专家认证，不仅能提升个人在数据库领域的专业能力，还能为职业发展增添有力筹码。下面为大家详细介绍PostgreSQL专家认证的学习路径。一、深入理解基础知识·数据类型与存储：PostgreSQL支持多种数据类型，如常见的整数、浮点数、字符串，还有特殊的几何类型、JSON类型等。深入了解每种数据类型的存
DeepSeek系列模型：高效能推理与多模态处理的技术突破与实践路径张3蜂人工智能开源技术选型人工智能开源机器人
目录引言一、高效能推理的核心技术路径二、多模态处理的技术创新三、技术协同与落地实践四、未来技术演进方向结论引言背景与挑战AI模型规模化趋势下，推理效率与多模态融合成为关键瓶颈。DeepSeek系列模型的定位：平衡性能、效率与多模态能力的技术创新者。核心命题如何通过架构设计与算法优化实现高效推理？如何突破模态边界实现跨模态语义理解与生成？一、高效能推理的核心技术路径轻量化模型架构设计动态稀疏注意力机
DeepSeek 的创新融合：多行业应用实践探索 ♡喜欢做梦人工智能 deepseek
引言在数字化转型的浪潮中，技术的融合与创新成为推动各行业发展的关键力量。蓝耘平台作为行业内备受瞩目的创新平台，以其强大的资源整合能力和灵活的架构，为企业提供了高效的服务支持。而DeepSeek凭借先进的人工智能技术，在自然语言处理、数据分析等领域展现出卓越的性能。当蓝耘平台与DeepSeek携手，二者的优势互补为多行业解决方案带来了全新的应用实践方向，为企业解决复杂业务问题、提升运营效率提供了强大
CSDN C知道接入DeepSeek-R1满血版，赋能开发者高效智能编程与问题解决 CSDN资讯人工智能
CSDN宣布旗下C知道产品将接入深度求索（DeepSeek）人工智能大模型，通过植入“深度思考模式”，全面升级用户的AI搜索体验，重新定义智能编程场景。“CSDN积极整合行业顶尖技术能力，现已引入以DeepSeek为代表的推理大模型，并与C知道AI搜索产品深度融合，致力于为开发者提供更高效、更智能的技术解决方案与学习辅助工具，助力开发者提升效率、解决技术难题。”CSDN技术负责人表示，持续升级的A
CentOS7 源码安装python3 Jerion929 centos linux python
一、安装依赖包首先，确保系统中安装了编译Python所需的依赖包。可以通过以下命令安装：yumgroupinstall-y"DevelopmentTools"#CentOS8用此命令yuminstall-y\openssl-devel\bzip2-devel\libffi-devel\zlib-devel\readline-devel\sqlite-devel\wget\gcc"Developme
CentOS 7 系统为 python3 安装 sqlite3 中兔西维亚 python Linux centos sqlite 服务器
故事背景pythontest2.pyTraceback(mostrecentcalllast):File"test2.py",line4,inimportsqlite3File"/home/dongxw/usr/lib/python3.6/sqlite3/__init__.py",line23,infromsqlite3.dbapi2import*File"/home/dongxw/usr/lib
【DeepSeek】DeepSeek 如何应用于政务系统？深度求索者政务
DeepSeek作为一款高性能、低成本的AI大模型，近期在政务系统中得到了广泛应用，其技术能力和场景适配性正在推动数字政府的智能化转型。以下从应用场景、技术支撑、实际成效及未来方向等方面进行深度解析：一、核心应用场景智能公文处理政策解读与文件起草：DeepSeek基于自然语言处理（NLP）技术，可自动生成公文初稿，结合政务语境提取关键信息，生成拟办意见。例如，深圳市龙岗区的公文校对时间从人工5分钟
python输出值保留两位小数 Xi Zi numpy
可以使用python的格式化字符串功能来输出保留两位小数的值。例如：value=3.1415926print(f'{value:.2f}')这将会输出3.14。也可以使用format()函数来输出保留两位小数的值，例如：value=3.1415926print('{:.2f}'.format(value))这也会输出3.14。还有一种方法是使用Python的内置函数round()，例如：value
清华大学DeepSeek手册又双叒叕更新！第Ⅲ册《普通人如何抓住DeepSeek红利》纪元A梦资源分享办公软件 AI工具 DeepSeek DeepSeek手册普通人如何抓住DS红利
继清华大学DeepSeek手册第Ⅰ册《从入门到精通》和第Ⅱ册《如何赋能职场应用》之后，很多小伙伴都能够熟练的使用DeepSeek处理工作中的问题，也对DeepSeek的应用有了更深的理解；为了让每个人都能够利用DeepSeek处理日常生活、工作、学习等方面的诸多问题，清华大学推出了DeepSeek使用手册第Ⅲ册《普通人如何抓住DeepSeek红利》，让DeepSeek能够在各个方面充分发挥其作用和
#Java笔记 #程序实现：数组的操作——创建、插入、裁剪、扩展、翻转、排序 Mr_yuanh Java 初学笔记 java
刚开始学JAVA，从笔记做起！program1数组的操作目的书上说，数组[...]的长度一经初始化就不能改变；但是对数组的一些操作（插入、裁剪、扩展等）又要求改变数组的长度。《第一行代码JAVA》一书的4.3继承案例中讲道：“数组的缺陷就在于长度固定，而这个问题的解决可以利用第3章的链表解决……”（p220）于是，在对继承的下一步学习之前，我先用链表的方法来尝试解决。作为自己的笔记，也请诸君不吝赐
Python语言保留两位小数常用的方法！老男孩IT教育网络安全
很多小伙伴在刚学习Python的时候，可能会遇到需要对数据进行格式化输出的需求，其中最常见的的要求就是保留X位小数，今天本篇文章将为大家介绍一下Python数据格式化输出的方法，以下是详细的内容：1、使用字符串格式化大部分语言都可以使用字符串格式化的方法来实现保留两位小数的效果，python也不例外：a=12.345print("%.2f"%a)#%代表格式化输出，.2代表小数点后保留两位，f代表
智能化工具软件在教育领域的革命性应用：InsCode AI IDE引领编程教育新时代 InsCode AI IDE inscode 人工智能 ide
智能化工具软件在教育领域的革命性应用：InsCodeAIIDE引领编程教育新时代最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE引言随着信息技术的飞速发展，编程技能已经成为现代社会不可或缺的一部分。无论是计算机科学专业的学生，还是希望掌握编程技能以提升就业竞争力的职场人士，编程教育的重要性日益凸显。然而，对于许多初学者来说，编程学习往往充满了挑战和困惑。如何让编程变得更
还在熬夜做 PPT？结合Deepseek和Kimi 一键生成，效率飞起！ a小胡哦 powerpoint
打工人、学生党们，是不是每次做PPT都要掉一把头发？别愁啦，今天就给大家分享一个超绝的方法，用Deepseek自动生成PPT，轻松告别熬夜做PPT的痛苦！为什么选择Deepseek生成PPTDeepseek是一款强大的AI工具，它的中文理解和推理能力一流，能够快速精准地理解你的需求，生成逻辑清晰、内容丰富的PPT大纲和文本内容。不管是工作汇报、项目展示，还是学术报告，它都能帮你轻松搞定，节省大量时
Java初学者：Java - 从新手到高效掌握的重点与难点 ProgramHan java 学习开发语言
很多人都想学习Java，但是又无从下手，难道Java只能到培训机构去花钱学吗？结合本人的经验，我认为不需要去培训机构花钱学也可以学习Java。首先，我们的需求很明确，是关于学习方法和如何将所学应用到工作中。可能我们希望文章详细且有实际指导意义，帮助他们高效学习Java。接下来，我得考虑文章的结构。通常，学习指南会包括基础知识、重点难点、实践应用等部分，这样我们可以有条理地进行学习。然后，如何将学习
SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别钟小宇 LLM 人工智能语言模型
SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别STF（SupervisedFine-Tuning）和RLHF（ReinforcementLearningfromHumanFeedback）是两种不同的模型训练方法，分别用于不同的阶段和目的。以下是它们的主要区别：1.方法概述STF（监督微调）：定义：STF是指在已经预训练好的模型基础上，使用标注好的数据进一步训练模型，使其在特定任务上
AI大模型学习之白话笔记（一）-- GPT和LLM Langchain 人工智能学习笔记 langchain python 机器人大模型
前言2022年底第一次听说chatGPT,从最初的对话，到如今的文生视频Sora，带来的效果，越来越超出我们的想象。在2023年，我尝试去了解GPT可以干什么，有什么作用，该怎么用，不过变化太快，最终也没有找到一个好的方式干进去。为什么变化这么快，说到底，是AI大模型带来的巨变。现在很多大厂都在降薪裁员，也有不少公司在AllinAI，我们都有一个预感，要变天了。你想想，如果有一天，一款游戏的所有美
NoSQL调研与学习（一） JUNPR NoSQL redis nosql 数据库
NoSQL数据库调研与学习简言1.1NoSQL概述NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在处理web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，出现了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，特别是大数
CentOS7安装Python3.9（已装python2.6） Arvin627 python linux 开发语言
Python下载地址：Indexof/ftp/python/下载并解压#安装wgetyum-yinstallwget#下载wgethttps://www.python.org/ftp/python/3.9.0/Python-3.9.0.tgz#解压tarzxvfPython-3.9.0.tgz#切换目录cdPython-3.9.0编译并安装#编译./configure--prefix=/usr/l
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码默默科研仔粉丝福利机器学习人工智能
标题：【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码一、引言1.1研究背景和意义概述研究的背景以及该研究在领域内的重要性。1.2研究现状分析当前领域的研究进展和存在的问题。二、极限学习机（ELM）基本原理2.1ELM的基本模型描述ELM的基本模型结构和工作原理。2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提
Redis：深入理解阻塞列表弹出与消息发布订阅机制_brpop原理高级工程师2024 2024年程序员学习 redis bootstrap 数据库
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Linux运维全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶
阅读论文“用于车联网安全车载通信的机器学习技术“的学习笔记饮长安千年月物联网安全安全机器学习学习
前言论文全称为MachineLearningTechnologiesforSecureVehicularCommunicationinInternetofVehicles:RecentAdvancescandApplications智能交通系统（ITS）和计算系统的快速发展为智能交通安全提供了新的科学研究，并提供了舒适和高效的解决方案。人工智能（AI）已被广泛用于优化不同研究领域的传统数据驱动方法
307 跳转 getshell 饮长安千年月 WEB安全网络安全网络安全
307跳转getshell前言没事网上乱翻阅，看到了p神的一个文章，通过307去getshell，说实话，真的是觉得思路很妙，特别是利用的过程，这里属实是学习了。怎么说心里面的感觉呢，就是关关难过，但是关关过前面是用的靶场环境，然后因为一直要开启的原因，后面自己搭建了一个环境搭建首先开启docker的api下面会讲的，就不说了首先我们可以自己搭建环境，需要开启docker的api接口然后安装min
【AI引领潮流|未来智慧生活】国内机器聊天软件推荐（超全！）and人工智能&智能学习熔光人工智能 AI软件智能学习生活
1.AI聊天软件概述1.1AI聊天软件的关键技术1.2AI聊天软件的应用1.3AI聊天软件的挑战1.4总结2.智普清言3.文心一言4.讯飞星火5.知元AI6.白马AI7.ChatGPT8.一览AI应用链接9.人工智能10.机器学习↓个人主页：C_GUIQU↑1.AI聊天软件概述AI聊天软件是一种利用自然语言处理（NLP）、自然语言理解（NLU）和机器学习（ML）技术构建的软件，它能够理解用户的自然
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 (quickselect@163.com), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu