何以为皇

机器学习鱼书笔记（自用更新）

零、预知识

1.Numpy

使用

介绍：高效的操作多维数组的函数库。
安装：（前提已经安装了python）
```
pip install numpy
```
导入
```
import numpy as np
```

创建数组

Numpy最重要的数据结构是多维数组（ndarray）。通过Numpy，你可以轻松创建数组：

# 从Python列表创建一维数组
arr1d = np.array([1, 2, 3, 4, 5])
>[1, 2, 3, 4, 5]

# 从Python嵌套列表创建二维数组
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>[[1, 2, 3],
  [4, 5, 6],
  [7, 8, 9]]

# 创建全零数组
zeros = np.zeros((3, 4))
>[[0., 0., 0., 0.],
  [0., 0., 0., 0.],
  [0., 0., 0., 0.]]

# 创建全一数组
ones = np.ones((2, 3))
>[[1., 1., 1.],
  [1., 1., 1.]]

# 创建指定范围内的数组
range_arr = np.arange(0, 10, 2)
>[0, 2, 4, 6, 8]

# 创建线性间隔的数组
linspace_arr = np.linspace(0, 1, 5)
>[0.  , 0.25, 0.5 , 0.75, 1.  ]

数组属性

Numpy数组有许多属性，你可以通过它们来了解数组的维度、形状和元素类型：

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

print(arr.shape)        # 获取数组的形状 n行m列 输出：(3, 3)
print(arr.ndim)         # 获取数组的维度 输出：2
print(arr.size)         # 获取数组的长度 输出：9
print(arr.dtype)        # 获取数组的元素类型 输出：int64

数组操作

Numpy提供了许多数组操作函数，使得数组的操作和计算变得简单高效：

# 数组加法
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
result = arr1 + arr2
>[5, 7, 9]

# 数组乘法
arr = np.array([1, 2, 3])
result = arr * 2
>[2, 4, 6]

# 二维数组乘法
x = np.array([[1, 2], [3, 4]])
y = np.array([[2, 1], [3, 4]])
>[[1, 2],   [[2, 1],
  [3, 4]]    [4, 3]]
>[[2, 2],
  [12, 12]]

# 矩阵乘法 点乘运算
mat1 = np.array([[1, 2], [3, 4]])
mat2 = np.array([[5, 6], [7, 8]])
result = np.dot(mat1, mat2)
>[[1, 2],     [[5, 6],
  [3, 4]]			 [7, 8]]
>输出： [[19, 22],
        [43, 50]]

# 数组索引和切片 与python内置数组操作一致
arr = np.array([1, 2, 3, 4, 5])
print(arr[0])         # 输出：1
print(arr[1:4])       # 输出：[2, 3, 4]

# 数组形状变换
arr = np.array([1, 2, 3, 4, 5, 6])
reshaped_arr = arr.reshape(2, 3)
>[[1, 2, 3],
  [4, 5, 6]]

常用数学函数

Numpy提供了许多常用的数学函数，可以直接应用于数组：

arr = np.array([1, 2, 3, 4, 5])

print(np.sum(arr))          # 输出：15
print(np.mean(arr))         # 输出：3.0
print(np.max(arr))          # 输出：5
print(np.min(arr))          # 输出：1
print(np.sin(arr))          # 输出：[0.84147098 0.90929743 0.14112001 -0.7568025  -0.95892427]
print(np.cos(arr))          # 输出：[0.54030231 -0.41614684 -0.9899925 -0.65364362 0.28366219 0.96017029]
print(np.power(arr, 2))     # 输出：[1,  4,  9, 16, 25]
print(np.exp(arr))          # 输出：[2.71828183, 7.3890561, 20.08553692, 54.59815003, 148.4131591 ]

广播机制

广播是numpy中一种强大的机制，允许对不同形状的数组进行运算，而不需要显式地进行形状匹配或复制数据。

广播标量，下图将10当做2x2的矩阵来运算
数组广播

通过以上的例子可以看到广播的原则都是低纬度向高纬度看齐，然后补全数据，再进行运算。

2.Matplotlib

Matplotlib是Python中最流行的数据可视化库之一，可以用来绘制图表内容。

安装Matplotlib

在开始之前，确保你已经安装了Python和Matplotlib。如果还没有安装Matplotlib，可以通过以下命令使用pip进行安装：

pip install matplotlib

导入Matplotlib

在使用Matplotlib之前，首先需要导入它。习惯上，我们使用以下方式导入Matplotlib并简写为plt：

import matplotlib.pyplot as plt

1. 绘制简单的折线图

折线图是Matplotlib中最简单的图表类型之一，它用于显示数据随着变量的变化而变化的趋势。下面是一个简单的绘制折线图的例子：

# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 绘制折线图
plt.plot(x, y)

# 添加标题和标签
plt.title('简单折线图')
plt.xlabel('X轴')
plt.ylabel('Y轴')

# 显示图形
plt.show()

图形绘制如下

2.绘制散点图

散点图常用于显示两个变量之间的关系。下面是一个绘制散点图的例子：

# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 绘制散点图
plt.scatter(x, y)

# 添加标题和标签
plt.title('简单散点图')
plt.xlabel('X轴')
plt.ylabel('Y轴')

# 显示图形
plt.show()

3. 绘制柱状图

柱状图常用于比较不同类别的数据。下面是一个绘制柱状图的例子：

# 示例数据
categories = ['A', 'B', 'C', 'D', 'E']
values = [10, 25, 15, 30, 20]

# 绘制柱状图
plt.bar(categories, values)

# 添加标题和标签
plt.title('简单柱状图')
plt.xlabel('类别')
plt.ylabel('值')

# 显示图形
plt.show()

4. 绘制饼图

饼图常用于显示不同类别占总量的比例。下面是一个绘制饼图的例子：

# 示例数据
categories = ['A', 'B', 'C', 'D', 'E']
values = [10, 25, 15, 30, 20]

# 绘制饼图
plt.pie(values, labels=categories, autopct='%1.1f%%')

# 添加标题
plt.title('简单饼图')

# 显示图形
plt.show()

5. 自定义图形样式

Matplotlib允许我们自定义图形的样式，包括线条颜色、标记类型、图例等。例如：

x = np.arange(0,6, 0.1)
# 绘制sin图像
y1 = np.sin(x)
# 绘制cos图像
y2 = np.cos(x)

plt.plot(x, y1, label="sin", color='blue')
# 设置图线样式
plt.plot(x, y2, linestyle="--", color='red', label="cos")
plt.xlabel("x")
plt.ylabel("y")
plt.title("sin & cos")
plt.legend()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9jJZ8AKc-1691499932714)(鱼书笔记.assets/image-20230728194801266.png)]

6.绘制其他图形的方法（总结于chatGPT）

plt.plot() # 绘制折线图。

plt.scatter() # 绘制散点图。

plt.bar() # 绘制柱状图。

plt.barh() # 绘制水平柱状图。

plt.hist() # 绘制直方图。

plt.pie() # 绘制饼图。

plt.boxplot() # 绘制箱线图。

plt.errorbar() # 绘制误差条形图。

plt.contour() # 绘制等高线图。

plt.imshow() # 绘制图像。

plt.polar() # 绘制极坐标图。

plt.stem() # 绘制离散序列的线型图。

plt.fill() 和 plt.fill_between() # 绘制填充图。

plt.stackplot() # 绘制堆叠区域图。

plt.barbs() # 绘制风羽图。

plt.quiver() # 绘制场矢量图。

plt.streamplot() # 绘制流线图。

plt.hexbin() # 绘制六边形二维直方图。

一、感知机

1.感知机原理

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yayXtuvz-1691499932714)(鱼书笔记.assets/image-20230726224334363.png)]

x1，x2是输入，y是输出，w1，w2是权值，x*w之和超过阀值θ时才会激活y
$\begin{cases} 0 \,\,( \omega 1x1 + \omega2x2 \le \theta )\\ 1 \,\,( \omega 1x1 + \omega2x2 > \theta )\\ \end{cases}$

可将 $\theta$ 变为-b移到不等式左边，变换为如下表达式。其中 $\omega1$ 和 $\omega2$ 表示权重（用于控制各个信号的重要性），b表示偏置（用于控制神经元被激活的容易程度）。
$\begin{cases} 0 \, \,( b+ \omega 1x1 + \omega2x2 \le 0 )\\ 1 \, \,( b+ \omega 1x1 + \omega2x2 > 0 )\\ \end{cases}$

2.简单逻辑电路

与门 AND 代码实现

def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

或门 OR 代码实现

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

与非门 NAND 代码实现

def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

3.多层感知机的实现

单层的感知机，只能划分线性空间，想要实现异或门仅靠单层感知机无法实现，所以借助多层感知机进行非线性的空间划分可以解决异或门无法实现的问题。如下图所示，通过一个与非门，一个或门，一个与门相互连接实现了异或门的功能

第0层的两个神经元接收输入信号，并将信号发送至第1层的神经元。
第1层的神经元将信号发送至第2层的神经元，第2层的神经元输出y。

异或门代码实现

def XOR(x1, x2):
  s1 = NAND(x1, x2)
  s2 = OR(x1, x2)
  y = AND(s1, s2)
  return y

二、神经网络

前面设计与或非门的权重值是人工设计的，后续通过学习神经网络，利用已有的数据学习合适的权重作为参数解决上面的权重问题。

1.激活函数

根据上图的函数转换，我们就能转换为h(x)，这就是激活函数

激活函数类型

激活函数分为阶跃函数和sigmoid函数，其中阶跃函数就是当输入值超过某一阀值时就换转变输出。

阶跃函数

定义如下
$\begin{cases} 0 \,\,( x \le 0 )\\ 1 \,\,( x > 0 )\\ \end{cases}$
代码实现

import numpy as np
import matplotlib.pylab as plt

# 定义阶跃函数
def step_function(x):
    y = x > 0
    return y.astype(int)

X = np.arange(-5.0, 5.0, 0.1)
Y = step_function(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)  # 指定图中绘制的y轴的范围
plt.show()

sigmoid函数

定义如下
$\frac{1}{1 + exp(-x)}$

代码实现

# coding: utf-8
import numpy as np
import matplotlib.pylab as plt

# sigmoid函数
def sigmoid(x):
    return 1 / (1 + np.exp(-x))    

X = np.arange(-5.0, 5.0, 0.1)
Y = sigmoid(X)
plt.plot(X, Y)
plt.ylim(-0.1, 1.1)
plt.show()

两个激活函数对比

共同点：有相似的形状、输入小时输出接近（等于）0，输入大时输出接近（等于）1、输出信号都在0到1之间。
不同点：sigmoid函数是光滑的曲线，阶跃函数是跳跃的折线。

ReLU函数

大于0时直接输出x，小于等于0时输出0
$\begin{cases} x \,\,( x > 0 )\\ 0 \,\,( x \le 0 )\\ \end{cases}$
代码实现

import numpy as np
import matplotlib.pylab as plt

# 定义reLU函数
def relu(x):
    return np.maximum(0, x)

x = np.arange(-5.0, 5.0, 0.1)
y = relu(x)
plt.plot(x, y)
plt.ylim(-1.0, 5.5)
plt.show()

2.神经网络的内积

多维数组的运算

二维数组点乘二维数组的运算法则等同于线性代数中学习的矩阵相乘的结果。

使用二维数组点乘一维数组的运算过程中我发现与想象的不太一致。像如下两个数组进行点乘运算，按照线性代数中所学，b矩阵应该要求为2行1列。但使用np.array进行点乘运算结果没有问题。

以下总结了二维点乘一维数组的运算规律

神经网络的内积

实现该神经网络时，要注意X、W、Y的形状，特别是X和W的对应维度的元素个数是否一致。

代码实现

3层神经网络的实现

其中符号的含义

实现第0层到第一层，在上图x1和x2的基础上加上了b1

用数学式表示 $a_1$ 如下
$a^{(1)}_1 = \omega^{(1)}_{11}x_1 + \omega^{(1)}_{12}x2 + b^{(1)}_1$
根据矩阵点乘算法规则，那么可以将第一层的加权表示成下面的数学式
$A^{(1)} = XW^{(1)} + B^{(1)}$

代码实现
```
X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])
A1 = np.dot(X, W1) + B1
```
实现下图a1到z1激活函数的转变（sigmoid函数）

代码实现

Z1 = sigmoid(A1)
print(A1) # [0.3 0.7 1.1]
print(Z1) # [0.57444252 0.66818777 0.75026011]

同理实现第一层到第二层的传递

代码实现

W2 = np.array([[0.1, 0.4],[0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])
print(Z1.shape) # (3,)
print(W2.shape) # (3, 2)
print(B2.shape) # (2,)
A2 = np.dot(Z1, W2) + B2
Z2 = sigmoid(A2)

第2层到第3层（输出层）也跟上面步骤基本一致，但激活函数不同

代码实现
```
# 定义恒等函数
def identity_function(x):
    return x

W3 = np.array([[0.1, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])
A3 = np.dot(Z2, W3) + B3
Y = identity_function(A3)
```
这里定义的恒等函数，会将输入按照原样输出，这里用恒等函数是为了和前面第0层到第1层和第1层到第2层的处理流程保持一致

总体代码实现

def identity_function(x):
    return x

# 权重和偏置的初始化  
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])

    return network

# 将输入信号转换为输出信号的方法
def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']

    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = identity_function(a3)

    return y

network = init_network()
# 定义两个输入x的初值
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)  # [0.31682708 0.69627909]

感知机中神经元流动的是0或1的二元信号，而神经网络中流动的是连续的实数值信号。

神经网络的激活函数必须使用非线性函数。因为使用线性函数的话，加深神经网络的层数将没有意义

一般而言，对于输出层的激活函数，回归问题用恒等函数，分类问题用softmax函数。

3.输出层的设计

1.三种输出函数的类型

恒等函数，常用在回归问题上
```
def identity_function(x):
    return x
```
sigmoid函数，用在二元分类问题上
$\frac{1}{1 + exp(-x)}$
```
def sigmoid(x):
    return 1 / (1 + np.exp(-x))    
```
softmax函数，用在多元分类问题上
$y_k = \frac{exp(a_k)}{\sum_{i=1}^n exp(a_i)}$
```
def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a

    return y
```
其中softmax函数表示在各输出之间都有收到输入信号的影响，如图

2.softmax函数溢出改进

之所以要改进softmax函数，是因为计算机所表示的数字是有界限的，比如32位或64位，而 $e^x$ 可以可以很大，会超过64位所表示数字的最大值，于是对softmax函数进行如下的改进：（1）分子分母同乘以一个常数（2）将常数移到指数函数内部，记为 $l o g C$ （3）用另一个常数替换 $l o g C$ （4）实例中常用0减去a数组中的最大值C: $ -C $替换这个 $C^{'}$

例子：

代码实现改进后的softmax函数

def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a - c)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a

    return y

3.softmax函数特征

我们可以看到输出的y都在0-1之间，且它们的和为1，所以我们可以把他转为概率问题，也就是说输出的越大，他的概率越高，从上图可以看出，输入的a数组元素越大，输出的数组对应元素（即概览）也越大；另外e^x是一个单调递增函数，所以上例中a元素的大小关系和y的大小关系不变，y[2]最大，所以我们在实际上根本不需要softmax函数，直接看a元素就能知道哪个概率最大了（因为softmax需要指数运算，计算量挺大的）

求解机器学习问题的步骤可以分为“学习”和“推理”两个阶段。在学习阶段进行模型的学习，然后，在推理阶段，用学到的模型对未知的数据进行推理（分类）。如前所述，推理阶段一般会省略输出层的softmax函数。在输出层使用softmax函数是因为它和神经网络的学习有关系

4.输出神经元数量

由上图可以知道，输出神经元数量由类别数量决定，如输出结果为0-9这10个类别，那么神经元输出则为10个。

4.手写数字识别

三、神经网络的学习

神经网络的学习指的是根据训练数据找出相关权重参数的过程

1.从数据中学习

数字识别的方案

训练数据和测试数据

1.训练数据和测试数据：训练数据为监督数据，就是用来训练模型的，而测试数据就是不包含在训练模型内的数据，用来评判训练后模型好坏的数据。

2.泛化能力：泛化能力其实就是先训练数据训练模型，然后用测试数据进行测试模型，如果测试的成绩好那么他的泛化能力就好。

3.过拟合：根据训练数据训练出来的模型，他可以很好的处理测试已经训练过的数据，但是对没有测试过的测试数据却无法处理，所以模型和训练数据太过拟合以至于没有很好的泛化能力

2.损失函数

损失函数是用来评判神经网络好坏的一个重要指标，越低越好，一般有2种评判方法均方误差和交叉熵误差

one-hot表示法：仅正确标签为1，其余为0

1.均方误差

数学表达式：
$\frac{1}{2}\sum_{k}(y_k - t_k)^2$

$y_k$ 表示神经网络的输出， $t_k$ 表示监督数据，k表示数据的维数。

代码：

import numpy as np

def mean_squared_error(y, t):
    return 0.5 * np.sum((y - t) ** 2)

实例：

2.交叉熵误差

数学表达式：
$-\sum_{k} (t_klog_ey_k)$
其中log表示以e为底的自然对数， $y_k$ 是神经网络的输出， $t_k$ 是正确解标签。并且 $t_k$ 中只有正确解的索引标签为1，其余为0（one-hot表示）

代码实现：

def corss_entropy_error(y, t):
    # 在Python中，1e-7 是一个表示科学计数法的数值，也称为浮点数。它表示的是数字 1 乘以 10 的负7次方，即 0.0000001。科学计数法用于表示非常大或非常小的数值，以便简化表示和处理。在这种情况下，1e-7 表示一个非常接近零的小数值。
    delta = 1e-7
    # log表示以e为底数的自然对数
    return -np.sum(t * np.log(y + delta))

代码如下代码中加上了一个微小值delta，因为当出现np.log(0)时会变为负无限大的-inf，这样会导致后续计算无法进行。添加微小值可以防止负无限大的发生。

因为只有t为1时才计算，所以计算量比均方误差小，同时log是个负数的单调递增函数，趋向于0，所以y越大则E的结果越趋向于0，那么其误差结果就越小。

实例：

从上图可以看到第一个例子正确时概率高，损失函数的结果低，所以他的神经网络模型好。

3.mini-batch学习

$E=-\frac{1}{N}\sum_n\sum_k(t_{nk} log_e(y_{nk}))$

这里，假设数据有N个， $t_{nk}$ 表示第n个数据的第k个元素的值（ $y_{nk}$ 是神经网络的输出， $t_{nk}$ 是监督数据）。以上表达式就是将N个数据的损失函数的值取平均值。

# 改良交叉熵误差函数的实现
def cross_entropy_error_improved(y, t):
    # y的维度为1时
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    
    batch_size= y.shape[0]
    # 以下是t为one-hot表示形式的实现
    return -np.sum(t * np.log(y + 1e-7)) / batch_size
    # 以下是标签表示法，np.arange(batch_size)会生成一个0到batch_size-1的数组
    # return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size

mini-batch简单说就是采取部分样本计算出的结果近似看为整体的计算结果。

在进行神经网络的学习时，不能将识别精度作为指标。因为如果以识别精度为指标，则参数的导数在绝大多数地方都会变为0。

得益于sigmoid函数的斜率不为0，神经网络的学习才得以正确进行。

3.数值微分

1.导数

导数的定义：表示函数某一点的瞬间变化率，数学表达式如下
$\frac{df(x)}{dx} = \lim_{h\rightarrow0} \frac{f(x+h) - f(x)}{h}$
考虑代码实现求函数的导数，可以将h设置为非常非常小的值，如 $10^{-50}$ ，则代码如下：

def numerical_diff(f, x):
  h = 1e-50 # 0.0001
  return (f(x+h) - f(x)) / h

需改进点：

$10^{-50}$ 在Python中会产生舍入误差（rounding error）。如下运行的结果
```
>>> np.float32(1e-50)
0.0
```
使用float32类型的浮点数表示 $10^{-50}$ 则直接变成了0.0，无法正确表示。所以需要改进这个微小值。这里考虑使用 $10^{-4}$ 即1e-4
f(x+h)-f(x)/h（向前差分）这个误差也很大，因为根据1的改变，h不是一个趋近于0的数，所以误差变大，应该用中心法改成f(x+h)-f(x-h)/2h（中心差分）

改进后代码:

def numerical_diff(f, x):
  h = 1e-4 # 0.0001
  return (f(x+h) - f(x-h)) / (2*h)

注意：这种利用微小差分的导数过程为数值微分，而用数学公式推导的如y=x²导数为y=2x这种交解析性求导，这种叫做真导数

2.一个微分的例子

如：y=0.01x²+0.1x的导数实现

运行结果如下：

可以发现改进后的微分代码误差非常小

3.偏导数

一个函数有多个自变量时的导数成为偏导数，表达式 $\frac{\partial f}{\partial x_0}$ 、 $\frac{\partial f}{\partial x_1}$

如
$f(x_0, x_1) = x_0^2 + x_1^2$
使用matplotlib绘制的图像如下

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# 创建数据点
x0 = np.linspace(-10, 10, 100)
x1 = np.linspace(-10, 10, 100)
# 使用 np.meshgrid 函数可以将这两个一维数组转换为两个二维数组 x0 和 x1，这将构成我们的网格。
x0, x1 = np.meshgrid(x0, x1)
f = x0**2 + x1**2

# 创建 3D 图像
fig = plt.figure()
# projection='3d' 指定这是一个三维图像
ax = fig.add_subplot(111, projection='3d')

# 绘制曲面
# cmap='viridis' 指定了颜色映射，这里使用了 Viridis 颜色映射
ax.plot_surface(x0, x1, f, cmap='viridis')

# 设置轴标签
ax.set_xlabel('x0')
ax.set_ylabel('x1')
ax.set_zlabel('f(x0, x1)')

# 显示图像
plt.show()

偏导数实现：原理其实跟一元导数一样，就是带入一个真值消除一个变量而已

4.梯度

由全部变量的偏导数汇总而成的向量（ $\frac{\partial f}{\partial x_0}$ ， $\frac{\partial f}{\partial x_1}$ ）称为梯度

比如我们求一个函数y=x0²+x1²变量有x0，x1，当我们对他全部变量（这里最多只有2个）进行偏导汇总而成的变量叫梯度。

实现梯度的代码如下

# 实现梯度
def numerical_gradient(f, x):
    h = 1e-4
    grad = np.zeros_like(x)

    for idx in range(x.size):
        tem_val = x[idx]
        # f(x + h) 的计算
        x[idx] = tem_val + h
        fxh1 = f(x)

        # f(x - h) 的计算
        x[idx] = tem_val - h
        fxh2 = f(x)

        grad[idx] = (fxh1 - fxh2) / (2 * h)
        x[idx] = tem_val # 还原倍数
    
    return grad

从这个图可以看出，梯度指向函数 $f(x_0,x_1)$ 的最低处（最小值），就像指南针一样，所有的箭头都指向同一点。其次我们发现，离“最低处”越远，箭头越大。梯度指示的方向是各点处的函数值减小最多的方向，这是一个重要的性质！

1.梯度法

在梯度法中，函数的取值从当前位置沿着梯度方向前进一段距离，然后在新的地方重新求梯度，再沿着新梯度方向前进，如此反复，不断地沿梯度方向前进。像这样不断的沿梯度方向前进，逐渐减小函数值的过程就是梯度法，用数学表达式来表示则如下所示

$x_0 = x_0 - \eta\frac{\partial f}{\partial x_0}$

$x_1 = x_1 - \eta\frac{\partial f}{\partial x_1}$

其中， $\eta$ 表示更新量，在神经网络的学习中，称为学习率。学习率决定在一次更新中更新的程度。

梯度下降算法代码实现：

# 梯度下降法找最小值
def gradient_descent(f, init_x, lr=0.01, step_num=100):
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f, x)
        x -= lr * grad
        
    return x

用梯度法求函数 $f(x_0, x_1) = x_0^2 + x_1^2$ 的最小值如下

最终结果为(-6.11110793e-10 8.14814391e-10)，非常接近（0,0）。实际上，真的最小值就是(0, 0)。所以说通过梯度法我们基本得到了正确结果。用图示来表示梯度法的更新过程则如下：

学习率 $\eta$ 不可过大也不可过小，太大时结果会发散成很大的数，太小的话结果几乎没更新就结束了

像学习率这样的参数称为超参数。这是一种和神经网络的参数(权重和偏置)性质不同的参数。相对于神经网络的权重参数是通过训练数据和学习算法自动获得的，学习率这样的超参数则是人工设定的。一般来说，超参数需要尝试多个值，以便找到一种可以使学习顺利进行的设定。

2.神经网络的梯度

我们有2*3的W权重参数，L为损失函数，梯度用 $\frac{\partial L}{\partial W}$ 表示，如下所示
$\begin{Bmatrix} \omega_{11}&\omega_{12}&\omega_{13}\\ \omega_{21}&\omega_{22}&\omega_{23}\\ \end{Bmatrix}$

$\frac{\partial L}{\partial W} = \begin{Bmatrix} \frac{\partial L}{\partial \omega_{11}}&\frac{\partial L}{\partial \omega_{12}}&\frac{\partial L}{\partial \omega_{13}}\\ \frac{\partial L}{\partial \omega_{21}}&\frac{\partial L}{\partial \omega_{22}}&\frac{\partial L}{\partial \omega_{23}}\\ \end{Bmatrix}$

$\frac{\partial L}{\partial W}$ 的元素由各个元素关于W的偏导数构成。比如，第一行第一列的元素 $\frac{\partial L}{\partial \omega_{11}}$ 表示当 $\omega_{11}$ 稍微变化时，损失函数L会发生多大变化。这里的重点是 $\frac{\partial L}{\partial W}$ 的形状和W相同。

你可能感兴趣的:(机器学习,机器学习,笔记,人工智能)

【每日精进】少了读书和运动，不是美好的一天金台望道
6月25日星期六天气：晴好早晨：5点多起来，就整理发布“读毛年谱（176）”，顺便整理各个平台这个栏目的材料，均声明专栏是读书笔记，并非原创。以后这个栏目都不要放在宝贵的早上来做，完全放在晚上加工。早上做原创工作。以后每天还要安排读书和运动。少了这两样，这一天也不是美好的一天了！上午：到图书馆去，继续写小说第48章。下午：本想去图书馆，中午饭后，就在家里睡大觉了，一下午没做事。呜呼！晚上：完成“读
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
深入理解Socket套接字原理 Princesk web应用测试学习 websocket tcp/ip python
Socket套接字原理1、什么是Socket在计算机领域，套接字Socket作为计算机之间进行通信的固定的约定方式之一存在。这种太抽象了，我举个例子，我们要是用笔记本电脑前需要先对电脑供电，那供电就有两种方式电线插座供电和电池供电，电网有电就用插座供电，电网没电就用笔记本的自带的电池供电。那么这个供电的工具（电池或者电线插座）就是套接字Socket。Socket起源于Linux系统，我们都知道Li
2023-03-14《第4章如何用OKR激励个体》读书笔记4.1 会思考的南瓜
在OKR的语境中，挑战性体现在即使全身心投入、全力以赴地工作，O也只能完成60%-70%，才是常态。如何才能设置出有挑战性的目标？约翰·洛克（著有《人类理解论》）认为，目标本身就具有激励作用，正确的目标能把人的需要转变为动机，激励人们自觉地朝着一定的方向努力，并最终完成预设的任务。目标设置的5项原则(1)目标要清晰，也就是符合SMART原则中的具体、可衡量以及时间导向。(2)目标要兼顾难度和重要性
C++学习笔记day3 既白765 c++学习
继承：好处：减少重复代码语法：class子类：继承方式父类子类也称为派生类，父类也称为基类。继承中的对象模型：父类中所有的非静态成员都会被子类继承。利用开发人员命令提示工具查看对象模型：跳转盘符C：跳转文件路径cd具体路径下查看命名cl/d1reportSingleClassLayout类名文件名继承中的构造和析构顺序：先构造父类再构造子类先析构子类再析构父类继承中同名成员处理方式：访问子类同名成
C++DAY02笔记
Printf格式化输出（printf）(printformat)函数的原型intprintf(格式化字符串，表达式1，表达式2······)，作用是显示格式串中的内容，并且在该字符串指定的位置插入要显示的值。格式化字符串：1.普通字符-》直接输出。2.转换说明-》以%开头的字符，表示一个占位符，会以表达式的值替换占位符。（常见的转换说明：%d:以整数的形式解释这片内存空间，并十进制的方式输出；%f
学《梁宁产品思维30讲》有槽——微信为什么成为了今天的微信神秘的尹先生
缘起：朋友圈的高分评价文档由搜狗录音助手录制并转写，简单整理后发出，纯属一时兴起吐槽发出。搜狗录音提供了11个小时的免费的转写时长，相比于科大讯飞，搜狗在互联网产品的运营上面的确是更能够讨我们这些C端客户的芳心。他至少让我完整地试一下，如果我觉得效果真的非常好，我才会花这个钱，而讯飞那个就太急功近利了，一两分钟的体验真白瞎了我们去下载APP，希望他们能够换一批运营，关于有道云笔记、讯飞系列的对比吐
得到三周年直播收获简记张照浩
好久没有节奏性的学习得到了，我体会的结论是--一旦停止，前功尽弃，此言不虚啊~哈哈。学的少，进步的少，这就是我的代价。幸好在中午看到朋友分享海报，点进了得到三周年的直播，信息量很大，干货满满，当时没有记笔记，复盘一下，固化下知识，也便于今后再学习。我理解的这场直播为什么会有的原因如下：1、强化仪式感和节奏感。2、正向引导，尊重付出，给予反馈和获得感。3、价值吸引，强化品牌影响力，做推广。4、践行价
不可多得的风味小吃——读杨勇的《家园四书》（笔记4）潜2023
身为亳州人，谁不喜欢了解亳州事？读杨勇先生（雅不知）的《家园四书》，相当于走进了亳州，了解她的过去和现在。《家园四书》总共有四部分组成，每一部分都是一道亳州风味的小吃，让你了解亳州的同时，更能咀嚼出她的美。《历史书：明月前身》写了亳州诸多历史人物。写得厚重大气，篇篇有铮铮铁骨，文笔刚劲有力，也不乏诙谐，偶有文白相间之处，读来很有韵味，像作者的书法，需得细细地品。它是亳州的肉夹馍，咔吱一口咬下去，满
Matlab学习笔记：矩阵基础
MATLAB学习笔记：矩阵基础作为MATLAB的核心，矩阵是处理数据的基础工具。矩阵本质上是一个二维数组，由行和列组成，用于存储和操作数值数据。在本节中，我将详细讲解矩阵的所有知识点，包括创建、索引、运算、函数等，确保内容通俗易懂。我会在关键地方添加MATLAB代码示例，帮助你直观理解。最后，我会总结本课重点，并引出下一节“逻辑基础”的内容。一、什么是矩阵？在MATLAB中，矩阵是一个二维数组，元
ROS个人笔记
写在前面：由于个人原因距离上次学习ROS已经过去了2周时间，本以为时间不算长，但还是忘记了好多。因此写下这篇笔记，主要是记录学习过程中的概念性问题，程序代码可能会写，但是不是主要。1.ROS是什么：是一个生态系统，首先他是一个操作系统。统筹各种资源如通信，开发等。2.在以往开发时一旦工程庞大起来往往会对数据流通的耦合十分苦恼，因此ROS提供的通信方式为松耦合式的：节点Node。另外大工程时的另外一
20180818《遇见心想事成的自己》读书笔记苗苗聊成长
读书时间：20180813-20180818此书主要分为两部分，第一部分是心想事成的秘密，第二部分是秘密后的秘密。看到这两个主题就想起，曾经有些时候，也会期盼着能够心想事成，让自己在困境中突围，然而往往不管用，上天总是不会给到你想要的东西。看了此书才恍然大悟，原来心想事成也有方法，也讲套路。秘密后的秘密，才是核心。在这个快餐式的时代，很多时候我们只学一些表面上的术，就想达成所愿，化解一切难题，往往
HCIP第一、二章笔记整理 aaaBsBsBsB 笔记网络 tcp/ip
第一章：TCP协议的扩展一、面向连接点到点：TCP通讯中仅存在通讯双方，无第三方。连接性质：非物理链路上的连接，而是逻辑上的连接。二、TCP的报文结构核心字段：包括源端口号（16位）、目标端口号（16位）、序列号（32位）、确认应答号（32位）、首部长度（4位）、保留位（6位）、标记位（如SYN、ACK、RST等）、窗口大小（16位）、校验和（16位）、紧急指针（16位）、选项（可变长度）及数据。
HCIP第一天课程笔记整理搞IT的马哥 IP 网络网络协议 tcp/ip 服务器
HCIP----huawei认证高级工程师抽象语言先转化成编码编码一定要转化成二进制（为什么一定要转化成二进制？）二进制信号转化成电信号处理电信号（协议等同于标准，目的就是提升服务）（1876年电话诞生，1946年第一台电子计算机诞生）OSI参考模型---OSI/RM---ISO（国际标准化组织）---1979年颁布开放式系统互联参考模型（应表会传网数物）应用层---提供各种应用服务，将抽象语言转
小红书增加曝光率晓谈小红书_46f9
小红书目前来说的话，主要是依靠内容口碑模式，社群类型营销，笔记，类似于大众电商类型，但是我个人觉得小红书更有优势，以下是我发过的一些操作推广小技巧可以了解下。推广大致大家都大同小异，我只能给予一些适当帮助，如有推广业务需求可以随时私聊我。以下是我个人一些增加曝光率一些方式1：过硬的内容加上适当的曝光，点赞，评论，收藏，转发，等于文章的热度与曝光率2：内容过硬的同时，文章也需要注意一下排版，底色，文
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
CA复习功课陈小铃子 linux 运维服务器云原生
RHCSA复习笔记（完善版）一、文件管理创建文件/目录：touch[文件名]：创建空文件或更新现有文件时间戳。mkdir[目录名]：创建目录。常用选项：-p递归创建多级目录。查看文件/目录：ls[选项][文件/目录]：列出目录内容。常用选项：-l详细列表，-a显示隐藏文件，-h人性化大小显示。cat[文件名]：查看文件内容（小文件），无法翻页。less[文件名]：分页查看文件内容，支持搜索（/），
《自由人生》读书笔记 2 西红柿阿达
原文:问题：“人生有何意义？”其实这个问题是容易解答的。人生的意义全是各人自己寻出来，造出来的：高尚、卑劣、清贵、污浊、有用、无用……全靠自己的作为。生命本身不过是一件生物学的事实，有什么意义可说？生一个人与一只猫、一只狗，有什么分别？人生的意义不在于何以有生，而在于自己怎样生活。你若情愿把这六尺之躯葬送在白昼做梦之上，那就是你这一生的意义。你若发愤振作起来，决心去寻求生命的意义，去创造自己的生命
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
STM32F4-ETH通信（lwip）——学习笔记_stm32 lwip 2401_84010497 程序员嵌入式
7、CSMA/CD冲突检测：8、MAC子层：MAC数据包、MAC数据包格式、MAC地址：MAC地址由48位数字组成，它是网卡的物理地址，在以太网传输的最底层，就是根据MAC地址来收发数据的。部分MAC地址用于广播和多播，在同一个网络里不能有两个相同的MAC地址。PC的网卡在出厂时已经设置好了MAC地址，但也可以通过一些软件来进行修改，在嵌入式的以太网控制器中可由程序进行配置。数据包中的DA是目标地
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
日更92/365：我为什么要写作？富足的徐欢
我为什么要写作？这是真是一个好问题，若在做一件事情之前，知道自己的目标动机和需求，才能排序，分配好自己的时间。余生我想把写作当成我的习惯，因为在写作上面我可以有下面三个方面的提升：1.整理笔记有时，我们听完一堂课，会感觉到心潮澎湃，可是若没有把它整理成笔记或写践行清单，假以时日，这些没有被运用或链接的知识信息会在大脑处抹去。所以整理笔记是最优的辅助学习方法。2.梳理情绪相信大家都有这种体验，当我们
解决修改android手机设置中字体大小后系统布局混乱的方法 f44148db1e8c
均属于笔记，仅供个人参考，有问题欢迎指正重写getResources方法@OverridepublicResourcesgetResources(){//returnsuper.getResources();//解决修改android手机设置中字体大小后系统布局混乱的方法，重构getResources，修改系统倍数对应用内sp的影响；Resourcesres=super.getResources(
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

机器学习鱼书笔记（自用更新）

零、预知识

1.Numpy

使用

广播机制

2.Matplotlib

1. 绘制简单的折线图

2.绘制散点图

3. 绘制柱状图

4. 绘制饼图

5. 自定义图形样式

6.绘制其他图形的方法（总结于chatGPT）

一、感知机

1.感知机原理

2.简单逻辑电路

3.多层感知机的实现

异或门 代码实现

二、神经网络

1.激活函数

激活函数类型

两个激活函数对比

ReLU函数

2.神经网络的内积

多维数组的运算

神经网络的内积

3层神经网络的实现

3.输出层的设计

1.三种输出函数的类型

2.softmax函数溢出改进

3.softmax函数特征

4.输出神经元数量

4.手写数字识别

三、神经网络的学习

1.从数据中学习

2.损失函数

1.均方误差

2.交叉熵误差

3.mini-batch学习

3.数值微分

1.导数

2.一个微分的例子

3.偏导数

4.梯度

1.梯度法

2.神经网络的梯度

你可能感兴趣的:(机器学习,机器学习,笔记,人工智能)

异或门代码实现