UniversalAIPlatform

系列之4-单入单出的一层神经网络能做什

Content
01.0-神经网络的基本工作原理
01.1-基本数学导数公式
01.2-Python-Numpy库的点滴
02.0-反向传播与梯度下降
02.1-线性反向传播
02.2-非线性反向传播
02.3-梯度下降
03.0-损失函数
03.1-均方差损失函数
03.2-交叉熵损失函数
04.0-单入单出单层-单变量线性回归
04.1-最小二乘法
04.2-梯度下降法
04.3-神经网络法
04.4-梯度下降的三种形式
04.5-实现逻辑非门
05.0-多入单出单层-多变量线性回归
05.1-正规方程法
05.2-神经网络法
05.3-样本特征数据的归一化
05.4-归一化的后遗症
05.5-正确的推理方法
05.6-归一化标签值
06.0-多入多出单层神经网络-多变量线性分类
06.1-二分类原理
06.2-线性二分类实现
06.3-线性二分类结果可视化
06.4-多分类原理
06.5-线性多分类实现
06.6-线性多分类结果可视化
07.0-激活函数
07.1-挤压型激活函数
07.2-半线性激活函数
07.3-用双曲正切函数分类
07.4-实现逻辑与门和或门
08.0-单入单出双层-万能近似定理
08.1-双层拟合网络的原理
08.2-双层拟合网络的实现
09.0-多入多出双层-双变量非线性分类
09.1-实现逻辑异或门
09.2-理解二分类的工作原理
09.3-非线性多分类
09.4-理解多分类的工作原理
10.0-调参与优化
10.1-权重矩阵初始化
10.2-参数调优
10.3-搜索最优学习率
10.4-梯度下降优化算法
10.5-自适应学习率算法
11.0-深度学习基础
11.1-三层神经网络的实现
11.2-验证与测试
11.3-梯度检查
11.4-手工测试训练效果
11.5-搭建深度神经网络框架
12.0-卷积神经网络
12.1-卷积
12.2-池化
14.1-神经网络模型概述
14.2-Windows模型的部署
14.3-Android模型的部署

下面我们举一个简单的线性回归的例子来说明实际的反向传播和梯度下降的过程。完全看懂此文后，会对理解后续的文章有很大的帮助。

简单回忆一下什么是线性回归：

回归的目的是通过几个已知数据来预测另一个数值型数据的目标值。假设特征和结果满足线性关系，即满足一个计算公式y(x)，这个公式的自变量就是已知的数据x，函数值y(x)就是要预测的目标值。这个计算公式称为回归方程，得到这个方程的过程就称为回归。线性回归就是假设这个方式是一个线性方程，一个多元一次方程，其形式为：
\[y=a_0+a_1x_1+a_2x_2+\dots+a_kx_k\]
为了简化起见，我们用一元一次的线性回归来举例，即$z = wx+b$（z,w,x,b都是标量），因为这个函数的形式和神经网络中的$Z = WX + B$（Z,W,X,B等都是矩阵）非常近似，可以起到用简单的原理理解复杂的事情的作用。

创造训练数据

让我们先自力更生创造一些模拟数据：

import numpy as np
import matplotlib.pyplot as plt
from pathlib import Path

def create_sample_data(m):
    # check if saved before
    Xfile = Path("XData.npy")
    Yfile = Path("YData.npy")
    # load data from file
    if Xfile.exists() & Yfile.exists():
        X = np.load(Xfile)
        Y = np.load(Yfile)
    else: # generate new data
        X = np.random.random(m)
        # create some offset as noise to simulate real data
        noise = np.random.normal(0,0.1,X.shape)
        # genarate Y data
        W = 2
        B = 3
        Y = X * W + B + noise
        np.save("XData.npy", X)
        np.save("YData.npy", Y)
    return X, Y

由于使用了文件存储，所以在第二次运行本程序时，或者在调试代码时，前后的结果是可比的，因为是同一批数据。

得到200个数据点如下：

好了，模拟数据制作好了，目前X是一个200个元素的集合，里面有0~1之间的随机x点，Y是一个200个元素的集合，里面有对应到每个x上的$y=2x+3$的值，然后再加一个或正或负的上下偏移作为噪音，来满足对实际数据的模拟效果（因为大部分真实世界的生产数据从来都不是精确的，精确只存在于数学领域）。

现在我们要忘记这些模拟数据（样本值）是如何制作出来的，也就是要忘记W,B的值。我们就假设这是实际应用中收集到的模拟数据，但是我们并不知道它的原始函数是什么参数，只知道是公式$y = wx + b$，我们的任务就是要根据这些样本值，通过神经网络训练的方式，得到w和b的值。注意这里x和y是样本的输入和输出，不是目标变量，这一点和常见的初等数学题不一样，要及时转变概念。

最终，样本数据的样子是：

\[ \begin{pmatrix} x_1\\ x_2\\ \dots\\ x_m\\ \end{pmatrix} , \begin{pmatrix} y_1\\ y_2\\ \dots\\ y_m\\ \end{pmatrix} \]

其中，x就是上图中蓝色点的横坐标值，y是纵坐标值。

最小二乘法与均方差

线性回归试图学得 $z(x_i)=wx_i+b$，使得$z(x_i) \simeq y_i$。如何学得w和b呢？均方差(MSE - mean squared error)是回归任务中常用的手段：
\[ Error = \frac{1}{m}\sum_{i=1}^m(z(x_i)-y_i)^2 = \frac{1}{m}\sum_{i=1}^m(y_i-wx_i-b)^2 \]
其中，$x_i和y_i$是样本值，$z_i$是预测值。
实际上就是试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。

假设我们计算出初步的结果是红色虚线所示，这条直线是否合适呢？我们来计算一下图中每个点到这条直线的距离（黄色线），把这些距离的值都加起来（都是正数，不存在互相抵消的问题）成为loss，然后想办法不断改变红色直线的角度和位置，让loss最小，就意味着整体偏差最小，那么最终的那条红色直线就是我们要的结果。

如果想让Error的值最小，通过对w和b求导，再令导数为0（到达最小极值），就是w和b的最优解：

\[ w = \frac{\sum{y_i(x_i-\bar{x})}}{\sum{x_i^2}-\frac{1}{m}(\sum{x_i})^2}\tag{求和均为i=1到m} \]
\[ b=\frac{1}{m}\sum_{i=1}^m(y_i-wx_i) \]

我们先试一下上面这两个公式是否好用：

x_sum = sum(X)                          # 求x之和
x_mean = x_sum/m                        # 求x平均
x_square = sum(X*X)                     # 求x平方之和
x_square_mean = x_sum * x_sum / m       # 求x之和之平方之均
xy = sum(Y*(X-x_mean))                  # 求w的公式的分子部分
w = xy / (x_square - x_square_mean)     # 求w
print(w)
b = sum(Y-w*X) / m                      # 求b
print(b)

结果为：
w=1.9983541668129974
b=3.0128994960012876

可以看到非常接近w=2,b=3的原始值。
既然我们已经可以用纯数学方法的最小二乘法得到w,b的值，为什么还要学机器学习的方法呢？因为最小二乘法能做的事情有两种：
\[y=a_0+a_1x+a_2x^2+ \dots + a_mx^m \tag{单元x多次方程}\]
\[y=a_0+a_1x_1+a_2x_2+ \dots + a_mx_m \tag{多元x线性方程}\]
前提条件是我们预测到方程的形式。但是更复杂的形式就比较吃力甚至无能为力了，比如：

\[y=0.4x^2 + 0.3xsin(15x) + 0.01cos(50x)-0.3\]
\[y=3x_1^2 + 4x_2\]

而在客观世界中或实际的生产环境中，我们其实根本不知道要拟合的曲线是什么形式，就根本无从下手，这时只能用神经网络来拟合了，而拟合的结果也不是一个公式，而是一个神经网络模型。

定义神经网络结构

我们是首次尝试建立神经网络，先搞一个最简单的单点神经元：

对于简单的线性回归问题，我们使用单层网络单个神经元就足够了。而且由于是线性的，我们不需要定义激活函数，这就大大简化了程序，而且便于大家循序渐进地理解。

样本数据x，乘以相同的w值后相加，再加上偏移b，输出z。

def forward_calculation(w,b,X):
    z = w * x + b
    return z

定义代价函数

我们用传统的均方差函数: $loss = \frac{1}{2}(Z-Y)^2$，其中，Z是每一次迭代的预测输出，Y是样本标签数据。我们使用所有样本参与训练，因此损失函数实际为：

\[loss = \frac{1}{2m}\sum_{i=1}^{m}(Z_i - Y_i) ^ 2\]

其中的分母中有个2，实际上是想在求导数时把这个2约掉，没有什么原则上的区别。

由于loss是所有样本的集合，我们先对其中的所有值求总和，样本数量是m，然后除以m来求一个平均值。

下面是Python的code，用于计算损失：

# w:weight, b:bias, X,Y:sample data, count: count of sample, prev_loss:last time's loss
def check_diff(w, b, X, Y, count, prev_loss):
    Z = w * X + b
    LOSS = (Z - Y)**2
    loss = LOSS.sum()/count/2
    diff_loss = abs(loss - prev_loss)
    return loss, diff_loss

我们计算这个loss值的目的是计算前后两次迭代的loss值差异，当足够小时，就结束训练。

定义针对w和b的梯度函数

求w的梯度

因为：

\[z = wx+b\]

\[loss = \frac{1}{2}(z-y)^2\]

所以我们用loss的值作为基准，去求w对它的影响，也就是loss对w的偏导数：

\[ \frac{\partial{loss}}{\partial{w}} = \frac{\partial{loss}}{\partial{z}}*\frac{\partial{z}}{\partial{w}} \]

其中：

\[ \frac{\partial{loss}}{\partial{z}} = \frac{\partial{(\frac{1}{2}(z-y)^2)}}{\partial{z}} = z-y \]

而：

\[ \frac{\partial{z}}{\partial{w}} = \frac{\partial{}}{\partial{w}}(wx+b) = x \]

所以：

\[ \frac{\partial{loss}}{\partial{w}} = \frac{\partial{loss}}{\partial{z}}*\frac{\partial{z}}{\partial{w}} = (z-y)x \]

求b的梯度

所以我们用loss的值作为基准，去求w对它的影响，也就是loss对w的偏导数：

\[ \frac{\partial{loss}}{\partial{b}} = \frac{\partial{loss}}{\partial{z}}*\frac{\partial{z}}{\partial{b}} \]

其中第一项前面算w的时候已经有了，而：

\[ \frac{\partial{z}}{\partial{b}} = \frac{\partial{(wx+b)}}{\partial{b}} = 1 \]

所以：

\[ \frac{\partial{loss}}{\partial{b}} = \frac{\partial{loss}}{\partial{z}}*\frac{\partial{z}}{\partial{b}} = z-y \]

# z:predication value, y:sample data label, x:sample data, count:count of sample data
def dJwb_batch(X,Y,Z,count):
    p = Z - Y
    db = sum(p)/count
    q = p * X
    dw = sum(q)/count
    return dw, db

def dJwb_single(x,y,z):
    p = z - y
    db = p
    dw = p * x
    return dw, db

上面有两个求梯度函数，第一个用于数组数据（当输入的X/Y/Z都是数组时），第二个用于标量数据(x/y/z都是标量)，但最后输出的dw/db都是标量，因为只有一个神经元。

每次迭代后更新w,b的值

def update_weights(w, b, dw, db, eta):
    w = w - eta*dw
    b = b - eta*db
    return w,b

帮助函数

第一个show_result函数用于最后输出结果。第二个print_progress函数用于训练过程中的输出。

def show_result(X, Y, w, b, iteration, loss_his, w_his, b_his, n):
    # draw sample data
#    plt.figure(1)
    plt.subplot(121)
    plt.plot(X, Y, "b.")
    # draw predication data
    Z = w*X +b
    plt.plot(X, Z, "r")
    plt.subplot(122)
    plt.plot(loss_his[0:n], "r")
    plt.plot(w_his[0:n], "b")
    plt.plot(b_his[0:n], "g")
    plt.grid(True)
    plt.show()
    print(iteration)
    print(w,b)

def print_progress(iteration, loss, diff_loss, w, b, loss_his, w_his, b_his):
    if iteration % 10 == 0:
        print(iteration, diff_loss, w, b)
    loss_his = np.append(loss_his, loss)
    w_his = np.append(w_his, w)
    b_his = np.append(b_his, b)
    return loss_his, w_his, b_his

主程序初始化

# count of samples
m = 200
# initialize_data
eta = 0.01
# set w,b=0, you can set to others values to have a try
w, b = 0, 0
eps = 1e-10
iteration, max_iteration = 0, 10000
# calculate loss to decide the stop condition
prev_loss, loss, diff_loss = 0,0,0
# create mock up data
X, Y = create_sample_data(m)
# create list history
loss_his, w_his, b_his = list(), list(), list()

训练方式的选择

接下来，我们会用三种方式来训练神经网络（神经元）：

随机梯度下降SGD (Stochastic Gradient Descent)：每次迭代只使用一个样本进行训练，每次都更新梯度值
批量梯度下降BGD (Batch Gradient Descent)：把所有样本整批的输入网络进行训练，每批样本更新一次梯度值
小批量梯度下降MBGD (Mini-batch Gradient Descent)：每次用一部分样本进行训练，每小批样本更新一次梯度值

Pseudo code如下：

第一种方式：逐个样本训练即随机梯度下降

repeat:
    for 每个样本x,y:
        标量计算得到z的单值 z = w * x + b
        计算w的梯度
        计算b的梯度
        更新w,b的值
        计算本次损失
        与上一次的损失值比较，足够小的话就停止训练
    end for
until stop condition

第二种方式：批量样本训练即批量梯度下降

repeat:
    矩阵前向计算得到Z值 = w * X + b（其中X是所有样本的数组）
    计算w的梯度
    计算b的梯度
    更新w,b的值
    计算本批损失
    与上一批的损失值比较，足够小的话就停止训练
until stop condition

第三种方式：小批量样本训练即批量梯度下降

repeat:
    从样本集X中获得一小批量样本Xn
    矩阵前向计算得到Z值 = w * Xn + b（其中Xn是一小批样本的数组）
    计算w的梯度
    计算b的梯度
    更新w,b的值
    计算本批损失
    与上一批的损失值比较，足够小的话就停止训练
until stop condition

我们看完它们的训练结构后再来比较它门的好坏。

随机梯度下降方式 - SGD

针对200个数据，每次迭代只使用一个样本进行训练，每次都更新梯度值。

程序主循环

while iteration < max_iteration:
    for i in range(m):
        # get x and y value for one sample
        x = X[i]
        y = Y[i]
        # get z from x,y
        z = forward_calculation(w, b, x)
        # calculate gradient of w and b
        dw, db = dJwb_single(x, y, z)
        # update w,b
        w, b = update_weights(w, b, dw, db, eta)
        # calculate loss for this batch
        loss, diff_loss = check_diff(w,b,X,Y,m,prev_loss)
        # condition 1 to stop
        if diff_loss < eps:
            break
        prev_loss = loss
        
    iteration += 1
    loss_his, w_his, b_his = print_progress(iteration, loss, diff_loss, w, b, loss_his, w_his, b_his)
    if diff_loss < eps:
        break

show_result(X, Y, w, b, iteration, loss_his, w_his, b_his, 200)

程序运行结果

1 0.0013946089980010831 1.7082689753500857 2.8635473444149815
2 1.2964547916170625e-05 1.8540100768184453 3.06775776515801
3 7.79019593934345e-07 1.8807160337440225 3.0745103188170186
......
19 8.734980997196495e-09 1.9871421670235265 3.0189893623564035
20 6.770768725197773e-09 1.9888753203686051 3.0180574393623383
21 1.4217967081453509e-13 1.9909568305589769 3.0231282539481192
21
1.9909568305589769 3.0231282539481192

一共迭代了21次（实际是21*200次），由于diff_loss小于1e-10，所以停止了。但是，可以看到w=1.99..，b=3.023...，与实际值w=2, b=3还有差距。
下图右侧图，红色线是loss值的变化，蓝色线是w值的变化，绿色线是b值的变化。这三个值都很快从初始值趋近于理想值，可见这种方式的收敛速度较快。

批量梯度下降方式 - BGD

程序主循环

# condition 2 to stop
while iteration < max_iteration:
    # using current w,b to calculate Z
    Z = forward_calculation(w,b,X)
    # get gradient value
    dW, dB = dJwb_batch(X, Y, Z, m)
    # update w and b
    w, b = update_weights(w, b, dW, dB, eta)
#   print(iteration,w,b)
    iteration += 1
    # condition 1 to stop
    loss, diff_loss = check_diff(w,b,X,Y,m,prev_loss)
    if diff_loss < eps:
        break
    prev_loss = loss
    iteration += 1
    loss_his, w_his, b_his = print_progress(iteration, loss, diff_loss, w, b, loss_his, w_his, b_his)

show_result(X, Y, w, b, iteration, loss_his, w_his, b_his, 200)

程序运行结果

15580 1.0078619969849933e-10 1.9970527059142416 3.013622182124774
15590 1.0010891421385892e-10 1.9970570862183055 3.0136197497927952
15591
1.9970579605084025 3.013619264309657

训练过程迭代了15591次，loss的前后差值小于1e-10了，达到了停止条件。可以看到最后w = 1.997, b = 3.0136。
下图右侧图，红色线是loss值的变化，蓝色线是w值的变化，绿色线是b值的变化。到第400次迭代时，w/b两个值还没有到达理想值。loss的下降速度很快，但是在后期的变化很小，不能给w/b提供有效的反馈。

小批量梯度下降方式 - MBGD

程序主循环

batchNumber = 20 # 设置每批的数据量为20

# condition 2 to stop
while iteration < max_iteration:
    # generate current batch
    batchX, batchY = generate_batch(X, Y, iteration, batchNumber, m)
    # using current w,b to calculate Z
    Z = forward_calculation(w,b,batchX)
    # get gradient value
    dW, dB = dJwb_batch(batchX, batchY, Z, batchNumber)
    # update w and b
    w, b = update_weights(w, b, dW, dB, eta)
    # calculate loss
    loss, diff_loss = check_diff(w,b,X,Y,m,prev_loss)
    # condition 1 to stop
    if diff_loss < eps:
        break
    prev_loss = loss
    iteration += 1

    loss_his, w_his, b_his = print_progress(iteration, loss, diff_loss, w, b, loss_his, w_his, b_his)

show_result(X, Y, w, b, iteration, loss_his, w_his, b_his, 300)

程序运行结果

4450 1.2225522157127688e-10 1.9753608229361126 3.0087345373193264
4460 1.1451271614976166e-10 1.9753871799671467 3.008717691199392
4470 1.068962461950318e-10 1.975413384400498 3.0087009426124025
4479
1.975439437119652 3.0086842909936786

训练过程迭代了4479次，最后w=1.9754, b=3.0086。
下图右侧图，红色线是loss值的变化，蓝色线是w值的变化，绿色线是b值的变化。到第300次迭代时，w/b值已经接近理想值了。loss的下降速度慢，但是在后期仍然可以给w/b有效的反馈。

三种方式的比较

下图是三种方式在向目标解迭代靠近时的示意图：

随机梯度下降

每次用一个样本训练，然后立刻更新权重，训练速度最快。可以简单地理解为“神经过敏”性格。
可以设置一个适中（更多）的迭代次数，以便得到更好的解
由于使用单个样本数据，会受数据噪音的影响，且前后两个样本的训练效果可能会相互抵消。从轨迹上来看，跳跃性较大。
由于数据随机，所以有可能受训练样本噪音影响而跳到全局最优解，但是不保证。在某些博客中说“本方法只能获得局部最优解”，这实际上是不对的。

批量梯度下降

每次用整批样本训练后，才更新一次权重，训练速度最慢。可以简单地理解为“老成持重”性格。
特定的样本如果误差较大，不会影响整体的训练质量
从轨迹上来看，比较平稳地接近中心，但是在接近最优解时的迭代次数太多，非常缓慢
如果只有一个极小值，可以得到相对全局较优的解。如果实际数据有两个极小值，不一定能得到全局最优解。在某些博客中说“本方法可以获得全局最优解”，这实际上是不能保证的，取决于初始值设置。

小批量梯度下降

每次使用一小批数据训练，速度适中。可以简单地理解为“稳重而不失灵活”的性格。
多了一个batchNumber参数需要设置，大家可以试验一下分别设置为10，20，25，40，50，训练效果如何
从轨迹上来看，有小的跳跃，但是下降方向还算是稳定，不会向反方向跳跃

孔子说：点赞是人类的美德！如果觉得有用，关闭网页前，麻烦您给点个赞！然后准备学习下一周的内容。

点击这里提交问题与建议
联系我们: [email protected]
学习了这么多，还没过瘾怎么办？欢迎加入“微软 AI 应用开发实战交流群”，跟大家一起畅谈AI，答疑解惑。扫描下方二维码，回复“申请入群”，即刻邀请你入群。

ARTS-第七周梧上擎天
Algorithm一、用链表和二叉树实现Set集合GitHub地址二、散列表散列表就是使用数组下标随机访问时候复杂度为O（1）的特性，当我们按照键值查找元素时，通过散列函数将key转化为下标然后进行访问，当有大量散列冲突时会退化为O（n）的时间复杂度。解决散列冲突的方法：开放寻址法和链表法ReviewFlink动态表概念原文地址流和表为什么可以相互转换呢？我们都知道传统Mysql的主从复制是通过b
2022-11-28 WJSHI
加强新时代廉洁文化建设习近平总书记在十九届中央纪委六次全会重要讲话中指出：“领导干部特别是高级干部要带头落实关于加强新时代廉洁文化建设的意见，从思想上固本培元，提高党性觉悟，增强拒腐防变能力。”加强新时代廉洁文化建设，是持续深化不敢腐、不能腐、不想腐一体推进，惩治震慑、制度约束、提高觉悟一体发力的根本所在，是全面从严治党和解决党风廉政问题的治本之道。加强新时代廉洁文化建设要坚定文化自信，用战略思维
《无所畏》：不着急，不害怕，不要脸小考拉俱乐部
《无所畏》是冯唐的作品，他谈时间、谈人生、谈成功、谈爱情、谈女人、谈写作、谈亲人。在书中，冯唐总结了油腻青年的九个特点：装懂、着急、逐利、不迷恋肉身、迷恋手机、不靠谱、不敢真、假佛系、审美差。仔细想来，还真中招了好几条。比如：迷恋手机、假佛系等。自从有了手机，基本是不离身的。工作要用到手机，社交要用到手机，就连每天睡觉前的睡前仪式，也是看手机。至于佛系，有时是无能为力罢了，没有能力得到，干脆看淡。
golang语法-----指针查理养殖场编程语言笔记 golang 开发语言
一、核心语法1、取地址符&，用在一个变量前面，获取这个变量的内存地址。packagemainimport"fmt"funcmain(){name:="Alice"//变量name，它的值是"Alice"//&name获取变量name的内存地址//p是一个指针变量，它存储了name的地址//p的类型是*string，读作"string类型的指针"p:=&namefmt.Println("变量name
商女亦知亡国恨，此恨无关风与月鸣蜩二十二
最后啊，她们拉直了头发为女学生们唱了最后一支《秦淮景》将所有的家当给了女学生们“小妹妹，你可得给我好好保管，我还得拿这钱去赎身呢。”她们上了日本人的车，含着泪，望着教堂离开了———读《金陵十三钗》有感
【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
我的爱人野望_c7ac
我希望，在我的生命里从未爱过一个人除了她，没有任何东西能伤害你我要走进那荒野我不是去寻找春天我要去采摘花束手握一把我的爱人走了我在等她我希望，在我的生命里从未爱过一个人因为那是自我欺骗我要登上那座高峰在山顶跌落在谷底我很轻盈的躺着什么都不在去感受一切都静悄悄的我的爱人走了我在等她如果你是快乐的那么，你的心是满满的满满的装着过去的日子波浪和泥沙河流尽头，我把眼泪交托给船舶今夜，我在城南某一角我在想我
nest.js实战之集成Apple登录 crayon-shin-chan surprise #nest.js apple nestjs
1.简介https://developer.apple.com/documentation/sign_in_with_apple/sign_in_with_apple_rest_api/verifying_a_userApple登录也是符合OAuth2规范的，但是我们不需要执行所有的步骤，只需要解析idToken获取用户信息即可Apple登录时用户可以选择是否隐藏邮箱，如果隐藏邮箱，则获取的邮箱是
下班后做手机兼职刚刚好,天冷的时候可以在家兼职手机聊天员赚钱平台
我之前也提到过，很多晚班的兼职工作并不太划算，小时工资也不超过30元。仅仅努力工作是不够的。选择正确的方向也是非常重要的。因此，我推荐租车和跑快车的做法。当然，也有一定的局限性。一些网民不会开车，也不愿意放弃1W的押金。给大家推荐一个陪聊赚米项目叭，正规陪聊项目，网易云旗下大平台，无任何费用，下方有微信二维码，可扫码了解，也可点击链接，联系我们了解：https://www.jianshu.com/
如何删除lazyvim AI大权操作系统 vim
主要是删除这些文件:~/.config/nvim(LazyVimconfig)~/.local/share/nvim(用户数据目录下，这里有lazy安装的插件和mason安装的包)~/.local/state/nvim(Sessionstatedirectory:storageforfiledrafts,swap,undo,shada.)~/.cache/nvim(Neovimcache)rm-r
2.锁定Activity方向 Jennyni1122
2.1问题应用程序中的某个Activity不能旋转，或是旋转需要应用程序代码更直接的干预。2.2解决方案（APILevel1）在AndroidManifest.xml文件中可以用静态声明将每个Activity的方向锁定为横向或纵向。这个声明只能用于标签，所有不能一次性解决整个应用程序。只需要在元素中加上android:screenOrientation属性，无论设备处于什么位置，Activity都
十月十日 F啊
今天陈艳不在，，，，早上上课的时候，都没有小朋友愿意回答问题，哎呀，一阵尴尬，哈。中午在睡房，小朋友们也都比较配合，还好有王宁也帮我一起看照，挺好挺好的，而且第一次看到恩恩睡觉。卓卓终于有自己的小伙伴啦，就是恩恩，下午两人一边画画一边聊天，像是小闺蜜一样，聊的还特别开心，有说有笑，可能自己示意到自己的声音有点大，恩恩提议去红沙发聊，两人很开心的去了发现近两天有几个小朋友对钱挺感兴趣，好像是昨天墨墨
redis常见问题快乐的码农一枚 redis redis nosql 数据库
一、处理redis的线上问题Redis使用过程中经常会有各种大key的情况1、改对象需要每次都整存整取、最好改成hash存储，每次修改某一个field2、list、set、zset元素太多。每次可以只查询部分；3、将一个key拆分多个key二、超大Value打满网卡的问题如何规避业务设计上避免对于大文本【超过500字节】写入到Redis时，一定要压缩后存储！大文本数据存入Redis，除了带来极大的
白云下的九维湾第十一章 Thebookworm新西兰
Jimmy推开了餐厅的大门，看到餐馆里冷冷清清的没有一位用餐的客人。抖落掉了身上的雨水，他走向了那一张看海的老座位旁坐了下来。餐馆里的空调吐着暖气，雨珠在窗子的大玻璃上流淌着，看不清窗外在雨中咆哮着的大海和被海浪拍击着的沙滩和岩石。天，已经完全黑了下来。“哦，先生，是你……”Jimmy听到那个悦耳的女声在他的耳边说道。他抬起头，看到女孩那乌黑的，被长长的睫毛覆盖着的大眼睛，正带着感激与兴奋看着他。
2020-01-17 585e169ea247
今天，我们回老家了，奶奶买了很多鸡，知道我们回来了，奶奶就让爷爷宰了5只鸡。说要给我们炖鸡吃。我看见一只只活蹦乱跳的鸡，不一会就全倒在了地上。奶奶开始烧水，把鸡放进盆里，然后给鸡拔毛。过了一段时间后，香喷喷的鸡肉出现在我面前，我大口大口的吃着，美味极了。
神经网络项目--基于FPGA的AI简易项目（1-9图片数字识别）霖12 深度学习 pytorch 神经网络 fpga开发人工智能机器学习
1.训练MNIST模型importtorch#导入pytorch核心库importtorch.nnasnn#神经网络模块，如卷积层importtorch.optimasoptim#优化器fromtorchvisionimportdatasets,transforms#数据集与图像预处理工具#定义CNN模型classSimpleCNN(nn.Module):#PyTorch库中所有神经网络的“基础模
吃货想出道，三步做出比肯德基还好吃的薯条雨若newleaf
田同志做的最好的一次，我觉得色香味俱全每次出门，大宝总嚷嚷着：“薯条，薯条，爸爸，我要吃薯条……”可是，肯德基、麦当劳里面的薯条如果不沾番茄酱的话，一点味道也没有。他们送的番茄酱又有很多添加剂，小朋友们吃多了肯定不好。而且小朋友吃得慢，时间稍微一长，就变得软塌塌，一点也不脆了。好，一盒薯条就这样浪费了一大半。于是，田同志就说要自己炸来吃，实惠又卫生。图片是做得最好的一次，色香味俱全。下面我说下具体
家有肾综患儿，体会个中滋味（4）有爱关瞻
家有肾综患儿，体会个中滋味（4）上接第３节入院第３天，我儿子开始服用激素，３天后，尿蛋白转阴，一周之后，２４小时尿蛋白定量转阴，降到正常水平，病情稳定下来了。４月29日出院，出院的时候，支原体肺炎还没有完全好利索，肺里面还有痰，白细胞还是高，我们又到长春市中医院开了一些中药继续回家调理。直到这个时候，我们才从孩子得病带来的焦虑中慢慢缓过来，其实，这个时候，我们对“小儿肾病综合征”这个病的了解程度连
Redis 线上操作最佳实践阿贾克斯的黎明 java redis
在2024年9月19日，Redis作为一种高性能的内存数据库，在许多线上应用中发挥着重要作用。为了确保Redis在生产环境中的稳定运行和高效性能，以下是一些Redis线上操作的最佳实践。一、配置优化1.内存设置-根据实际需求合理设置Redis的内存限制。可以通过maxmemory参数来限制Redis使用的内存大小，避免因内存使用过多导致系统内存不足。-同时，设置合适的内存淘汰策略，如volatil
Go开发技术路线全解析：从基础到资深的系统学习指南（2025年版） Mr.小海 golang 开发语言后端容器云原生 vim 中间件
Go开发技术路线全解析：从基础到资深的系统学习指南（2025年版）一、基础阶段：Go语言入门与核心语法环境搭建与工具链环境标准化是Go开发流程的基础，其核心目标是确保开发环境的一致性与可重复性。2025年主流的Go环境安装方式包括两种：一是通过Go官方网站下载对应操作系统的二进制安装包，二是使用系统包管理器（如Linux的apt/yum、macOS的Homebrew等）进行安装。安装完成后，需配置
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
【Pandas超实用经验汇总-数据建模分析】 Mr.小海 Python 数据挖掘数据分析 python
Pandas超实用经验汇总-数据分析前言基本方法1.读取文件2.查看数据3.修改、删除、替换数据等总结前言看见了很多教程虽然很全，但是很多技巧容易忘记且几乎用不上，读起来晦涩难懂，今天我给大家总结了Pandas的一些学习经验技巧，包含常见日常使用的pandas知识，以及一些技巧,这些技巧常见于数学建模，数据分析，数据挖掘比赛等。基本方法1.读取文件方法如下：importpandasaspd#正常写
家有酒仙来访六月荷清香
晚上八点多，小镇就昏昏欲睡了。除了几盏昏黄的路灯寂寞地俯览着空荡的街道，路上行人寥寥。我想也没什么顾客来了，准备起身关门。这时门口倏地停下一辆摩托车，我还没来得及问他需要些什么，他径直朝我们夫妻俩围坐的火炉边走来。他戴着头盔，我一时没看出他是谁，待他取了头盔，才看清是一位熟人朋友，以前曾在我家隔壁租铺面做过半年小吃生意，因经营不善而关门大吉了。他人缘不错，和我们做邻居半年关系处得很好。我忙拿椅子让
《论语》学习第256天，君子不忧不惧流水王丽霞
弘毅乐学书院之学妹读经一字一句读《论语》第256天原文阅读：12.4司马牛问君子。子曰：“君子不忧不惧。”曰：“不忧不惧，斯谓之君子已乎？”子曰：“内省不疚，夫何忧何惧？”译文讲解：司马牛问怎样做一个君子。孔子说：“君子不忧愁，不恐惧。”又问：“不忧愁，不恐惧，这样就可以叫做君子了吗？”孔子说：“内心反省不感到有错而悔恨，那还有什么可愁可怕的呢？”启发思考：关于如何做一个君子，《论语》中有很多描述
命硬的故事--孩子的童年被烧伤，抗疤妈妈手记张筱旌
作者：张筱旌小c的妈妈，湖北大学新闻系毕业，7年青岛电视台主持人、记者目前创办优加学科英语培训学校。抗疤妈妈心酸手记，愿所有抗疤妈妈与宝贝们加油，度过这迷茫、无助、焦灼的抗疤的日子。童年，似乎永远与无拘无束得大笑、四处自由得奔跑、天真无邪得笑脸联系在一起，可有这么一群儿童，因为种种意外，他们受到烧烫伤，他们的童年，多了卧床不动的煎熬、撕心裂肺的痛哭、被血水浸染的纱布和被疤痕折磨的百蚁嗜骨的痒，不能
Go 的热重载工具 Air 详解半桶水专家 golang入门 golang 开发语言后端
一、Air安装1.安装Air命令打开终端（PowerShell或CMD）输入：goinstallgithub.com/air-verse/air@latest这会将air.exe安装到你的Gobin目录下，一般是：C:\Users\\go\bin2.设置系统PATH环境变量（如果还没有）将C:\Users\\go\bin添加到系统的环境变量中。步骤如下：打开“系统属性”→“环境变量”；找到“系统变
【日记星球第196篇】——骑行蟠龙湖神秘园的简书
2020年6月14日星期日图片发自App时过半年才开始今年的第一次跟队骑行，选了集合点离家最近路程也最短的逍遥游蟠龙湖之行，往返60公里。因为天热又是很多队友初次恢复骑行，领队这次没有发挥他的正常领骑速度，去程基本保持匀速25-26左右，居然我也混迹第一队里全程跟上，并且没有感觉累。看来每周一到两次的跑步虽然慢速，还是起到锻炼作用。由于路程太近，到蟠龙湖才十点多，部分骑友继续骑向上面的蟠龙湖小天路
启蒙力量功课牵手_禅
规画：已读微笑：完成自我确认：我是健康富足的，我是传递爱的使者爱的表达：对家人说爱你们，对遇到的伙伴表达我的爱。1感恩大慈大悲观世音菩萨的保佑，保佑着我，爱人以及两个女儿身体健康，平平安安。2感恩祖先赐予我们健康的身体，智慧的头脑，以及无限的庇佑。3感恩爱人的陪伴与支持和呵护。4感恩孩子们勇猛精进的自我成长。5感恩装修马老师对我人品的称赞6感恩所有为我服务的有形以及无形的众生7感恩好朋友为孩子打印
成年人的崩溃李子心诚
曾经心中执剑的少年，此刻也混迹于市井之间每次觉得稍松一口气时幺蛾子就来了，不敢发出最近真幸福的感叹，怕命运听到，如履薄冰就是成年人的常态。成年人的崩溃是一种默不作声的崩溃。看起来很正常，会说笑，会打闹，会社交。表面平静，实际上心里的糟心事已经积累到一定程度了，不会摔门砸东西，不会流眼泪或歇斯底里。但可能某一秒就积累到极致了，也不说话，也不真的崩溃，也不太想活，也不敢去死。成年人的发泄方式，已不再是
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

系列之4-单入单出的一层神经网络能做什

创造训练数据

最小二乘法与均方差

定义神经网络结构

定义代价函数

定义针对w和b的梯度函数

求w的梯度

求b的梯度

每次迭代后更新w,b的值

帮助函数

主程序初始化

训练方式的选择

随机梯度下降方式 - SGD

程序主循环

程序运行结果

批量梯度下降方式 - BGD

程序主循环

程序运行结果

小批量梯度下降方式 - MBGD

程序主循环

程序运行结果

三种方式的比较

随机梯度下降

批量梯度下降

小批量梯度下降

你可能感兴趣的:(系列之4-单入单出的一层神经网络能做什)