Sagittarius_Warrior

梯度向量与梯度下降法

最近非常热门的“深度学习”领域，用到了一种名为“梯度下降法”的算法。梯度下降法是机器学习中常用的一种方法，它主要用于快速找到“最小误差”（the minimum error）。要掌握“梯度下降法”，就需要先搞清楚什么是“梯度”，本文将从这些基本概念：方向导数（directional derivative）与偏导数、梯度（gradient）、梯度向量（gradient vector）等出发，带您领略“深度学习”中的“最小二乘法”、“梯度下降法”和“线性回归”。

偏导数（Partial derivate）
方向导数（Directional derivate）
梯度（Gradient）
线性回归（linear regression）
梯度下降（Gradient descent）

一、方向导数

1，偏导数
先回顾一下一元导数和偏导数，一元导数表征的是：一元函数 f(x) 与自变量 x 在某点附近变化的比率（变化率），如下：

f' (x 0) = d f ( x ) d x ∣ x = x 0 = lim Δ x \to 0 f ( x 0 + Δ x ) - f ( x 0 ) Δ x

而二元函数的偏导数表征的是：函数

F(x,y) F ( x , y ) 与自变量

x x （或

y y ）在某点附近变化的比率（变化率），如下：

F x (x 0, y 0) = \partial F \partial x ∣ x = x 0, y = y 0 = lim Δ x \to 0 F ( x 0 + Δ x , y 0 ) - F ( x 0 , y 0 ) Δ x

以长方形的面积

z=F(x,y) z = F ( x , y ) 为例，如下图：

如果说 z=F(x,y)=x⋅y 表示以 P(x,y) 点和原点为对角点的矩形的面积，那么 z=F(x,y) 在 P0 点对x 的偏导数表示 P0 点沿平行于 x 轴正向移动，矩形的面积变化量与 P0 点在 x方向的移动距离的比值

F x (x 0, y 0) = \partial F \partial x = lim Δ x \to 0 Δ S Δ x

同样地，可得

F y (x 0, y 0) = \partial F \partial y = lim Δ y \to 0 Δ S Δ y

需要注意的是：
矩形面积的这个例子有时候也很容易让人混淆，上图中无论 x 还是 y ，都是输入变量，输出变量 S 并没有用坐标轴的形式画出来。也就是说，这个例子实际上是一个三维空间的函数关系，而不是二维平面的函数关系。

向量角度看偏导数：
偏导数向量

[FxFy] [ F x F y ] 是坐标向量（原向量）

[xy] [ x y ] 的线性变换，详见《Essence of linear algebra》：求导是一种线性变换。
扩展一下：如果

P0 P 0 点不是沿平行于 x 轴方向或平行于 y 轴方向，而是 沿与 x 轴成夹角 α 的一条直线 l 上移动，那么面积的增量与

P0 P 0 点在该直线上移动的距离的比值关系是什么呢？
假设

P0 P 0 点在这条直线上移动的距离为

Δt Δ t ，则有

{Δ x = Δ t \cdot c o s α Δ y = Δ t \cdot s i n α

那么，矩形面积增量与移动距离的增量比值是：

lim Δ t \to 0 Δ S Δ t = lim Δ t \to 0 ( x 0 + Δ t \cdot c o s α ) \cdot ( y 0 + Δ t \cdot s i n α ) - x 0 \cdot y 0 Δ t = lim Δ t \to 0 y 0 Δ t \cdot c o s α + x 0 Δ t \cdot s i n α + ( Δ t ) 2 \cdot c o s α \cdot s i n α Δ t = y 0 c o s α + x 0 s i n α

与偏导数类似，上式也是一个“一元导数”。事实上，这就是方向导数，可记作

F l = \partial F \partial l

2，矢量描述
从矢量角度来看，

P0 P 0 点沿与 x 轴成夹角

α α 的一条直线

l l 移动，这个移动方向可以看作是一个矢量 —— “方向矢量”

l ⃗ = (c o s α, s i n α)

如果

α=0 α = 0 ，即沿平行 x 轴方向移动；如果

α=π2 α = π 2 ，即沿平行 y 轴方向移动。因此，偏导数实际上是方向导数的一种特例。
在回顾一下上一节“二元全微分的几何意义”：用切平面近似空间曲面。这个切平面实际上是由两条相交直线确定的平面，而这两条直线分别是 x 方向的偏导数向量

Px→ P x → 和 y 方向的偏导数向量

Py→ P y → 。很显然，这两个向量不但位于同一个平面，而且相互垂直。那么这两个向量合成的新向量也一定位于这个“切平面”。
注：关于偏导数向量相互垂直，可以很容易从偏导数“切片法”推导出来。
将偏导数合成向量记作

P⃗ =(Fx,Fy)=(∂F∂x,∂F∂y) P → = ( F x , F y ) = ( ∂ F ∂ x , ∂ F ∂ y ) 。如果对偏导数向量和方向向量进行矢量“内积”，则有：

P ⃗ \cdot l ⃗ = \partial F \partial x c o s α + \partial F \partial y s i n α = \partial F \partial l

这个内积在数值上刚好等于

l⃗ l → 方向的方向导数。
换句话说：方向导数就是偏导数合成向量与方向向量的内积。

从向量角度看：
内积在几何上表示投影，也就是说，方向导数（向量）是原向量在某个方向上的投影的变化率。

3，多元方向导数
从上面的矢量内积出发，将

l⃗ l → 与 y 轴方向的夹角表示为

β β ，则方向导数的公式可以变化为：

\partial F \partial l = \partial F \partial x c o s α + \partial F \partial y c o s β

类似地，推广到多维空间

\partial F \partial l = \partial F \partial x c o s α 1 + \partial F \partial y c o s α 2 + \partial F \partial z c o s α 3 + \cdot \cdot \cdot

当然，从向量内积的角度更容易得到这个公式

P ⃗ \cdot l ⃗ = (\partial F \partial x, \partial F \partial, \partial F \partial z, \cdot \cdot \cdot) \cdot (c o s α 1, c o s α 2, c o s α 3, \cdot \cdot \cdot)

二、梯度

1，梯度（gradient）
还是从上面的矩形面积这个例子出发，来探索什么是“梯度”。
假设 P0 点的坐标是 (3–√,1) ，则

F x = 1, F y = 3 - \sqrt, F l = c o s α + 3 - \sqrt s i n α

很明显，方向导数（标量）的大小随矢量

l⃗ l → 的方向不同而不同。那么，这些方向导数中是否存在一个最大值呢？
答案是肯定的！这就是“梯度”（标量）。

\nabla F = g r a d F = m a x {\partial F \partial l}

所以，梯度的第一层含义就是“方向导数的最大值”。

2，梯度矢量
梯度的第一层含义是“方向导数的最大值”，那么这个最大值是多少呢？或者说矢量

l⃗ l → 取什么值时才能找到这个最大值？
还是以矩形面积为例

g r a d F (3 - \sqrt, 1) = m a x {\partial F \partial l} = m a x {c o s α + 3 - \sqrt s i n α} = m a x {2 s i n (π 6 + α)}

显然，

α=π3 α = π 3 时，取值最大，此时

l ⃗ = (c o s α, s i n α) = (1 2, 3 - \sqrt 2)

在比较一下偏导数向量

P ⃗ = (F x, F y) = (1, 3 - \sqrt)

是不是似曾相识？对的，后者单位化后就变成了前者。
从向量内积的角度来看，更容易理解：

\nabla F = g r a d F = m a x {\partial F \partial l} = m a x {P ⃗ \cdot l ⃗} = m a x {∣ ∣ P ⃗ ∣ ∣ \cdot ∣ ∣ l ⃗ ∣ ∣ \cdot c o s θ}

很明显，两个向量的夹角

θ=0 θ = 0 时，取得最大值。
至此，我们引出了梯度的第二层含义，或者说叫“梯度矢量”

\nabla F ⃗ = g r a d F = (\partial F \partial x, \partial F \partial y)

注意：
上面提到的夹角

θ θ 在几何上表示原向量（坐标向量）与导数向量（变化率向量）之间的夹角，所以，梯度的几何含义就是：沿向量所在直线的方向变化率最大。

顺便扩展一下散度（divergence）和旋度（curl）的记号，它们都使用了Nabla算子（微分向量算子），分别如下：

\nabla \cdot F ⃗, \nabla \times F ⃗

3，举例
总结一下这一节的思路：偏导数向量合成

→ → 合成向量与方向向量内积

→ → 方向导数

→ → 方向导数的最值

→ → 梯度

→ → 梯度向量与偏导数合成向量相同
转了一圈，又回来了。
从偏导数合成向量到梯度矢量，让我想起了高中物理中的“力的合成与分解”和“沿合力方向做功最有效率”这些物理知识，恰好能与这些数学概念对应上。

如上图，合力表示偏导数合成向量，“垂直分力”表示x方向和y方向的偏导数向量，那么方向向量则对应“做功”路径，而“沿合力方向做功”则表示方向向量与偏导数合成向量重合。Perfect !
注：在重力场或电场中，做功的结果是改变势能，因此，“做功最有效率”又可以表述为“势能变化率最快”。
注：关于梯度（gradient）可以参考以下文章：
https://math.oregonstate.edu/home/programs/undergrad/CalculusQuestStudyGuides/vcalc/grad/grad.html
https://betterexplained.com/articles/vector-calculus-understanding-the-gradient/

三、梯度下降法

1，梯度下降法
梯度下降法（gradient descent）是一个一阶最优化算法，它的核心思想是：要想最快找到一个函数的局部极小值，必须沿函数当前点对应“梯度”（或者近似梯度）的反方向（下降）进行规定步长“迭代”搜索。如下图：

看到上面这幅图，你能想到什么？
我想到了两个概念：一是地理学中的“梯田”和“等高线”，下面的链接中，有一篇文章的作者将“梯度下降”形象的比作“从山顶找路下到山谷”，这么看来，等高线肯定与梯度下降有某种关联。
第二个想到的是电学中的“带电物体的等势面”或者说是“电场等势线”。看一下wiki - potential gradient，可以扩展一下“势能梯度”的知识。
很明显，梯度常常和势能联系在一起，那么势能是什么呢？它就是上图中的弧线圈。这个解释有点虚，给个更贴切的：我们可以把势能看作是 z=f(x,y) 中的这个 z ，即函数值。这些弧线圈就表示在它上面的点 (x,y) 对应的 z=f(x,y) 的值相等。从空间几何的角度来看这些“弧线圈”，更容易理解： z=f(x,y) 表示空间曲面，用 z=c 这样一个平面去截空间曲面，它们的交线就是“弧线圈”，公式表示为

{z = f (x, y) z = c

当然啦，上图是把多个弧线圈画到（投影）了一个平面上。
我们也可以这样来理解“梯度下降法”：导数表征的是“函数值随自变量的变化率”

→ → 梯度是各方向导数中的最大值

→ → 沿 “梯度矢量”移动必定变化最快

→ → 沿“梯度矢量” 反方向下降（减少）最快。

google MLCC - Gradient descent

2，梯度下降法求极值
求下列函数的极小值

f (x) = x 4 - 3 * x 3 + 2 \Rightarrow f' (x) = 4 x 3 - 9 x 2

# From calculation, it is expected that the local minimum occurs at x=9/4

cur_x = 6 # The algorithm starts at x=6
gamma = 0.01 # step size multiplier
precision = 0.00001
previous_step_size = cur_x

def df(x):
    return 4 * x**3 - 9 * x**2

while previous_step_size > precision:
    prev_x = cur_x
    cur_x += -gamma * df(prev_x)
    previous_step_size = abs(cur_x - prev_x)

print("The local minimum occurs at %f" % cur_x)

The local minimum occurs at 2.249965

注：关于“gradient descent”还可以参考以下资料：
https://www.analyticsvidhya.com/blog/2017/03/introduction-to-gradient-descent-algorithm-along-its-variants/
http://ruder.io/optimizing-gradient-descent/

3，梯度下降法与最小二乘法
“机器学习”中有六个经典算法，其中就包括“最小二乘法”和“梯度下降法”，前者用于“搜索最小误差”，后者用于“用最快的速度搜索”，二者常常配合使用。代码演示如下：

# y = mx + b
# m is slope, b is y-intercept
def compute_error_for_line_given_points(b, m, coordinates):
    totalerror = 0
    for i in range(0, len(coordinates)):
        x = coordinates[i][0]
        y = coordinates[i][1]
        totalerror += (y - (m * x + b)) ** 2
    return totalerror / float(len(coordinates))

# example
compute_error_for_line_given_points(1, 2, [[3, 6], [6, 9], [12, 18]])

22.0

以上就是用“最小二乘法”来计算误差，当输入为 (1,2) 时，输出为 22.0

很显然，最小二乘法需要不停地调整（试验）输入来找到一个最小误差。而应用“梯度下降法”，可以加快这个“试验”的过程。
以上面这段程序为例，误差是斜率 m 和常数 b 的二元函数，可以表示为

e = g (m, b)

那么，对最小二乘法的参数调优就转变为了求这个二元函数的极值问题，也就是说可以应用“梯度下降法”了。
“梯度下降法”可以用于搜索函数的局部极值，如下，求下列函数的局部极小值

f (x) = x 5 - 2 x 3 - 2

分析：这是一个一元连续函数，且可导，其导函数是：

f' (x) = 5 x 4 - 6 x 2

根据“一阶导数极值判别法”：若函数f(x)可导，且f’(x)在

x0 x 0 的两侧异号，则

x0 x 0 是f(x)的极值点。那么，怎么找到这个

x0 x 0 呢？
很简单，只需要沿斜率（导数值）的反方向逐步移动即可，如下图：导数为负时，沿x轴正向移动；导数为正时，沿x轴负方向移动。

current_x = 0.5 # the algorithm starts at x=0.5
learning_rate = 0.01 # step size multiplier
num_iterations = 60 # the number of times to train the function

# the derivative of the error function (x ** 4 = the power of 4 or x^4)
def slope_at_given_x_value(x):
    return 5 * x ** 4 - 6 * x ** 2

# Move X to the right or left depending on the slope of the error function
x = [current_x]
for i in range(num_iterations):
    previous_x = current_x
    current_x += -learning_rate * slope_at_given_x_value(previous_x)
    x.append(current_x)   #print(previous_x)

print("The local minimum occurs at %f, it is %f" % (current_x, current_x ** 5 - 2 * current_x ** 3 - 2))

The local minimum occurs at 1.092837, it is -3.051583

import numpy as np
import matplotlib.pyplot as plt
plt.plot(x, marker='*')
plt.show()

沿梯度（斜率）的反方向移动，这就是“梯度下降法”。如上图所示，不管初始化值设为什么，在迭代过程只会越来越接近目标值，而不会偏离目标值，这就是梯度下降法的魅力。
上面这张图是表示的是一个一元函数搜索极值的问题，未必能很好展示梯度下降法的魅力，你再返回去看上面那张“势能梯度图”，那是一个二元函数搜索极值的过程。左边的搜索路径很简洁，而右边的搜索路径，尽管因为初始值的设定，导致它的路径很曲折，但是，你有没有发现，它的每一次迭代事实上离目标都更近一步。我想，这就是梯度下降法的优点吧！
注：这段代码是一元函数求极值，如果是二元函数，则需要同时满足两个分量的偏导数的值为零，下面的线性回归程序算的就是二元偏导数。
通过组合最小二乘法和梯度下降法，你可以得到线性回归，如下：

# Price of wheat/kg and the average price of bread
wheat_and_bread = [[0.5,5],[0.6,5.5],[0.8,6],[1.1,6.8],[1.4,7]]

def step_gradient(b_current, m_current, points, learningRate):
    b_gradient = 0
    m_gradient = 0
    N = float(len(points))
    for i in range(0, len(points)):
        x = points[i][0]
        y = points[i][1]
        b_gradient += -(2/N) * (y -((m_current * x) + b_current))
        m_gradient += -(2/N) * x * (y -((m_current * x) + b_current))
    new_b = b_current -(learningRate * b_gradient)
    new_m = m_current -(learningRate * m_gradient)
    return [new_b, new_m]

def gradient_descent_runner(points, starting_b, starting_m, learning_rate, num_iterations):
    b = starting_b
    m = starting_m
    for i in range(num_iterations):
        b, m = step_gradient(b, m, points, learning_rate)
    return [b, m]

gradient_descent_runner(wheat_and_bread, 1, 1, 0.01, 1000)

[3.853945094921183, 2.4895803107016445]

上面这个程序的核心思想就是：在内层迭代的过程中，算出每一步误差函数相当于 m 和 b 的偏导数（梯度），然后沿梯度的反方向调整 m 和 b ；外层迭代执行梯度下降法，逐步逼近偏导数等于0的点。
其中需要注意偏导数的近似计算公式，已知误差函数

E (m, b) = 1 N \cdot \sum i = 0 N [y i - (m \cdot x i + b)] 2

即各点与拟合直线的距离的平方和，再做算术平均。然后可以计算偏导数为

\partial E \partial m = - 2 N \cdot x i \cdot \sum i = 0 N [y i - (m \cdot x i + b)] \partial E \partial b = - 2 N \cdot \sum i = 0 N [y i - (m \cdot x i + b)]

其中的求和公式在程序中表现为内层for循环
下面再给出拟合后的效果图

import numpy as np
import matplotlib.pyplot as plt
a = np.array(wheat_and_bread)
plt.plot(a[:,0], a[:,1], 'ro')
b,m = gradient_descent_runner(wheat_and_bread, 1, 1, 0.01, 1000)
x = np.linspace(a[0,0], a[-1,0])
y = m * x + b
plt.plot(x, y)
plt.grid()
plt.show()

对比Numpy

import numpy as np
import matplotlib.pyplot as plt
a = np.array(wheat_and_bread)
plt.plot(a[:,0], a[:,1], 'ro')
m, b = np.polyfit(a[:,0], a[:,1], 1)
print([b,m])
x = np.linspace(a[0,0], a[-1,0])
y = m * x + b
plt.plot(x, y)
plt.grid()
plt.show()

[4.1072992700729891, 2.2189781021897814]

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
没想到，真没想到一棵落花的树
生活中，每一件小事都蕴藏着他的道理。有些令你意外，却能让你收到更为意外的结果。那一次，我真没想到的事，让我收获了爱。记忆的雨飘落下来，扰乱了我平静的心湖。那是一次数学考试，我破天荒地考了“99”分。我不禁沾沾自喜，这成绩我可不容易得到，妈妈一定会好好表扬我的。回到家，我想妈妈得意的报出成绩，妈妈只是淡淡的说：“嗯，等会儿试卷拿给我看看。”做完作业，我把试卷拿给了妈妈。只见妈妈捧着试卷，眯着眼睛盯着
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
高级UI<第二十四篇>：Android中用到的矩阵常识 NoBugException
（1）定义在数学中，矩阵（Matrix）是一个按照长方阵列排列的复数或实数集合。由m×n个数aij排成的m行n列的数表称为m行n列的矩阵，简称m×n矩阵。记作：图片.png这m×n个数称为矩阵A的元素，简称为元，数aij位于矩阵A的第i行第j列，称为矩阵A的(i,j)元，以数aij为(i,j)元的矩阵可记为(aij)或(aij)m×n，m×n矩阵A也记作Amn。元素是实数的矩阵称为实矩阵，元素是复
感恩日记Day 236 E姐小酒窝
图片发自App1.感谢16愿意听我"唠叨"，人与人的信任和托付在此刻弥足珍贵珍贵；2.感谢到家就能吃上美味的中餐，辛苦妞爸；3.感谢妞中午愿意听我叼叼旅行中的事儿；4.感谢星巴克就在家附近，让我一杯回魂；5.感谢美妞总结我和爸爸优点并说两者揉和就很棒了。6.感谢看到妞第一天数学成绩后淡定的自己；将责任归回妞自己并总结行动。7.感谢林姐姐信任，又定变啦减脂套餐。8.感谢梅姐知道我旅行回来后约我吃饭；
【高中数学/三角函数/判别式法求极值】已知：实数a,b满足a^2/4-b^2=1 求：3a^2+2ab的最小值普兰店拉马努金高中数学之三角函数高中数学三角函数判别式
【问题】已知：实数a,b满足a^2/4-b^2=1求：3a^2+2ab的最小值【来源】App"网易新闻"中up主“我服子佩”的数学视频专辑，据其称是北京市某年的竞赛题。【解答】由a^2/4-b^2=1，联想到secθ^2-tanθ^2=1故设a/2=1/cosθ,b=sinθ/cosθ将a=2/cosθ,b=sinθ/cosθ代入3a^2+2ab得f(θ)=(12+4sinθ)/(1-sinθ^2
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
2021-10-17(376) 刘玥上学记
今天早上妈妈六点就把我喊起来了，天气太冷了，姥姥给我们煮了鸡蛋，路上保暖用一切按部就班的进行，到公司刚刚好七点五十妈妈给我安排的是上午两张试卷，下午两张试卷上午的没做完，下午的我实在是不想做了，后来凯丽姐姐说早点写完，可以早些玩耍我就回办公室写作业了一直到下午四点半，凯丽姐姐过来检查，数学卷子还没做完询问了半天，原来是乘法口诀没有背过，然后凯丽姐姐就一个一个的给我提问而且还说让我晚上回去自己再重新
2021-10-03 虫虫新生111
今天放假的第3天感觉过得好快，总体来说数学做了25道题，里边有几道题还是弄得不清楚，仍然不懂怎么做，不过整体感觉思路比去年要清晰很多，因为有去年的基础，今年还是比较轻松一些。逻辑做了有几道题，6题，错2，有些概念总的是模糊不清，还是要反复的再整理一下概念，以及回头看一下讲的基础知识，把基础的公式弄懂才可以。现在困了睡觉，明天早点起床。
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
创设问题情境的策略平常心666
创设情境要有情趣案例：可以圈多少地如何让孩子喜欢数学，是数学教师必须思考和解决的问题。有趣的情境会吸引学生，使学生主动走近数学学习。因此，教师要结合学生的年龄特点和实际生活，创造出富有数学情趣的情境。创设情境要有生活案例：克与千克的生活情境正如著名数学家华罗庚所说：“宇宙之大，粒子之微，火箭之速，化工之巧，地球之变，日月之繁，无处不用数学。”数学与现实生活有着密切的联系。创设情境要有问题案例：喝出
丁俊贵之《“女人和男人”那些事》兴时态_198812
【“女人和男人”那些事】生活中，我们经常用性别来给很多现象和问题贴标签。比如：女性发脾气是常见的事情，所以不要跟她们讲道理，要让着她们；女性考虑问题总是比较感性，不如男性那么理性、严谨、全面；女生的数学成绩普遍比较差，因此选文科的女生更多；……许许多多像这样的认知，已经成为我们根深蒂固的信念。我们在生活中哪怕不会直接这样讲，但多多少少都会有类似的想法和感受，并且用这些信念去理解和认知他人。一、人世
MATLAB语言基础教程、小项目1：简单的计算器、小项目2：有页面的计算器、使用App Designer创建GUI计算器 azuredragonz 学习教程 matlab 开发语言
MATLABMATLAB语言基础教程1.MATLAB简介2.基本语法变量与赋值向量与矩阵矩阵运算数学函数控制流3.函数4.绘图案例：简单方程求解小项目1：简单的科学计算器功能代码项目说明小项目2：有页面的计算器使用AppDesigner创建GUI计算器主要步骤：完整代码（使用MATLAB编写）说明：如何运行：小项目总结MATLAB语言基础教程1.MATLAB简介MATLAB（矩阵实验室）是一种用于
搞笑的数学老师鹿悦
今天,陈老师来到了我们班,我们都一脸闷闷不乐的写着家庭作业。陈老师一提到回答问题,我们的脸都快要掉到抽屉里了。"小牛，你来回答一下这道题。"突然，我们班都安静的鸦雀无声，紧接着一阵哄堂大笑的声音在班里回荡着。我们都说陈老师很有意思：史卓听就叫小史，曲子昱就叫小曲，朱宇豪就叫小朱，于恩智就叫小于。至于我呀，陈老师经常叫我小佑或者小张2号。（因为班里有许多姓张的同学）。我们都非常喜欢这个风趣幽默的陈老
希希~嗯嗯~ 猪猪女孩小哒哒
电话铺垫无聊天当天来上课的情况：外婆陪三岁的希希，妈妈陪小的大的上课规则感建立的还算不错，二的满场跑完全坐不住妈妈想找外教早教机构，因为大的在托班，里面会有数学、外教等分支教学课程。老二妈妈没怎么带教二宝。妈妈想给她找语言妈妈问有没有英文我的回答是英文课会有中教，应该回答中外教一起妈妈夸赞宝宝10个月会走了，今天见到的情形是宝宝走几步路就会跌倒，没有联系过爬，就开始走，长大以后模仿别人动作上面做的
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
5/3亲子践行豆果妈
90天打卡累计天数：53/90#宣言（做好当知当觉的父母，处理情绪是第一步）#孩子第一个30天目标：每晚21:45前睡觉家长第一个30天目标：每晚23:00前睡觉加油小宝（黄唯嘉+10岁）践行打卡53/901.早睡早起：22：30-8：302.先吃青蛙：13.️今日闪光点：（1）早晨和爸爸一起去晨跑（2）上午带弟弟，陪弟弟玩了一个上午（3）下午完成了部分作业，还剩数学卷和采访小报#父母教练检视#孩
科普阅读两不误，这才是儿童科普阅读的正确打开方式麦麦安
"孩子数学不好，根源在于语文没学好"，这一观点已经被越来越多的老师和家长接受。虽然阅读理解力看上去只和语文有关，事实上，它是所有学科的根基。比如一道数学应用题，只有正确地看懂了各种条件，才能把答案快速地解出来。在美国的小学教育体系中，很重要的一项任务是帮助儿童进行大量阅读，从而培养出理解及思考的能力。这种说法虽然正确，但很多孩子也会存在这样一个问题：绘本故事类的阅读量不小，看小说听故事几乎可以独立
洛谷P1719 最大加权矩形 0hang 算法 c++开发语言
洛谷P1719最大加权矩形题目描述为了更好的备战NOIP2013，电脑组的几个女孩子LYQ,ZSC,ZHQ认为，我们不光需要机房，我们还需要运动，于是就决定找校长申请一块电脑组的课余运动场地，听说她们都是电脑组的高手，校长没有马上答应他们，而是先给她们出了一道数学题，并且告诉她们：你们能获得的运动场地的面积就是你们能找到的这个最大的数字。校长先给他们一个n\timesnn×n矩阵。要求矩阵中最大加
Tor Browser配置方法淡水猫. 网络安全服务器
密码学中有两种常见的加密方式：对称加密：加密和解密使用同一个秘钥，如AES、DES等算法。非对称加密：加密和解密使用不相同的密钥，这两个秘钥分别称为公钥（publickey）和私钥（privatekey）——也就是说私钥可以解开公钥加密的数据，反之亦然（很神奇的数学原理）。Tor是一个三重代理（也就是说Tor每发出一个请求会先经过Tor网络的3个节点），其网络中有两种主要服务器角色：中继服务器：负
晚托第34天唐锐_32c4
2019-04-06本来担心优的抄写的作业不能及时完成，今天一来看到她写的作业后我放心多了。英语抄写的是满满的6面，说明你在老家期间没有耽误学习，自觉性有了提高。以后在学校期间不能吃外面小摊子的东西，防止有害细菌进入体内。杨今天表现的一般，数学计算能手只刷了3面，就开始骄傲，当我告诉你别人已经刷上几十面时你目瞪口呆。所以，以后一定要谦虚谨慎，人外有人，天外有天，始终有强悍的孩子远远超过你，你要做的
第一次参加女儿的家长会章章2021
说来惭愧，从幼儿园到现在，第一次去参加女儿的家长会。老师们说了一下每个孩子在学校的表现。女儿被两位老师表扬语文老师:作业完成很好，错了及时订正，上课积极发言。数学老师:非常爱思考，责任感很强，爱卫生。回来把老师的表扬一五一十的传达给女儿，甚至有些地方还添油加醋了，哈哈。女儿上小学以来，基本没有操过什么心，作业，阅读，基本都能独立完成。平时聊天会强调班集体，也会多说老师的好话。女儿酷爱漫画书和绘本，
架构师备考的一些思考（四） kiba518
前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科，专科都一样，都是一张白纸，啥也不会。案例分析案例分析是5选3，第一题必答。问题一的类型架构风格对比问题二的类型质量属性填写问题三的类型ER图分析问题类型四场景分析，此类型题比较多。案例分析主要是结合我们之前介绍的内容和自身的经
中考数学想考满分？必须刷完这60道经典压轴题！（高清打印版）孔文教育QD
孔文教育启东校区距离中考还有30多天的时间，如果平常数学可以考100分左右的同学，就可以重视一下压轴题的提升，老师整理了60道压轴题，包括了考点解析等内容，可以做起来哦！孩子升入初中之后，学习压力逐渐增加，孩子的学习能力以及适应环境的能力决定孩子能够分到哪个层次。中考决定孩子进入普通高中还是职业高中，这是个很现实的问题，经数据研究，中考的普职分流比为1:1，换言之，假设有100个考生，其中就有50
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

梯度向量与梯度下降法

一、方向导数

二、梯度

三、梯度下降法

你可能感兴趣的:(数学)