wzg2016

深度学习中常用的学习率衰减策略及tensorflow实现

引言

（1）分段常数衰减

（2）指数衰减

（3）自然指数衰减

（4）多项式衰减

（5）余弦衰减

（6）线性余弦衰减

（7）噪声线性余弦衰减

（8）倒数衰减

引言

学习率（learning rate,lr）是在神经网络的训练过程中一个很重要的超参数，对神经网络的训练效果与训练时间成本有很大影响。

学习率对训练效果的影响（主要体现在对网络的有效容量/参数搜索空间的影响上）：

学习率过大：导致参数更新步幅过大，迈过了很多候选参数，有可能会越过最优值。因此，从这个意义上讲，过大的学习率会降低模型的有效容量，缩小了神经网络的参数搜索空间。
学习率过小：因为神经网络的优化是一个非凸过程，损失函数曲线/超平面上存在许多局部极小值，鞍点，平滑点等。过小的学习率容易导致参数搜索过程中，使网络参数停留在一个很高的局部极小值上，不能继续搜索更好的、更偏向于全局的局部极小值。从这个意义上讲，学习率过小也会降低模型的有效容量。

学习率对训练时间成本的影响：

学习率过大，会导致参数优化过程中损失函数值震荡（或，在最终的极优值两侧来回摆动），导致网络不能收敛。
学习率过小，除了会导致训练速度慢以外，还容易导致模型停留在一个训练误差很高的局部极小值上，不利于寻找一个更低的（或更偏向于全局的）局部极小值。

在神经网络的训练过程中，常采用的一个策略就是使用学习率更新策略，使学习率随着模型训练的迭代次数逐渐衰减，这样既可以兼顾学习效率又能兼顾后期学习的稳定性：前期通过大学习率快速搜索，找到一个较好的（更倾向于全局最小的）局部区域，后期用较小的学习率在这个局部区域进行收敛。

主要的学习率更新策略有以下几种：

分段常数衰减
指数衰减
自然指数衰减
多项式衰减
余弦衰减
倒数衰减

tensorflow中的学习率衰减方法有：

tf.train.piecewise_constant　分段常数衰减
tf.train.exponential_decay　指数衰减
tf.train.natural_exp_decay　自然指数衰减
tf.train.polynomial_decay　多项式衰减
tf.train.cosine_decay　余弦衰减
tf.train.linear_cosine_decay　线性余弦衰减
tf.train.noisy_linear_cosine_decay　噪声线性余弦衰减
tf.train.inverse_time_decay　倒数衰减
函数返回衰减的学习率

（1）分段常数衰减

分段常数衰减是通过人工指定，在某个迭代区间使用某个学习率。一般是初始学习率较高，后面随着迭代次数增加逐渐降低。

tensorflow中的函数介绍

tf.train.piecewise_constant(
    x,          # 标量，global_step，当前的迭代次数，
    boundaries, # 列表，更换学习率的迭代次数边界，如[40000,80000]
    values,     # 学习率列表，values的长度比boundaries的长度多一个,如[1e-3,1e-4,1e-5]
    name=None   # 
)
"""
如果按照以上的示例，模型训练时的学习率变化表现是：

当globalstep<40000时，lr=1e-3,
当40000

 
  使用示例： 
  #!/usr/bin/python
# coding:utf-8
 
# piecewise_constant 阶梯式下降法
import matplotlib.pyplot as plt
import tensorflow as tf
global_step = tf.Variable(0, name='global_step', trainable=False)
boundaries = [10, 20, 30]
learing_rates = [0.1, 0.07, 0.025, 0.0125]
y = []
N = 40
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for global_step in range(N):
        learing_rate = tf.train.piecewise_constant(global_step, boundaries=boundaries, values=learing_rates)
        lr = sess.run([learing_rate])
        y.append(lr[0])
 
x = range(N)
plt.plot(x, y, 'r-', linewidth=2)
plt.title('piecewise_constant')
plt.show() 
  学习率曲线示意图： 
   
  （2）指数衰减 
  人工设定衰减系数，使训练过程每经历decay_steps次迭代，学习率都乘以一个衰减系数decay_rate，从而达到学习率指数下降的目的。 
  衰减公式： 
   
    
   
  tensorflow中的函数介绍：  
  tf.train.exponential_decay(
    learning_rate, # 初始学习率
    global_step,   # 当前训练迭代的次数
    decay_steps,   # 定义衰减周期，跟参数staircase配合，可以在decay_step个训练轮次内保持学习率不变
    decay_rate,    # 衰减率系数
    staircase=False, # 定义是否是阶梯型衰减，还是连续衰减，默认是False，即连续衰减（标准的指数型衰减）
    name=None
)
"""
当starecase=False时，相当于默认decay_steps=1，没执行一次迭代，就执行一次指数衰减。

个人认为设置starecase=True较好，因为指数下降实在是太快，每迭代一次就执行一次衰减的话学习率下降太快了。
""" 
  使用示例： 
  #!/usr/bin/python
# coding:utf-8
import matplotlib.pyplot as plt
import tensorflow as tf
global_step = tf.Variable(0, name='global_step', trainable=False)
 
y = []
z = []
N = 200
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for global_step in range(N):
        # 阶梯型衰减
        learing_rate1 = tf.train.exponential_decay(
            learning_rate=0.5, global_step=global_step, decay_steps=10, decay_rate=0.9, staircase=True)
        # 标准指数型衰减
        learing_rate2 = tf.train.exponential_decay(
            learning_rate=0.5, global_step=global_step, decay_steps=10, decay_rate=0.9, staircase=False)
        lr1 = sess.run([learing_rate1])
        lr2 = sess.run([learing_rate2])
        y.append(lr1[0])
        z.append(lr2[0])
 
x = range(N)
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set_ylim([0, 0.55])
plt.plot(x, y, 'r-', linewidth=2)
plt.plot(x, z, 'g-', linewidth=2)
plt.title('exponential_decay')
ax.set_xlabel('step')
ax.set_ylabel('learing rate')
plt.show() 
  学习率变化曲线如下图所示， 
  图中红线表示starecase=True,绿线表示starecase=False 
   
  （3）自然指数衰减 
  自然指数衰减是指数衰减的一种特殊情况，学习率也是跟当前的训练轮次指数相关，只不过以 e 为底数。 
  衰减公式： 
   
    
   
  tensorflow中的函数介绍：  
  tf.train.natural_exp_decay(
    learning_rate,    # 初始学习率
    global_step,      # 全局迭代次数
    decay_steps,      # 每隔decay_steps执行一次学习率指数衰减
    decay_rate,       # 标量。衰减系数
    staircase=False,  # 是否执行阶梯式衰减，默认是False，即连续衰减
    name=None
) 
  使用示例：  
  # coding:utf-8
 
import matplotlib.pyplot as plt
import tensorflow as tf
 
num_epoch = tf.Variable(0, name='global_step', trainable=False)
 
y = []
z = []
w = []
m = []
N = 200
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for num_epoch in range(N):
 
        # 阶梯型衰减
        learing_rate1 = tf.train.natural_exp_decay(
            learning_rate=0.5, global_step=num_epoch, decay_steps=10, decay_rate=0.9, staircase=True)
 
        # 标准指数型衰减
        learing_rate2 = tf.train.natural_exp_decay(
            learning_rate=0.5, global_step=num_epoch, decay_steps=10, decay_rate=0.9, staircase=False)
 
        # 阶梯型指数衰减
        learing_rate3 = tf.train.exponential_decay(
            learning_rate=0.5, global_step=num_epoch, decay_steps=10, decay_rate=0.9, staircase=True)
 
        # 标准指数衰减
        learing_rate4 = tf.train.exponential_decay(
            learning_rate=0.5, global_step=num_epoch, decay_steps=10, decay_rate=0.9, staircase=False)
 
        lr1 = sess.run([learing_rate1])
        lr2 = sess.run([learing_rate2])
        lr3 = sess.run([learing_rate3])
        lr4 = sess.run([learing_rate4])
 
        y.append(lr1)
        z.append(lr2)
        w.append(lr3)
        m.append(lr4)
 
x = range(N)
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set_ylim([0, 0.55])
 
plt.plot(x, y, 'r-', linewidth=2)
plt.plot(x, z, 'g-', linewidth=2)
plt.plot(x, w, 'r-', linewidth=2)
plt.plot(x, m, 'g-', linewidth=2)
 
plt.title('natural_exp_decay')
ax.set_xlabel('step')
ax.set_ylabel('learing rate')
plt.show() 
  学习率曲线示意图： 
  左下部分的两条曲线是自然指数衰减，右上部分的两条曲线是指数衰减，可见自然指数衰减对学习率的衰减程度要远大于一般的指数衰减，一般用于可以较快收敛的网络，或者是训练数据集比较大的场合。 
   
  （4）多项式衰减  
  多项式衰减是这样一种衰减机制：定义一个初始的学习率，一个最低的学习率。学习率从初始学习率逐渐降低到最低的学习率。当降低到最低学习率后，可以根据参数cycle=True/False设置，选择（1）False,一直保持使用最低学习率，（2）True，把学习率从最低学习率再上升到一个新的较高学习率，再次执行衰减，并循环往复，形成一个反复的升降过程。 
  衰减公式： 
  当cycle=False时，学习率计算公式如下： 
   
   _global_step_ = min(global_step, decay_steps)
 decayed_learning_rate =  (learning_rate - end_learning_rate) *(1 - _global_step_ / decay_steps) ^ (power)              
                                              + end_learning_rate 
   公式理解：由公式可见，当global_step>decay_steps时， _global_step_=decay_steps，==》0的任何次幂等于0 
                                            ==》decayed_learning_rate=end_learning_rate 
   
  当cycle=True时，学习率计算公式如下： 
   
   _decay_steps_ = decay_steps * ceil(global_step / decay_steps)                   # ceil表示向上取整
 decayed_learning_rate =  (learning_rate - end_learning_rate) *(1 - global_step / _decay_steps_) ^ (power)              
                                              + end_learning_rate 
   公式理解：由公式可见，随着global_step逐渐增大，_decay_steps_也周期性的增大。 
                     当 global_step > decay_steps 时，global_step / _decay_steps_ 始终大于等于0，小于1，周期性的由小变大。 
                    从而 (1 - global_step / _decay_steps_) 周期性的由大变小，decayed_learning_rate也周期性的由大变小。 
                    当global_step恰好是decay_steps的倍数时，(1 - global_step / _decay_steps_)=0，                  
                                                                                          decayed_learning_rate = learning_rate 
   
  tensorflow中的函数介绍：   
  tf.train.polynomial_decay(
    learning_rate, # 标量，初始学习率,如0.1
    global_step,   # 标量，训练的迭代次数
    decay_steps,   # 
    end_learning_rate=0.0001, # 标量，最小的终止学习率
    power=1.0, # 多项式指数，默认是线性的，取值为1
    cycle=False, # bool变量，当超过decay_steps后是否循环执行
    name=None
) 
  使用示例： 
  # coding:utf-8
import matplotlib.pyplot as plt
import tensorflow as tf
 
y = []
z = []
N = 200
 
global_step = tf.Variable(0, name='global_step', trainable=False)
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for global_step in range(N):
        # cycle=False
        learing_rate1 = tf.train.polynomial_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=50,
            end_learning_rate=0.01, power=0.5, cycle=False)
        # cycle=True
        learing_rate2 = tf.train.polynomial_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=50,
            end_learning_rate=0.01, power=0.5, cycle=True)
 
        lr1 = sess.run([learing_rate1])
        lr2 = sess.run([learing_rate2])
        y.append(lr1)
        z.append(lr2)
 
x = range(N)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x, z, 'g-', linewidth=2)
plt.plot(x, y, 'r--', linewidth=2)
plt.title('polynomial_decay')
ax.set_xlabel('step')
ax.set_ylabel('learing rate')
plt.show() 
  学习率变化曲线如下图所示： 
   
   红线表示cycle=False,当迭代次数超过 decay_steps后，保持end_learning_rate不再改变 
   绿线表示cycle=True,当迭代次数超过decay_steps后，学习率从end_learning_rate上升到一个数值后，再次执行衰减。 
   多项式衰减中设置学习率可以往复升降的目的是为了防止神经网络后期训练的学习率过小，导致网络参数陷入某个局部最优解出不来，设置学习率升高机制，有可能使网络跳出局部最优解。 
   
   
  （5）余弦衰减  
  余弦衰减的衰减机制跟余弦函数相关，形状也大体上是余弦形状。 
  计算公式如下： 
   
   _global_step_ = min(global_step, decay_steps) 
   cosine_decay = 0.5 * (1 + cos(pi * _global_step_ / decay_steps))  
   decayed = (1 - alpha) * cosine_decay + alpha 
   decayed_learning_rate = learning_rate * decayed 
   公式解释：在cosine_decay表达式中，cos部分从cos(0)逐渐降低增加到cos(pi)后保持不变，导致cosine_decay从1沿余弦函数曲线下降到0后维持不变，主要体现为学习率的平滑变化 
   
  tensorflow中的函数介绍：   
  tf.train.cosine_decay(
    learning_rate, # 初始学习率
    global_step,   # 全局迭代次数
    decay_steps,   # 衰减步数，即从初始学习率衰减到最低学习率时的迭代次数
    alpha=0.0,     # 
    name=None
)
 
  （6）线性余弦衰减 
  计算公式 
   
   global_step = min(global_step, decay_steps)
linear_decay = (decay_steps - global_step) / decay_steps)
cosine_decay = 0.5 * (1 + cos(pi * 2 * num_periods * global_step / decay_steps))
decayed = (alpha + linear_decay) * cosine_decay + beta
decayed_learning_rate = learning_rate * decayed
 
   
   tensorflow中的函数介绍：  
  tf.train.linear_cosine_decay(
    learning_rate,   #  The initial learning rate.
    global_step,     #  Global step to use for the decay computation.
    decay_steps,     #  Number of steps to decay over.
    num_periods=0.5, #  Number of periods in the cosine part of the decay.
    alpha=0.0,
    beta=0.001,
    name=None
) 
  （7）噪声线性余弦衰减 
  计算公式： 
   
   _global_step_ = min(global_step, decay_steps)
linear_decay = (decay_steps - _global_step_) / decay_steps)
cosine_decay = 0.5 * (1 + cos(pi * 2 * num_periods * _global_step_ / decay_steps))
decayed = (alpha + linear_decay + eps_t) * cosine_decay + beta
decayed_learning_rate = learning_rate * decayed
 
   
  tensorflow中的函数介绍：   
  tf.train.noisy_linear_cosine_decay(
    learning_rate, # The initial learning rate.
    global_step,   # Global step to use for the decay computation.
    decay_steps,   # Number of steps to decay over.
    initial_variance=1.0,  # initial variance for the noise. 
    variance_decay=0.55,   # decay for the noise's variance. See computation above.
    num_periods=0.5,       # Number of periods in the cosine part of the decay. 
    alpha=0.0,
    beta=0.001,
    name=None
) 
  三种余弦衰减函数的使用示例： 
  # coding:utf-8
import matplotlib.pyplot as plt
import tensorflow as tf
 
y = []
z = []
w = []
N = 200
global_step = tf.Variable(0, name='global_step', trainable=False)
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for global_step in range(N):
        # 余弦衰减
        learing_rate1 = tf.train.cosine_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=50)
        
        # 线性余弦衰减
        learing_rate2 = tf.train.linear_cosine_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=50,
            num_periods=0.2, alpha=0.5, beta=0.2)
        
        # 噪声线性余弦衰减
        learing_rate3 = tf.train.noisy_linear_cosine_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=50,
            initial_variance=0.01, variance_decay=0.1, num_periods=0.2, alpha=0.5, beta=0.2)
        
        lr1 = sess.run([learing_rate1])
        lr2 = sess.run([learing_rate2])
        lr3 = sess.run([learing_rate3])
        y.append(lr1)
        z.append(lr2)
        w.append(lr3)
 
x = range(N)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x, z, 'b-', linewidth=2)
plt.plot(x, y, 'r-', linewidth=2)
plt.plot(x, w, 'g-', linewidth=2)
plt.title('cosine_decay')
ax.set_xlabel('step')
ax.set_ylabel('learing rate')
plt.show() 
  三种余弦衰减的学习率曲线如下图所示： 
   
   红色标准余弦衰减（tf.train.cosine_decay()），学习率从初始曲线过渡到最低学习率;  
   蓝色线性余弦衰减（tf.train.linear_cosine_decay()），学习率从初始线性过渡到最低学习率;  
   绿色噪声线性余弦衰减（tf.train.noisy_linear_cosine_decay()），在线性余弦衰减基础上增加了随机噪声;   
   
   
  （8）倒数衰减 
  倒数衰减指的是一个变量的大小与另一个变量的大小成反比的关系，具体到神经网络中就是学习率的大小跟训练次数有一定的反比关系。 
  计算公式： 
   
   decayed_learning_rate =learning_rate/(1+decay_rate* global_step/decay_step) 
   
  tensorflow中的函数介绍：  
  
tf.train.inverse_time_decay(
    learning_rate,  # 初始学习率
    global_step,    # 用于衰减计算的全局步数
    decay_steps,    # 衰减步数
    decay_rate,     # 衰减率
    staircase=False,  # 是否应用离散阶梯型衰减（否则为连续型）
    name=None
) 
  使用示例： 
  #!/usr/bin/python
# coding:utf-8
 
import matplotlib.pyplot as plt
import tensorflow as tf
y = []
z = []
N = 200
global_step = tf.Variable(0, name='global_step', trainable=False)
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for global_step in range(N):
        # 阶梯型衰减
        learing_rate1 = tf.train.inverse_time_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=20,
            decay_rate=0.2, staircase=True)
        # 连续型衰减
        learing_rate2 = tf.train.inverse_time_decay(
            learning_rate=0.1, global_step=global_step, decay_steps=20,
            decay_rate=0.2, staircase=False)
        lr1 = sess.run([learing_rate1])
        lr2 = sess.run([learing_rate2])
 
        y.append(lr1[0])
        z.append(lr2[0])
 
x = range(N)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(x, z, 'r-', linewidth=2)
plt.plot(x, y, 'g-', linewidth=2)
plt.title('inverse_time_decay')
ax.set_xlabel('step')
ax.set_ylabel('learing rate')
plt.show() 
  学习率变化曲线示意图：  
   
  倒数衰减不固定最小学习率，迭代次数越多，学习率越小。 
  参考： 学习率衰减方法  
              tensorflow中常用学习率更新策略

Ollama 基本概念 Mr_One_Zhang 学习Ollama ai
Ollama是一个本地化的、支持多种自然语言处理（NLP）任务的机器学习框架，专注于模型加载、推理和生成任务。通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。它们是经过预训练的机器学习模型，能够执行不同的任务，例如文本生成、文本摘要、情感分析、对话生成等。Ollama支持多种流行的预训练模型，常见的模型有：deepse
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
【动手学深度学习】#1PyTorch基础操作 -一杯为品- 机器学习深度学习人工智能
主要参考学习资料：《动手学深度学习》阿斯顿·张等著【动手学深度学习PyTorch版】哔哩哔哩@跟李牧学AI目录1.1数据操作1.1.1入门1.1.2运算符1.1.3广播机制1.1.4索引和切片1.1.5节省内存1.1.6转换为其他Python对象1.2数据预处理1.2.1读取数据集1.2.2处理缺失值1.2.3转换为张量格式1.3线性代数1.3.1标量1.3.2向量1.3.3矩阵1.3.4张量1.
基于发明的电容电感的新型热力梯度耦合电容电感lc谐振储能可行性热爱电气数学建模
热梯度双层LC谐振储能结构可行性分析设计一种结合热力梯度、电容层（C层）、电感层（L层）及中间耦合层的双层LC谐振储能系统，需从物理原理、材料选择、热管理、能量耦合效率等方面进行综合评估。以下是详细分析：1.设计原理与理论模型（1）结构示意图[高温区]┌───────────────┐│电容层（C层）│→温度梯度ΔT├───────────────┤│热-电耦合层│→热传导/电磁耦合├──────
Netty基础—6.Netty实现RPC服务三东阳马生架构 Netty应用与源码 Netty RPC服务
大纲1.RPC的相关概念2.RPC服务调用端动态代理实现3.Netty客户端之RPC远程调用过程分析4.RPC网络通信中的编码解码器5.Netty服务端之RPC服务提供端的处理6.RPC服务调用端实现超时功能5.Netty服务端之RPC服务提供端的处理(1)RPC服务提供端NettyServer(2)基于反射调用请求对象的目标方法(1)RPC服务提供端NettyRpcServerpubliccla
moonligh串流教程以及3大问题解决 kalada82 win10电脑常见问题解决方案职场和发展小程序
首先说明，ml和steamlink我不是高下评判，大家自己喜欢用那个就行。ml可以关笔记本屏幕用，不用打开steam手动，我喜欢，还能当远程桌面问题；1软件下载，网上找的，随便用就是了2软件使用，开启gefoce的sheld功能·，把软件串流进去3ml使用闪屏，应为串流打开的屏幕是集显，就会这样，就要屏幕独显直连。台式连接一个外接显示器就行，笔记本买个hdmi欺骗器就行4设置hdmi的分辨率，设置
增加对路由参数的支持智想天开 php代码架构 android php
原文地址:增加对路由参数的支持更多内容请关注：智想天开理解路由参数路由参数允许在URL中捕获动态值，并将这些值传递给控制器的方法。例如：/user/123：捕获用户ID123。/post/45/comment/67：捕获帖子ID45和评论ID67。实现路由参数的关键在于：定义带参数的路由模式：使用特定的语法（如{id}）来标识动态部分。解析请求URI：匹配请求URI与路由模式，并提取参数值。传递参
38份DeepSeek核心资料汇总｜可下载航锦234 人工智能 pdf
资料链接：https://pan.quark.cn/s/b469ed4018ff为了方便大家查找和使用，我们对之前发布过的DeepSeek系列学习资料进行了分类和汇总。内容包括但不限于清北浙DeepSeek课件资料汇总manus学习资料DeepSeek实操变现指南DeepSeek本地部署教学等等点击最上方链接即可保存下载～
前端数据模拟利器 Mock.js 深度解析 2501_91133317 前端 javascript 开发语言
写在前面：宝，我手里有个长期项目，考虑接私活的可以看看我GitHub！https://github.com/ccy-233/coder2retire前端数据模拟利器Mock.js深度解析一、Mock.js核心价值1.1为何需要数据模拟前后端并行开发加速接口文档驱动开发异常场景模拟测试演示环境数据构造1.2Mock.js核心能力//典型数据生成示例Mock.mock('/api/user',{"us
为什么转行大模型行业？深度解析职业变革与技术红利大模型入门教程大模型学习语言模型人工智能 AI 大模型程序员大模型入门
引言2023年ChatGPT的爆发式发展，标志着AI大模型技术正式进入大众视野。这一技术不仅重塑了人工智能的边界，更催生了全新的职业赛道。从传统算法工程师到互联网从业者，越来越多的人开始将目光投向大模型领域。本文将深入探讨这一现象背后的核心动因，并结合行业现状、技术趋势与职业发展路径，为从业者提供系统性分析。一、行业变革：传统岗位萎缩与大模型崛起传统技术岗位的困境以推荐算法为例，随着移动互联网流量
IPC Kit基础入门：理解HarmonyOS的进程间通信架构 SameX-4869 harmonyos 架构华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在HarmonyOS应用开发中，进程间通信（IPC）是构建复杂应用架构的关键要素。IPCKit为开发者提供了强大的进程间通信能力，使不同进程之间能够高
【数据结构】栈和队列加油，旭杏数据结构 java 开发语言
一、栈1.1栈的概念以及结构栈：一种特殊的线性表，其只允许在固定的一端进行插入和删除元素的操作，进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守后进先出的原则。压栈：栈的插入操作叫做进栈/压栈/入栈，入数据在栈顶出栈：栈的删除操作叫做出栈，出数据在栈顶1.2栈的实现栈的实现一般可以使用数组或者链表实现，相对而言数组的结构实现更加优一些，因为数组在尾上插入数据的代价比较小。二
Java Stream 去重的多种方法坎布里奇 java java python 开发语言
在JavaStream中实现去重有多种方法，具体取决于需求和场景。以下是常见的几种方法及示例：1.使用distinct()方法适用于对象已正确实现equals()和hashCode()，基于对象整体去重并保留顺序：ListuniquePersons=persons.stream().distinct().collect(Collectors.toList());2.根据对象的属性去重方法一：使用C
HarmonyOS NEXT开发笔记：@Computed装饰器计算属性我很英俊小名男男 OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 华为开发语言前端鸿蒙移动开发鸿蒙系统
鸿蒙开发往期必看：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）
算法学习之路——贪心算法蒋楠鑫算法算法贪心算法
文章目录一、前言二、什么是算法三、什么是贪心算法1.含义2.基本思路3.适用场景四、代码实现五、经典例题分析六、总结一、前言先来看一道简单的数学问题：小明有30元钱，每瓶酒要5元钱，每3个空瓶子可以换1瓶酒，请问小明最多可以喝到多少瓶酒？这道题目显然是一道求最优解的问题，由于数据量小我们可以用最简单最直接的枚举法来解决，但是如果将题目泛化一下呢：小明现在购买了m瓶酒，每n个空瓶子可以换1瓶酒，请问
PySpark安装及WordCount实现（基于Ubuntu） uui1885478445 ubuntu linux 运维
在Ubuntu上安装PySpark并实现WordCount，需要以下步骤：安装PySpark：安装Java：PySpark需要Java运行环境。你可以使用以下命令安装OpenJDK：sudoaptupdatesudoaptinstalldefault-jredefault-jdk安装Scala：PySpark还需要Scala，可以使用以下命令安装：sudoaptinstallscala安装Pyth
Mybatis传递多个不同类型的参数我的身前一尺是我的世界 Mybatis传递多个参数
一、同时传递List和String实现类@OverridepublicListfun(StringshopId,Listlist){Mapmap=newHashMap();map.put("shopId",shopId);map.put("list",list);ListlistCommodity=appCommodityMapper.fun(map);returnlistCommodity;}m
地理数据中的分辨率转换木叶清风666 地理信息数据处理 matlab python 开发语言
数据分辨率问题气象海洋数据在实际应用中，常常涉及到重采样，即分辨率的提高或降低等操作。本文提供了matlab以及python的样例程序，以降低（网格平均）或提高（线性插值）数据的分辨率。1.高分辨率——>低分辨率可以使用循环逐个网格进行操作,但循环次数过多,存在效率低下的问题。%---需要的分辨率0.25°,以及经纬度网格点deg=0.25;lat_era=16:deg:47.75;lon_era
学习SpringBoot过程中常见问题汇总及多工程项目使用 IntelliJ IDEA 打开 KunQian_smile springBoot
一：SpringBoot:redisClientine.test.serviceImpl.RedisServiceImplrequiredabeanoftype‘com.examp1:没有自动注入导致。service类上面没有@service注解或者mapper上没有@Repository注解，但是这种情况比较少见，一般不会忘记。2:配置了mybatis，但没有指定扫描的包。（1）直接在生成出来的
Spring Data JDBC 详解 m0_74823933 面试学习路线阿里巴巴 spring java 数据库
目录一、JPA背景?二、SpringBoot整合SpringdataJDBC??1.配置数据源?2.配置Druid的admin后台??3.Spring-data-jdbc常用接口查询策略1)?CrudRepository增删改查2)PagingAndSortingRepository分页排序一、JPA背景早期的JPA的特性是懒加载和关联查询，一下能查出所有的关联信息，但我们开发者在查询SQL的时候
SpringBoot中Server层以及Mapper层常用注解 π大星的日常 java java-rabbitmq
最近看了一下SpringBoot2的课程，发现好多的注解并不是很了解，只是简单的会用，但是真是发生的作用却不知道，最近花了一些时间把这些注解进行了一下整理，针对不同的层级进行了细致的划分，最近几天会依次给大家更新关于注解的内容，对大家有帮助的话点赞支持一下哦！4.Service层注解@Service注解一般写在业务层的接口实现类上，而不是接口上。4.1@Service@Service:@Servi
HarmonyOS NEXT开发实战：Navigation页面跳转对象传递案例一晃有一秋鸿蒙实例鸿蒙 harmonyos 华为鸿蒙鸿蒙系统 android
介绍本示例主要介绍在使用Navigation实现页面跳转时，如何在跳转页面得到转入页面传的类对象的方法。实现过程中使用了第三方插件class-transformer，传递对象经过该插件的plainToClass方法转换后可以直接调用对象的方法，效果图预览使用说明从首页进入本页面时，会传递一个类对象UserBookingInfo。点击“换个座位”按钮会调用该类对象的generateRandSeatN
HarmonyOS NEXT开发实战：视频全屏切换案例一晃有一秋鸿蒙鸿蒙实例 harmonyos 华为鸿蒙鸿蒙系统 android 音视频
介绍本示例介绍了@ohos.multimedia.media组件和@ohos.window接口实现媒体全屏的功能。该场景多用于首页瀑布流媒体播放等。效果图预览使用说明：点击全屏按钮，横屏媒体窗口。点击恢复窗口按钮，恢复媒体窗口。实现步骤初始化@ohos.multimedia.media的AVPlayer。asyncInit():Promise{awaitthis.release();constco
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
[QMT量化交易小白入门]-二十二、deepseek+cline+vscode,让小白使用miniQMT量化交易成为可能 python自动化工具 QMT量化交易小白入门 vscode ide 编辑器
本专栏主要是介绍QMT的基础用法，常见函数，写策略的方法，也会分享一些量化交易的思路，大概会写100篇左右。QMT的相关资料较少，在使用过程中不断的摸索，遇到了一些问题，记录下来和大家一起沟通，共同进步，自己淋过雨了，希望大家都有一把伞。文章目录相关阅读DeepSeek新用户注册cline集成指令测试相关阅读小白也能做量化：零门槛QMT、Ptrade免费送量化交易入门：如何在QMT中配置Pytho
Storyboard 之segue用法总结月未央 iOS学习总结 iOS
Storyboard的好玩之处在于它可以帮我们省略了很多要手动写的代码，其中segue的功劳功不可没，现总结一下学习心得，若有错误之处，望指正。创建工程，选择SingleViewApplication，给工程起个名字，这里是SegueDemo，注意要把下面的UseStoryboard选项勾选上，我使用ARC，这里可以随意。点选工程文件中的MainStoryboard.storyboard文件，可以
一个简单的语音识别实现---百度在线语音识别REST API SDK（Python）简单使用 DerrickOzil 语音识别 python sdk 语音识别
百度在线语音识别RESTAPISDK（Python）简单使用首先申请开发者权限注册开发者信息完成注册创建新应用下载SDK并查看key在应用管理中，选择查看key，记录AppID、APIKey、SecretKey三个参数值。测试音频链接：http://pan.baidu.com/s/1o8Ue4B4密码：o5r1]注意事项音频格式限制pcm（不压缩）、wav、amr采样频率及位数支持评测8k/16k
人工智能直通车系列24【机器学习基础】（机器学习模型评估指标（回归））浪九天人工智能直通车开发语言 python 机器学习深度学习神经网络人工智能
目录机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）2.均方根误差（RootMeanSquaredError,RMSE）3.平均绝对误差（MeanAbsoluteError,MAE）4.决定系数（CoefficientofDetermination,R2）机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）详细解释均方误差是回归问
python_学习爬虫遇到的第一个问题_urllib获取baidu首页源代码 KJDETL python_爬虫 python 学习爬虫
第一天学习爬虫，学习的是urllib的基本用法，通过urllib.request获取baidu首页源代码。#导入urllib所需要的库importurllib.request#左边自定义名称，右边是要访问的地址url='https://www.baidu.com/Index.htm'#左边自定义名称可以叫做响应，右边是通过urllib.request.urlopen方法向url发出请求respon
VUE前端实现防抖节流 Lodash 2501_91133275 前端 vue.js javascript
写在前面：兄弟们，我手里有个长期项目，考虑接私活的可以看看我GitHub！https://github.com/ccy-233/coder2retire方法一：采用Lodash工具库Lodash是一个一致性、[模块化]、高性能的JavaScript实用工具库。（1）采用终端导入Lodash库$npmi-gnpm$npmi--savelodash（2）应用示例：搜索框输入防抖在这个示例中，我们希望用
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

深度学习中常用的学习率衰减策略及tensorflow实现

引言

（1）分段常数衰减

（2）指数衰减

（3）自然指数衰减

（4）多项式衰减

（5）余弦衰减

（6）线性余弦衰减

（7）噪声线性余弦衰减

（8）倒数衰减

你可能感兴趣的:(深度学习中常用的学习率衰减策略及tensorflow实现)