xuhss_com

PyTorch常用参数初始化方法详解

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475

1、均匀分布初始化

torch.nn.init.uniform_(tensor, a=0, b=1)

从均匀分布U(a, b)中采样，初始化张量。　　参数：

- tensor - 需要填充的张量
  - a - 均匀分布的下界
  - b - 均匀分布的上界

例子：

w = torch.empty(3, 5)
nn.init.uniform\_(w)
"""
tensor([[0.2116, 0.3085, 0.5448, 0.6113, 0.7697],
 [0.8300, 0.2938, 0.4597, 0.4698, 0.0624],
 [0.5034, 0.1166, 0.3133, 0.3615, 0.3757]])
"""

均匀分布详解：

若 xxx 服从均匀分布，即 x U(a,b)x U(a,b)x~U(a,b)，其概率密度函数（表征随机变量每个取值有多大的可能性）为，

f(x)={1b−a,a

则有期望和方差，

E(x)=∫∞−∞xf(x)dx=12(a+b)D(x)=E(x2)−[E(x)]2=(b−a)212E(x)=∫∞−∞xf(x)dx=12(a+b)D(x)=E(x2)−[E(x)]2=(b−a)212\begin{array}{c}E(x)=\int_{-\infty}^{\infty} x f(x) d x=\frac{1}{2}(a+b) \D(x)=E\left(x^{{2}\right)-[E(x)]}{2}=\frac{(b-a)^{2}}{12}\end{array}

2、正态(高斯)分布初始化

torch.nn.init.normal_(tensor, mean=0.0, std=1.0)

从给定的均值和标准差的正态分布 N(mean,std2)N(mean,std2)N\left(\right. mean, \left.s t d^{2}\right) 中生成值，初始化张量。

参数:

- tensor - 需要填充的张量
  - mean - 正态分布的均值
  - std - 正态分布的标准偏差

例子：

w = torch.Tensor(3, 5)
torch.nn.init.normal\_(w, mean=0, std=1)
"""
tensor([[-1.3903, 0.4045, 0.3048, 0.7537, -0.5189],
 [-0.7672, 0.1891, -0.2226, 0.2913, 0.1295],
 [ 1.4719, -0.3049, 0.3144, -1.0047, -0.5424]])
"""

正态分布详解:

若随机变量 xxx 服从正态分布，即 x∼N(μ,σ2)x∼N(μ,σ2)x \sim N\left(\mu, \sigma^{2}\right) , 其概率密度函数为，

f(x)=1σ√2πexp(−(x−μ2)2σ2)f(x)=\frac{1}{\sigma \sqrt{2 \pi}} \exp \left(-\frac{\left(x-\mu^{2}\right)}{2 \sigma^{2}}\right)

正态分布概率密度函数中一些特殊的概率值:

- 68.268949% 的面积在平均值左右的一个标准差 σ\sigma 范围内 (μ±σ\mu \pm \sigma)
  - 95.449974% 的面积在平均值左右两个标准差 2σ2 \sigma 的范围内 (μ±2σ\mu \pm 2 \sigma)
  - 99.730020% 的面积在平均值左右三个标准差 3σ3 \sigma 的范围内 (μ±3σ\mu \pm 3 \sigma)
  - 99.993666% 的面积在平均值左右四个标准差 4σ4 \sigma 的范围内 (μ±4σ\mu \pm 4 \sigma)

μ=0\mu=0, σ=1\sigma=1 时的正态分布是标准正态分布。

3. Xavier初始化

3.1 Xavier均匀分布初始化

torch.nn.init.xavier_uniform_(tensor, gain=1.0)

又称 Glorot 初始化，按照 Glorot, X. & Bengio, Y.(2010)在论文Understanding the difficulty of training deep feedforward neural networks 中描述的方法，从均匀分布 U(−a,a)U(−a, a) 中采样，初始化输入张量 tensortensor，其中 aa 值由下式确定：

a= gain ×√6 fan_in + fan_out a=\text { gain } \times \sqrt{\frac{6}{\text { fan_in }+\text { fan_out }}}

例子：

w = torch.Tensor(3, 5)
nn.init.xavier\_uniform\_(w, gain=torch.nn.init.calculate\_gain('relu'))
"""
tensor([[ 0.7695, -0.7687, -0.2561, -0.5307, 0.5195],
 [-0.6187, 0.4913, 0.3037, -0.6374, 0.9725],
 [-0.2658, -0.4051, -1.1006, -1.1264, -0.1310]])
"""

3.2 Xavier正态分布初始化

torch.nn.init.xavier_normal_(tensor, gain=1.0)

又称 Glorot 初始化，按照 Glorot, X. & Bengio, Y.(2010)在论文Understanding the difficulty of training deep feedforward neural networks 中描述的方法，从均匀分布 N(0,std2)N\left(0, s t d^{2}\right) 中采样，初始化输入张量 tensortensor，其中 stdstd 值由下式确定：

std= gain ×√2 fan_in + fan_out \operatorname{std}=\text { gain } \times \sqrt{\frac{2}{\text { fan_in }+\text { fan_out }}}

参数:

- tensor - 需要初始化的张量
  - gain - 可选的放缩因子

例子：

w = torch.arange(10).view(2,-1).type(torch.float32)
torch.nn.init.xavier\_normal\_(w)
"""
tensor([[-0.3139, -0.3557, 0.1285, -0.9556, 0.3255],
 [-0.6212, 0.3405, -0.4150, -1.3227, -0.0069]])
"""

4. kaiming初始化

4.1 kaiming均匀分布初始化

torch.nn.init.kaiming_uniform_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

又称 He 初始化，按照He, K. et al. (2015)在论文Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification中描述的方法，从均匀分布U(−bound,bound)U(−bound, bound) 中采样，初始化输入张量 tensor，其中 bound 值由下式确定：

bound = gain ×√3 fan_mode \text { bound }=\text { gain } \times \sqrt{\frac{3}{\text { fan_mode }}}

参数:

- tensor - 需要初始化的张量；
  - a\mathrm{a}- 这层之后使用的 rectifier的斜率系数，用来计算gain =\sqrt{\frac{2}{1+\mathrm{a}^{2}}} (此参数仅在参数nonlinea rity为’leaky_relu’时生效)；
  - mode - 可以为“fan_in”（默认）或“fan_out”。“fan_in”维持前向传播时权值方差，“fan_out”维持反向传播时的方差；
  - nonlinearity - 非线性函数（nn.functional中的函数名），pytorch建议仅与“relu”或“leaky_relu”(默认)一起使用；

例子：

w = torch.Tensor(3, 5)
torch.nn.init.kaiming\_uniform\_(w, mode='fan\_in', nonlinearity='relu')
"""
tensor([[-0.4362, -0.8177, -0.7034, 0.7306, -0.6457],
 [-0.5749, -0.6480, -0.8016, -0.1434, 0.0785],
 [ 1.0369, -0.0676, 0.7430, -0.2484, -0.0895]])
"""

4.2 kaiming正态分布初始化

torch.nn.init.kaiming_normal_(tensor, a=0, mode='fan_in', nonlinearity='leaky_relu')

又称He初始化，按照He, K. et al. (2015)在论文Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification中描述的方法，从正态分布 N(0,std2)N\left(0, s t d^{2}\right) 中采样，初始化输入张量tensor，其中std值由下式确定：

参数:

- tensor - 需要初始化的张量；
  - a\mathrm{a} - 这层之后使用的 rectifier 的斜率系数，用来计算 gain=√21+a2gain =\sqrt{\frac{2}{1+\mathrm{a}^{2}}} (此参数仅在参数nonlinea rity为’leaky_relu’时生效)；
  - mode - 可以为"fan_in" (默认) 或“fan_out"。"fan_in"维持前向传播时权值方差，"fan_out"维持反向传播时的方差；
  - nonlinearity - 非线性函数 (nn.functional中的函数名)，pytorch建议仅与“relu”或"leaky_relu”(默认)一起使用；

5、正交矩阵初始化

torch.nn.init.orthogonal_(tensor, gain=1)

用一个(半)正交矩阵初始化输入张量，参考Saxe, A. et al. (2013) - Exact solutions to the nonlinear dynamics of learning in deep linear neural networks。输入张量必须至少有 2 维，对于大于 2 维的张量，超出的维度将被flatten化。

正交初始化可以使得卷积核更加紧凑，可以去除相关性，使模型更容易学到有效的参数。

参数:

- tensor - 需要初始化的张量
  - gain - 可选的放缩因子

例子：

w = torch.Tensor(3, 5)
torch.nn.init.orthogonal\_(w)
"""
tensor([[ 0.7395, -0.1503, 0.4474, 0.4321, -0.2090],
 [-0.2625, 0.0112, 0.6515, -0.4770, -0.5282],
 [ 0.4554, 0.6548, 0.0970, -0.4851, 0.3453]])
"""

6、稀疏矩阵初始化

torch.nn.init.sparse_(tensor, sparsity, std=0.01)

将2维的输入张量作为稀疏矩阵填充，其中非零元素由正态分布 N(0,0.012)N\left(0,0.01^{2}\right) 生成。参考Martens, J.(2010)的 Deep learning via Hessian-free optimization。

参数:

- tensor - 需要填充的张量
  - sparsity - 每列中需要被设置成零的元素比例
  - std - 用于生成非零元素的正态分布的标准偏差

例子：

w = torch.Tensor(3, 5)
torch.nn.init.sparse\_(w, sparsity=0.1)
"""
tensor([[-0.0026, 0.0000, 0.0100, 0.0046, 0.0048],
 [ 0.0106, -0.0046, 0.0000, 0.0000, 0.0000],
 [ 0.0000, -0.0005, 0.0150, -0.0097, -0.0100]])
"""

7、常数初始化

torch.nn.init.constant_(tensor, val)

使值为常数 val 。

例子：

w=torch.Tensor(3,5)
nn.init.constant\_(w,1.2)
"""
tensor([[1.2000, 1.2000, 1.2000, 1.2000, 1.2000],
 [1.2000, 1.2000, 1.2000, 1.2000, 1.2000],
 [1.2000, 1.2000, 1.2000, 1.2000, 1.2000]])
"""

8、单位矩阵初始化

torch.nn.init.eye_(tensor)

将二维 tensor 初始化为单位矩阵（the identity matrix）

例子：

w=torch.Tensor(3,5)
nn.init.eye\_(w)
"""
tensor([[1., 0., 0., 0., 0.],
 [0., 1., 0., 0., 0.],
 [0., 0., 1., 0., 0.]])
"""

9、零填充初始化

torch.nn.init.zeros_(tensor)

例子：

w = torch.empty(3, 5)
nn.init.zeros\_(w)
"""
tensor([[0., 0., 0., 0., 0.],
 [0., 0., 0., 0., 0.],
 [0., 0., 0., 0., 0.]])
"""

10、应用

例子：

print('module-----------')
print(model)
print('setup-----------')
for m in model.modules():
    if isinstance(m,nn.Linear):
        nn.init.xavier\_uniform\_(m.weight, gain=nn.init.calculate\_gain('relu'))
"""
module-----------
Sequential(
  (flatten): FlattenLayer()
  (linear1): Linear(in\_features=784, out\_features=512, bias=True)
  (activation): ReLU()
  (linear2): Linear(in\_features=512, out\_features=256, bias=True)
  (linear3): Linear(in\_features=256, out\_features=10, bias=True)
)
setup-----------
"""

例子：

for param in model.parameters():
    nn.init.uniform\_(param)

例子：

def weights\_init(m):
    classname = m.\_\_class\_\_.\_\_name\_\_
    if classname.find('Conv2d') != -1:
        nn.init.xavier\_normal\_(m.weight.data)
        nn.init.constant\_(m.bias.data, 0.0)
    elif classname.find('Linear') != -1:
        nn.init.xavier\_normal\_(m.weight)
        nn.init.constant\_(m.bias, 0.0)
model.apply(weights\_init) #apply函数会递归地搜索网络内的所有module并把参数表示的函数应用到所有的module上。

1、均匀分布初始化
2、正态(高斯)分布初始化
3. Xavier初始化
3.1 Xavier均匀分布初始化
3.2 Xavier正态分布初始化
4. kaiming初始化
4.1 kaiming均匀分布初始化
4.2 kaiming正态分布初始化
5、正交矩阵初始化
6、稀疏矩阵初始化
7、常数初始化
8、单位矩阵初始化
9、零填充初始化
10、应用

__EOF__

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xU3OTp9P-1646759404745)(https://blog.csdn.net/BlairGrowing)]Blair - 本文链接： https://blog.csdn.net/BlairGrowing/p/15981694.html

关于博主： 评论和私信会在第一时间回复。或者直接私信我。
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主： 如果您觉得文章对您有帮助，可以点击文章右下角**【[推荐](javascript:void(0)】**一下。

你可能感兴趣的:(计算机,pytorch,深度学习,机器学习,计算机)

基于深度学习的认知架构的AI SEU-WYL 深度学习dnn 人工智能深度学习架构
基于深度学习的认知架构的AI是一类模仿人类认知过程的人工智能系统，旨在模拟人类感知、学习、推理、决策等复杂的认知功能。认知架构的目的是创建一个能够理解和处理复杂环境、实现自我学习和适应的AI系统。结合深度学习技术，这类AI可以更好地应对动态和复杂的任务需求。1.基于深度学习的认知架构的组成一个典型的基于深度学习的认知架构包含多个关键模块：感知模块：负责从外部环境中获取数据，处理和提取特征。深度学习
人工智能：人形机器人的开发需要哪些技能？ InnoLink_1024 机器学习 AGI 人工智能人工智能机器人 ai
人形机器人的开发需要多学科、多领域的专业技能，具体如下：机械工程技能机械设计与建模：熟练掌握计算机辅助设计（CAD）软件，如SolidWorks、AutoCAD等，能够创建精确的3D模型，进行结构分析，并为制造准备详细的图纸。材料与制造工艺：了解各种材料的性质、接合技术以及制造工艺，如铣削、车削、3D打印等，根据机器人的应用场景和性能要求，选择合适的材料和制造工艺。运动学与动力学分析：深入理解运动
编程之路：蓝桥杯备赛指南酷酷的崽798 机器学习蓝桥杯职场和发展
文章目录一、蓝桥杯的起源与发展二、比赛的目的与意义三、比赛内容与形式四、比赛前的准备五、获奖与激励六、蓝桥杯的影响力七、蓝桥杯比赛注意事项详解使用Dev-C++的注意事项一、蓝桥杯的起源与发展蓝桥杯全国软件和信息技术专业人才大赛，简称蓝桥杯，自2009年创办以来，已成为中国最具影响力的计算机类赛事之一。该比赛旨在促进高校学生的编程能力与创新思维，提高他们的实际动手能力。二、比赛的目的与意义提高专业
【深入解析】棋类游戏算法：Minimax, Negamax, 蒙特卡洛树搜索与AlphaZero wit_@ ai python negamax
深入解析棋类游戏算法：Minimax,Negamax,蒙特卡洛树搜索与AlphaZero在人工智能领域，棋类游戏一直是测试和展示智能算法的经典舞台。从最早的Minimax算法到如今的AlphaZero，这些算法通过不同的方式解决了棋局中的决策问题，让计算机能够在复杂的棋局中做出合理甚至超越人类的决策。本文将详细解析几种经典的棋类游戏算法：Minimax，Negamax，蒙特卡洛树搜索（MCTS）以
什么是AI显卡，英伟达与AMD显卡的全面对比 wit_@ 人工智能 python 算法 deep learning 大数据网络
什么是AI显卡？AI显卡是专门为人工智能计算任务设计和优化的图形处理器（GPU）。相比传统显卡，AI显卡具备更强的计算能力、更高的并行处理效率以及针对深度学习、数据科学等领域的特殊硬件支持。在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。常见的AI显卡用途包括：深度学习模
详解AI大模型的主要指标与国内常见大模型对比分析 wit_@ 人工智能 AIGC 语言模型 ai 大数据服务器
AI大模型的主要指标与国内常见大模型对比分析随着人工智能技术的快速发展，大模型（LargeAIModels）在自然语言处理、计算机视觉和多模态任务中取得了突破性进展。对于选择和评价AI大模型，不仅需要关注其功能，还要理解其关键指标和性能表现。本文将详细分析AI大模型的主要评价指标，并对国内常见大模型进行具体对比，提供实际数值和深度解析。一、AI大模型的主要指标AI大模型的性能和实用性通常通过以下指
深入探索Python编程技术：从入门到精通的全方位学习指南小码快撩 python 开发语言
引言在当今信息技术飞速发展的时代，Python以其简洁优雅、功能强大、易于上手的特点，成为了众多开发者和初学者首选的编程语言。无论是数据科学、机器学习、Web开发、自动化脚本编写，还是桌面应用开发，Python都能发挥其独特优势，帮助开发者高效完成任务。本文旨在为Python学习者提供一个全面的学习路径与关键知识点概述，助您快速掌握这门强大的编程语言。一、基础语法1.变量定义与数据类型示例代码：#
计算机技术：冯·诺伊曼架构 InnoLink_1024 嵌入式操作系统架构
冯·诺伊曼架构（VonNeumannArchitecture）是由著名数学家和计算机科学家约翰·冯·诺伊曼（JohnvonNeumann）在20世纪40年代提出的一种计算机设计模型。它奠定了现代通用计算机设计的基础。1.核心思想冯诺伊曼架构的核心思想是存储程序的概念，即将指令和数据存储在同一个内存中，由中央处理器（CPU）依次读取和执行。具体来说，它包含以下关键特性：存储单元使用一个统一的存储设备
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术 wit_@ cnn python 机器学习深度学习 scikit-learn
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。无论是图像分类、目标检测，还是人脸识别、语音处理，CNN都发挥了举足轻重的作用。随着技术的不断发展，CNN已经成为了解决众多实际问题的核心工具。但对于许多人来说，CNN仍然是一个相对复杂的概念，尤其是初学者可能会被其背后的数学原
从零开始的 AI Infra 学习之路 SSS不知-道 MLSys 人工智能深度学习 pytorch
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1CUDA5.2CANN六、AI硬件&体系结构6.1INVIDIAGPU6.2AscendNPU一、概述AIInfra（AI
python 特征选择方法_【来点干货】机器学习中常用的特征选择方法及非常详细的Python实例... Blair Long python 特征选择方法
花费了很长时间整理编辑，转载请联系作者授权，违者必究。特征选择(Featureselection)是在构建预测模型的过程中减少输入变量的一个过程。它是机器学习中非常重要的一步并在很大程度上可以提高模型预测精度。这里我总结了一些机器学习中常见的比较有用的特征选择方法并附上相关python实现code。希望可以给大家一些启发。首先，我们为什么要进行特征选择呢？它有以下几个优点：减少过拟合：冗余数据常常
`计算机知识` `C++` initializer_list初始化列表, 括号列表初始化, 括号集合 supimo 计算机知识 c++
catalog概念区分应用---initializer_list初始化列表里,不存数据`{}`并不等价于初始化列表对象隐患概念区分首先,要区分几个概念,也就是会产生的歧义:1,initializer_list初始化列表2,{1,2,3}括号集合(自己起的名,不重要,重要的是记住它的形式)3,ST():a(0),b(1){}构造函数的初始化列表(这个就和本文章无关了,但名字确实是一样的)这3个概念,
chatgpt赋能python：Python群发微信消息：解决方案 suimodina ChatGpt python chatgpt 微信计算机
Python群发微信消息：解决方案肆无忌惮的群发微信消息，是否是你目前所需的解决方案？如果是，那么你来对地方了。Python是一门十分强大的编程语言，广泛用于各种人工智能、计算机视觉、机器学习等领域。Python可以用于开发各种应用程序，它也可以用于批量处理和发送微信消息。本文将概述如何用Python发送微信消息。我们将介绍用Python实现微信消息的流程和步骤，并提供一些有关如何使用Python
【深度学习】Huber Loss详解小小小小祥深度学习人工智能算法职场和发展机器学习
文章目录1.HuberLoss原理详解2.Pytorch代码详解3.与MSELoss、MAELoss区别及各自优缺点3.1MSELoss均方误差损失3.2MAELoss平均绝对误差损失3.3HuberLoss4.总结4.1优化平滑4.2梯度较好4.3为什么说MSE是平滑的1.HuberLoss原理详解HuberLoss是一种结合了MSE（均方误差）与MAE（平均绝对误差）的损失函数，旨在克服两者的
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小小小小小祥 YOLO 目标检测人工智能
问题描述：YOLOV8作为目前主流的深度学习网络，支持图像分类、目标检测、实例分割、姿态检测、旋转目标检测等功能。对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？YOLOV8官网：https://github.com/ultralytics/ultralyticsYOLOV8n/s/m/l/x信息
Linux stdin、stdout和stderr详解 linux
一、标准流介绍在计算机编程中，标准流是计算机程序开始执行时与其环境之间预连接的输入和输出通信通道。这三种输入/输出(I/O)连接称为标准输入(stdin)、标准输出(stdout)和标准错误(stderr)。最初I/O是通过物理连接的系统控制台(通过键盘输入，通过监视器输出)发生的，但是标准流抽象了这一点。当通过交互式shell执行命令时，流通常连接到shell运行的文本终端，但可以通过重定向或管
080：vue+cesium 利用PointPrimitiveCollection绘制4个不同颜色不同位置的点还是大剑师兰特 #cesium综合教程200+大剑师 cesium教程 cesium入门 cesium示例
作者：还是大剑师兰特，曾为美国某知名大学计算机专业研究生，现为国内GIS领域高级前端工程师，CSDN知名博主，深耕openlayers、leaflet、mapbox、cesium，canvas，echarts等技术开发，欢迎加微信（gis-dajianshi），一起交流。查看本专栏目录-本文是第080篇文章文章目录一、示例效果图二、示例介绍三、配置说明四、示例源代码（共101行）五、相关文章参考一
小猿口算自动PK脚本小黄编程快乐屋人工智能 python
大家好，我是小黄。近期，众多大学生炸鱼小猿口算APP,把一众小学生都快虐哭了，小黄听闻后，也跃跃欲试。对此小黄也参考网上的资料写了一个自动Pk的脚步。首先大家需要安装一个pytorch环境过程中，如果小伙伴对此不熟悉的话可以参考网上的相关教程。我们需要用到Tesseract-OCR文本识别。他的原理就是先截图，之后框选出比较大小的两个数字所在的区域，使用Tesseract-OCR识别出来后进行判断
ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！ WangYan2022 教程人工智能 chatgpt 数据分析 ai绘画 AI写作
熟练掌握ChatGPT4.0在数据分析、自动生成代码等方面的强大功能，系统学习人工智能（包括传统机器学习、深度学习等）的基础理论知识，以及具体的代码实现方法，同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧，以及人工智能领域经典机器学习算法（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）和热门深度学习方法（卷积神经网络、迁移学习、RNN与LSTM神经网络
软考中级复习篇章：数据结构部分的复习海宁不掉头发笔记all 软件工程数据结构算法
软考中级快速通过篇章：数据结构部分的复习一、引言在软考中级的备考过程中，数据结构是极为重要的一个部分。它不仅是计算机科学的基础，也是软考中考查的重点知识领域。扎实掌握数据结构相关内容，对于顺利通过软考中级考试起着关键作用。本文将对数据结构部分的核心知识点进行全面总结，并配以简单的习题练习，帮助大家快速高效地复习这一板块，为软考中级考试做好充分准备。二、数据结构基础概念（一）数据结构的定义数据结构是
人工智能OpenCV计算机视觉技术 yzx991013 OpenCV基础全集 opencv 计算机视觉人工智能
5.3cand可调节边缘检测完整代码：importcv2importnumpyasnp#载入图像，并处理可能的读取错误img_original=cv2.imread('./image/lena.jpg')ifimg_originalisNone:print("无法读取图像文件")raiseSystemExit#创建可调整大小的窗口cv2.namedWindow('Canny',cv2.WINDOW
ASPICE 4.0引领自动驾驶未来：机器学习模型的特点与实践亚远景aspice 机器学习自动驾驶人工智能
ASPICE4.0-ML机器学习模型是针对汽车行业，特别是在汽车软件开发中，针对机器学习（MachineLearning,ML）应用的特定标准和过程。ASPICE（AutomotiveSPICE）是一种基于软件控制的系统开发过程的国际标准，旨在提升软件开发过程的质量、效率和可靠性。ASPICE4.0中的ML模型部分则进一步细化了机器学习在汽车软件开发中的具体要求和流程。以下是对ASPICE4.0-
深入解读ChatGPT的工作原理及底层逻辑 NAR_鱼丸 ChatGPT 程序人生
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。通过预训练和微调，模型能够理解语言的语法和语义，并能够根据上下文生成符合语境的文本回复。基本原理ChatGPT是一种基于自然语言处理（NLP）和深度学习技术的聊天机器人。其基本原理是使用大量文本数据来训练深度神经网络模型
python中tensorflow_python机器学习TensorFlow框架弦歌缓缓
TensorFlow框架关注公众号“轻松学编程”了解更多。一、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端的计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统
Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer) qq742234984 rnn pytorch cnn
Pytorch详解-模型模块Module¶meterModule初认识forward函数ParameterPytorch中的权重、参数和超参数Module容器-ContainersSequentialModuleListModuleDictParameterList&ParameterDict常用网络层LSTM输入和输出GRUConvolutionalLayers卷积层的基本概念常见的卷积
ThreeJS入门（226）：THREE.CSS3DRenderer 知识详解，示例代码还是大剑师兰特 #ThreeJS综合教程500+大剑师 threejs入门 threejs教程 threejs示例
作者：还是大剑师兰特，曾为美国某知名大学计算机专业研究生，现为国内GIS领域高级前端工程师，CSDN知名博主，深耕openlayers、leaflet、mapbox、cesium，webgl，ThreeJS，canvas，echarts等技术开发，欢迎加微信（gis-dajianshi），一起交流。查看本专栏目录-本文是第226篇入门文章文章目录特性构造函数方法`render(scene,came
厉害了，LSTM+Transformer王炸创新，精准度又高了！马拉AI LSTM transformer
【LSTM+Transformer】作为一种混合深度学习模型，近年来在学术界和工业界都受到了极大的关注。它巧妙地融合了长短期记忆网络（LSTM）在处理时序数据方面的专长和Transformer在捕捉长距离依赖关系上的优势，从而在文本生成、机器翻译、时间序列预测等多个领域取得了突破性的进展。这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最
算力平台环境搭建实操罗小黑的师傅目标检测深度学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、登录账号二、选择算力平台已有镜像或外部导入镜像创建开发环境三、配置环境1.修改算力平台密码2.配置代理（1）进入bashrc配置文件（2）在文本末尾添加（3）重新运行bashrc配置文件3.安装miniconda方法1：离线下载方法2：在线下载4.pip换源5.创建并激活虚拟环境6.安装pytorch7.额外包的安装，都可
构建高效GPU算力平台：挑战、策略与未来展望 Mr' 郑 gpu算力
引言随着深度学习、高性能计算和大数据分析等领域的快速发展，GPU（图形处理器）因其强大的并行计算能力和浮点运算速度而成为首选的计算平台。然而，随着模型规模的增长和技术的进步，构建高效稳定的GPU算力平台面临着新的挑战。本文旨在探讨这些挑战、应对策略以及对未来发展的展望。当前挑战算力分配与资源优化在多用户共享GPU集群的环境下，合理分配计算资源并确保每个任务能够高效运行是一项挑战。这不仅涉及到硬件资
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他