datamonday

神经网络算法详解 03：竞争神经网络（SONN、SOFM、LVQ、CPN、ART）

本文介绍了与竞争神经网络的相关知识，包括自组织神经网络（SONN）、自组织特征映射网络（SOFM）、学习向量量化神经网络（LVQ）、对偶传播神经网络（CPN）、自适应共振理论网络（ART）。

系列文章：

【神经网络算法详解 01】-- 人工神经网络基础
【神经网络算法详解 02】 – 感知神经网络与反向传播算法（BP）
【神经网络算法详解 03】 – 竞争神经网络【SONN、SOFM、LVQ、CPN、ART】
【神经网络算法详解 04】 – 反馈神经网络【Hopfield、DHNN、CHNN、BAM、BM、RBM】
【神经网络算法详解 05】-- 其它类型的神经网络简介【RBF NN、DNN、CNN、LSTM、RNN、AE、DBN、GAN】

文章目录

系列文章：
1. 竞争学习原理与策略

1.1 MLP存在的问题
1.2 生物神经网络的特点
1.3 自组织神经网络（SONN）
1.4 竞争学习
1.5 竞争学习原理：胜者为王

2. 自组织特征映射网络（SOFM）

2.1 Kohonen 算法

2.1.1 Kohonen算法步骤
2.1.2 Kohonen 算法步骤

3. 学习向量量化神经网络（LVQ）

3.1 量化的定义
3.2 LVQ神经网络
3.3 LVQ算法流程

4. 对偶传播神经网络（CPN）

4.1 CPN工作原理
4.2 CPN改进：双获胜神经元

5. 自适应共振理论网络（ART）

5.1 神经网络常见的问题
5.2 ART网络结构

5.2.1 网络结构功能说明

5.3 ART网络运行原理
5.4 ART网络学习算法
5.5 ART网络特点

1. 竞争学习原理与策略

1.1 MLP存在的问题

我们在之前的文章中学习了多层感知器（MLP），MLP网络存在一系列的问题，具体来说有如下几点：

学习过程中，所有权重的值都要调整。存在两个问题：训练过程中计算量过大，并且会存在权重不稳定的可能。
误差曲面复杂有起伏时，MLP容易陷入局部极小，即局部最优值，或者其他训练参数（学习率，初始化权重等）选择不合适，引发损失震荡，不会收敛到一个固定的值，最终结果可能不理想。
误差准则（权重更新的依据）是固定的，或者在种程度上来讲是固定的，不能随着环境的变化而进行相应的调整或改变。
更适用于平稳的环境，各种对象、对象间关系及观察结果具有统计平稳性，各项统计特性不会随着时间的变化而变化。

1.2 生物神经网络的特点

对于述问题，生物神经系统的情况主要由如下几点。

人脑的学习是自主式的：可以应对一个非常复杂的、不平稳的、有干扰的环境，辨识学习目标并习得到知识。属于没有导师的自学模式。
人脑的工作方式及信息的存储和检索方式都非固定模式的，而是更接近自组织的：人通过学习积累经验，对外界的环境做出响应，响应对了得到奖励，响应错了受到惩罚，在这个过程中根据反馈结果不断的修正、调整自己的响应策略和方式，以便得到更好的结果。
人的学习能力和记忆能力有弹性、可塑性·常用的知识会学好、记牢，不常用的会逐渐忘掉。
据研究，脑神经元中存在抑制作用，不但接收外界环境刺激、其他神经元的刺激，也会受到周围神经元的抑制
人在响应外界环境时，既能由底向上（根据外界输入对其进行分类、识别），又能从顶向下（既能集中注意力，又能忽略一些非重要信息）

1.3 自组织神经网络（SONN）

【自组织神经网络（Self Organization Neural Network，SONN）】，又称自组织竞争神经网络，通过自动寻找样本中的内在规律和本质属性，自组织、自适应地改变网络参数与结构。通常自组织通过竞争学习（CompetitiveLearning）实现。

自组织神经网络属于前馈神经网络；
自组织神经网络采用无监督学习算法；
其思路为：竟争层的神经元通过竟争（与输入模式进行匹配），选出一个获胜者，其输出就代表了对输入模式的分类；
常见的：自适应共振理论网络ART、自组织特征映射网络SOM、对偶传播网络CPN等
适合解决模式分类和识别方面的问题

1.4 竞争学习

在学习算法上，自组织神经网络模拟生物神经系统依靠神经元之间的兴奋、协调与抑制、竟争的作用来进行信息处理的原理指导网络的学习与工作，而不像大多数神经网络那样以网络的误差或者能量函数（比如Hopfield）作为算法的准则。

竟争学习是自组织网络中最常用的一种学习策略。

【竞争学习（CompetitionLearning）】是人工神经网络的一种学习方式，指网络单元群体中所有单元相互竞争对外界刺激模式响应的权利。竟争取胜的单元的连接权重向着对这一刺激有利的方向变化，相对来说竞争取胜的单元抑制了竞争失败单元对刺激模式的响应。属于自适应学习，使网络单元具有选择接受外界刺激模式的特性。竟争学习的更一般形式是不仅允许单个胜者出现，而是允许多个胜者出现，学习发生在胜者集合中各单元的连接权重上。

1.5 竞争学习原理：胜者为王

【胜者为王学习规则（Winner-Take-All）】：网络对输入做出响应，其中具有最大响应的神经元被激活，该神经元获得修改权重的机会。

将网络的某一层设置为竟争层，对于输入 $X$ 竟争层的所有 $p$ 个神经元均有输出响应，响应值最大的神经元在竞争中获胜，即：

$W^T_mX = max_{i = 1,2,...,p} (W^T_iX)$

获胜的神经元才有权调整其权向量 $W_m$ ，调整量为：
$\Delta W_m=\alpha(X-W_m)，其中 \alpha \in (0,1] ，随着学习而减小$
在竟争学习过程中，竟争层的各神经元所对应的权向量逐渐调整为输入样本空间的聚类中心。注意“()”中的差不是网络误差（期望输出与实际输出的差值），而是输入X与权重的差值。

在实际应用中，通常会定义以获胜神经元为中心的邻域。所在邻域内的所有神经元都进行权重调整。

2. 自组织特征映射网络（SOFM）

Teuvo Kohonen 1981年，芬兰赫尔辛基大学的 T·Kohonen 教授提出一种【 **自组织特征映射网（Self-Organization Feature Map，SOFM）**】，又称作Kohonen网络。其核心思想为一个神经网络接受外界输入时，将会分为不同的对应区域，各区域对输入模式具有不同的响应特征，该过程是自动完成的。SOFM常见结构：

2.1 Kohonen 算法

【Kohonen算法】类似于胜者为王算法，主要区别在于调整权向量和抑制的方式不同。胜者为王中只有获胜的唯一的神经元得到调整向量的机会，其他神经元被抑制。Kohonen算法对邻近神经元的影响是由中心到边缘逐渐变弱的，即邻近区域的神经元都有机会调整权向量，不过调整的程度不同，通过激活函数实现。

由上图可以看出，最大输出的神经元的权重调整程度最大，以此为中心向周围的调整力度逐渐降低。在三维空间中的图形很像墨西哥帽，所以这种激活函数也叫作墨西哥帽。再看另外两种（“大礼帽”、“厨师帽”）。

2.1.1 Kohonen算法步骤

针对以上的流程，具体细节如下：

对各参数进行初始化，包括：

对输出层各权向量赋值：赋一些小的随机数 $W_j$
对输出层各权向量进行归一化处理 $\hat{W_j}$
建立初始优胜邻域 $N^*_j(0)$
对学习率进行赋值 $\eta$

从训练集输入数据，并进行归一化处理，得到 $\hat{X_p},p \in \lbrace 1,2,...,P\rbrace$
根据输入，得到当前获胜的神经元。计算 $\hat{W_j}$ 与 $\hat{X_p}$ 的点积，找到点积最大的神经元，即为获胜神经元。
以广为中心确定t时刻的权值调整域。一般情况下初始邻域 $N^*_j(0)$ 较大，训练过程中 $N^*_j(0)$ 随训练时间逐渐收缩。
调整优胜邻域中的所有的神经元权值。调整公式为：
$w_{ij}(t十1）= w_{ij}(t) + \eta(t,N)[x^p_i - w_{ij}(t)]$
其中， $\eta(t,N)$ 表示训练时间 $t$ 和邻域内第 $j$ 个神经元与获胜神经元 $j^*$ 之间的距离 $N$ 的函数， $\eta(t,N)$ 与 $t, N$ 均成反比，即随着时间越来越小，并且 $j$ 神经元离获胜的 $j^*$ 神经元越远，权重变化越小。
通常根据学习率 $\eta$ 是否衰减到某个事先约定的阈值判断。

2.1.2 Kohonen 算法步骤

已知一些动物属性，使用Kohonen网络对其进行聚类。

整理数据：将16种动物通过16个输入特征来表示，第一种将第一个特征设为1，其余为0，第二种将第二特征设为1，其余为0，依次类准，数据变为如下16行29个属性的数据。其实就是变为虚拟变量（哑变量），常用的one-hot编码就是这种格式。
设计网络结构：输入为29个节点，输出到一个1010的二维平面上。虽然有16类，但是每一类的可能映射不止一种，所以设置为1010。
初始化参数：输入为29个节点，输出到一个1010 的二维平面上。
权向量初始化：权重向量为一个2910*10的数组 $W$ ，对其赋予一系列的0-1之间的随机数。
权向量归一化：将向量数组 $W$ 归一化。
建立初始邻域：将初始邻域距离设置为2，即距离获胜神经元欧氏距离 $\le 2$ 的神经元均划在邻域内，邻域随着训练次数的增加而逐渐减小。
学习率：初始值设为 $\eta(t) = \frac{0.3}{t}$ ，随着训练次数增加，学习率按照 $\eta'=\eta*e^{-N}$ 衰减， $N$ 距离获胜神经元的距离。
得到获胜神经元及邻域：将输入数据逐一输入，和权重数组相乘，映射到1010的输出节点上，值最大的即为获胜者。以第一条数据为例，输入后，和当前权重数组相乘。得到一个1010的输出，映射到输出节点如下：

上图中，白色区域表示初始邻域，这些神经元得到了输出机会。
将获胜神经元邻域内输出节点对应的权重数组按公式 $w_{ij}(t十1）= w_{ij}(t) + \eta(t,N)[x^p_i - w_{ij}(t)]$ 进行调整。
是否满足结束条件：学习率衰减到一个小于阈值的值，或者训练次数达到约定的值。

本例对16条记录的数据集，进行了1000次的练。输出结果如下：

3. 学习向量量化神经网络（LVQ）

不知道是不是用了霸王洗发水。

Teuvo Kohonen

【学习向量量化神经网络（Learning Vector Quantization，LVQ）】，在竟争网络的基础上，由Kohonen提出其核心为将竟争学习与有监督学习相结合，学习过程中通过教师信号对输入样本的分配类别进行规定，克服了自组织网络采用无监督学习算法带来的缺乏分类信息的弱点。

3.1 量化的定义

【量化】：在数字信号处理领域，是指将信号的连续取值（或者大量可能的离散取值）近似为有限多个（或较少的）离散值的过程，简单来说就是将连续值进行离散化。向量量化是对标量量化的扩展，更适用于高维数据。

通常情况下，向量量化的思路是：在高维空间，把它分成多个不同的区域，对每个区域指定一个中心向量，这里可以类比于聚类问题中的聚类中心。当输入数据映射到这个区域中时，可以用中心向量与距离中心来代表这个数据。最终结果就形成了以中心向量为中心的集合。这就是LVQ的中心思想。

3.2 LVQ神经网络

将高维数据映射到二维输入平面上，之前的Winner-Take-All和SOFM算法都是类似的向量量化算法，都能用少量的聚类中心表示原始数据。但SOFM的各相邻聚类中心对应的向量具有某种相似的特征，而一般向量量化的中心不具备这种特点。

二维向量量化

第一步，聚类；通过自组织映射进行聚类。
第二步，学习向量量化；通过有监督方法，利用教师信号作为分类信息对权值进行调整，并指定输出神经元的的类别。

网络结构特点：

由三层组成：输入层、竟争层、输出层；
输入层和竞争层之间是全连接；
一组竞争层节点对应一个输出节点；
输入层到竞争层的权重可调整；
竟争层到输出层的权重通常为固定值1；
竟争层的学习规则为胜者为王（WTA）；
竟争层的胜者输出为1，其余为0。

$y_1,y_2,...,y_m$ 表示竞争层中每组节点的输出。

标记说明：

3.3 LVQ算法流程

实际上，可以将LVQ算法分成两部分。第一部分，寻找获胜神经元。其实寻找获胜神经单元的过程就是在找中心向量，通过不断地训练（寻找），中心向量会越来越明确，也就是说竞争层中组与组之间的区分会越来越明显，最终就会形成固定的几组（可以类比成聚类）。第二部分，通过监督学习的算法来进行权重调整。这个过程通过输入样本与权重的比较，不断地更新权重和学习率等参数。这两部分结合，能够达到很好的分类效果。

4. 对偶传播神经网络（CPN）

聪明绝顶警告！

Robert Hecht-Nielsen

【对偶传播神经网络（Counter-Propagation Network，CPN）】，1987年由美国学者Robert Hecht-NieIsen提出，最早用来实现样本选择匹配系统，能存储二进制或模拟值的模式对，可用于联想存储、模式分类、函数逼近、统计分析和数据压缩等。

网拓扑结构：共三层，各层之间为全连接，与三层 BP 网络相似。但其本质不同，实际上是由
自组织网络+外星网络构成，其隐藏层即为竞争层，采用竞争学习规则，输出层为 Grossberg 层，采用 Widrow-Hoff 或者 Grossberg 学习规则。

4.1 CPN工作原理

算法流程：

阶段一：输入层到竞争层权重调整

阶段二：竞争层到输出层的权重调整

至此，网络训练完成。

4.2 CPN改进：双获胜神经元

【双获胜神经元CPN网】：无获胜邻域念，可以改进为竞争层两个神经元获胜，更新两个神经元对应的权重。对于每个输入式，允许有两个竞争层神经元获胜，如果输入为由两个训练样本线性组合而成的新模式（复合模式），那么网络的输出就是与复合输入模式中包含的样本相对应的输出模式的组合。

5. 自适应共振理论网络（ART）

这就是见识长头发短吧。

G.A.Carpenter

【 自适应共振理论（Adaptive Resonance Theory，ART）】，1976年由美国波斯顿大学学者GACarpenter提出，试图为人类的心理和认知活动建立统一的数学理论。随后又和S.Grossberg提出了ART网络。

5.1 神经网络常见的问题

有监督学习网络：通过反复输入样本数据，使其达到稳定记忆（得到可以接受的参数）后，再输入新样本继续洲练的话，前面的训练结果会受到影响。
无监督学习网络：新样本会对己训练的聚类进行修改，从学习的角度来理解，即新知识的学习，会导致对旧知识的遗忘。很多类型的网络，也会考虑对旧知识的保留，比如权重调整公式中考虑包含对数据的学习项及对旧数据的忘却项，通过控制学习系数和忘记系数的大小来平衡新旧知识的关系，但是这些系数的确定成为新的问题，很难有一般方法解决。
无/有监督学习网络：最终学习效果主要通过权重阵 $W$ 来体现，但其能包含的信息终归有限，记忆的模式类别信息必然会被新输入产生的模式抵消（遗忘），影响分类结果。也不能无限扩大网络规模，因为随着规模的扩大，计算量会迅速上升，到一定程度，网络已经不可训练了。

针对以上问题，ART网络应用而生。

5.2 ART网络结构

ART网络由两层组成两个子系统，一个叫比较层C，一个叫识别层R，及三种控制信号：复位信号（Reset）、**逻辑控制信号（GI、G2）**组成。

5.2.1 网络结构功能说明

网络接受新的输入后，开始检输入和R层已有分类信息的匹配程度（竟争学习得到获胜单元）
对于相似程度高的（获胜神经元）需要继续考察其储存的模式与输入模式的相似程度（根据预先设定的参考门限评估）
如果相似度超过门限，则归于该类，调鼙权重，使其遇到与当前输入模式相似的样本时得到更大的相似度
如果相似度没有超过门限，则对匹配程度次高的神经元对应的模式进行相似度评估，如果超门限，返回上一步，否则继续本步查找匹配程度次次高的模式，返回操作还回到本步，则需要在输出端设立一个代表新模式的神经元，代表该模式，参与后续的匹配评估过程。

5.3 ART网络运行原理

5.4 ART网络学习算法

5.5 ART网络特点

非离线学习，即不是对输入集样本反复训练后才开始运行，而是采用了边学习边运行的方式；
每个输入样本，都被看成一类相近样本的代表，每次最多只有一个类别输出为1；
当输入样本距某一个内星权向量较近（由门限值 $\rho$ 决定）时，代表它的输出神经元才会响应；
门限值影响到最终的分类精度，换言之，门限值 $\rho$ 越小分类个数越少，反之分类越多；
只能处理输入类型为二进制或者双极型的情况。

ART还有两个扩展类型：

ARTII：是ARTI的扩展形式，可以处理连续模拟信号；
ARTIII：分级搜索模型，兼容ARTI与ARTII两种结构功能，并能将两层神经网络扩大为任意多层神经网络。

课程链接：https://edu.aliyun.com/course/1923

DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
基于摩尔线程 S80 显卡在 Ubuntu 系统下双卡交火部署 DeepSeek 流量留 Deepseek 人工智能
以下是基于摩尔线程S80显卡在Ubuntu系统下双卡交火部署DeepSeek的详细教程：###一、环境准备1.**操作系统**：推荐使用Ubuntu22.04。2.**显卡驱动**：-访问摩尔线程官网，登录账号后进入产品页面，找到软件部分下载MUSASDK。-安装显卡驱动，确保驱动版本与MUSASDK兼容。3.**安装Ollama**：-官方推荐使用命令安装Ollama，但下载速度可能较慢，可前往
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
线上正常，本地调用deepseek接口报错：Error:SSL certificate problem: unable to get local issuer certificate 落落鱼2013 ssl 服务器网络协议 deepseek
如题，线上调用deepseek接口正常，但本地调用接口时报以下错误：Error:SSLcertificateproblem:unabletogetlocalissuercertificate。问了下豆包，得知是缺少本地证书的问题。然后用小P配置了ssl证书用https访问依旧不行，报错不变：解决办法：调用curl函数时添加以下配置项：curl_setopt($ch,CURLOPT_SSL_VERI
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
DeepSeek-V3混合精度推理（FP8/BF16）原理与实战全解析 CarlowZJ DEEPSEEK-V3
目录摘要混合精度推理的背景与意义DeepSeek-V3混合精度架构设计FP8与BF16核心原理详解混合精度推理核心实现实践案例：FP8权重转BF16与推理部署常见问题与注意事项最佳实践与扩展建议总结参考资料附录：可视化图表1.摘要本文系统梳理DeepSeek-V3在FP8/BF16混合精度推理方面的架构设计与工程实现，结合源码与实际案例，帮助开发者深入理解其混合精度推理原理、工程落地方法与性能优化
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
学习AI机器学习所需的数学基础 frostmelody 机器学习小知识点人工智能学习机器学习
一、机器学习岗位的数学需求矩阵机器学习岗位研究型职位工业界职位DeepMind/Meta/Google研究部门研究科学家/研究工程师普通科技公司机器学习工程师/数据科学家需硕士/博士数学水平本科数学基础二、数学需求深度解析1.研究型职位（需深度数学）学历要求：数学/物理/计算机/统计/工程本科基础硕士/博士优先（Kaggle调查显示博士占比高）薪资关联：学历与收入呈正相关2.工业界职位（基础数学）
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
pytorch 要点之雅可比向量积 AI大模型教程 pytorch 人工智能 python facebook 深度学习机器学习 webpack
自动微分是PyTorch深度学习框架的核心。既然是核心，就需要敲黑板、划重点学习。同时，带来另外一个重要的数学概念：雅可比向量积。PyTorch中的自动微分与雅可比向量积自动微分（AutomaticDifferentiation，AD）是深度学习框架中的关键技术之一，它使得模型训练变得更加简单和高效。且已知：PyTorch是一个广泛使用的深度学习框架，它内置了强大的自动微分功能。在本文中，我们将深
浅说深拷贝（Deep Copy）与浅拷贝（Shallow Copy） =^_^=喵喵 javascript 前端开发语言
在JavaScript中，深拷贝和浅拷贝是两种不同的数据复制方式，主要区别在于如何处理引用类型数据（如对象、数组）。1.浅拷贝（ShallowCopy）定义：只复制对象的第一层属性，如果属性是引用类型（如对象、数组），则复制的是引用，而不是实际数据。特点：原始对象和拷贝后的对象共享引用类型的属性。修改其中一个对象的引用类型属性会影响另一个对象。实现方式：Object.assign()（仅第一层深拷
DeepSeek：开启教育测评智能化新时代奔跑吧邓邓子 DeepSeek 实战 DeepSeek 教育测评应用
目录一、引言二、DeepSeek技术概述2.1DeepSeek的发展历程与特点2.2工作原理与技术架构三、测评试题智能生成3.1生成原理与技术实现3.2生成试题的类型与应用场景3.3优势与面临的挑战四、学生学习评价报告4.1评价指标体系与数据来源4.2DeepSeek生成评价报告的流程与方法4.3评价报告的特点与应用价值五、教育测评系统优化5.1DeepSeek对教育测评系统的优化作用5.2实际案
从实验到生产：DeepSeek大模型工程化部署的关键步骤与风险控制一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、引言：大模型部署迈入“工程化时代”随着DeepSeek等开源大语言模型（LLM）的发展，大模型不再是AI实验室的专属工具，越来越多的企业正尝试将其纳入业务生产系统，应用于客服问答、合同审查、数据分析、自动写作等场景。但模型的能力≠可用的系统。从模型下载到模型上线，中间隔着“部署的鸿沟”：资源配置、服务稳定性、响应效率、安全控制、上线合规……一
DeepBI如何用AI竞价破解亚马逊广告ACOS困局扬帆起航13 人工智能
在亚马逊这个全球最大的电商竞技场中，广告投放早已成为卖家突围的必争之地。然而，当无数卖家反复纠结"亚马逊广告竞价设置多少合适"这一问题时，背后折射出的其实是整个行业面临的系统性难题。作为从业多年的广告优化师，我见证过太多卖家在手动调价、关键词管理和预算分配中疲于奔命，最终陷入"高投入低回报"的恶性循环。核心痛点往往集中在三个维度：竞价策略缺乏动态响应能力，关键词管理跟不上市场变化节奏，预算分配与库
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
3秒搞定DeepSeek数学公式转Word！学生党救星（附代码实测） Uyker python 编辑器
适用场景：论文交稿deadline/报告美化/作业急救工具白嫖指南：免费+免安装方案优先一、终极方案：Mathpix截图转公式（强推！）效果：复杂矩阵→完美还原步骤：复制DeepSeek输出的LaTeX代码（例）\vec{F}=q(\vec{E}+\vec{v}\times\vec{B})打开Mathpix官网→按Ctrl+Alt+M截取公式右键粘贴到Word→自动变身标准公式！✅优势：识别准确率
DeepSeek 部署中的常见问题及解决方案：从环境配置到性能优化的全流程指南慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：大模型部署的现实挑战随着大模型技术的发展，以DeepSeek为代表的开源中文大模型，逐渐成为企业与开发者探索私有化部署、垂直微调、模型服务化的重要选择。然而，模型部署的过程并非“一键启动”那么简单。从环境依赖、资源限制，到推理性能和服务稳定性，开发者往往会遇到一系列“踩坑点”。本文将系统梳理DeepSeek模型在部署过程中的典型问题与实践经
MI300X vs H100：DeepSeek 部署在哪个 GPU 上性价比最高？卓普云技术科普 AIGC 人工智能 Deepseek H100 MI300x
随着大模型部署和推理变得越来越普及，开发者和企业对GPU的选择也越来越挑剔。特别是像DeepSeek这样的开源模型家族，从轻量级的6.7B，到动辄上百亿甚至数百亿参数的超大模型，背后对算力和显存的要求各不相同。最近，一则重磅消息在AI圈引起了轩然大波：连AI巨头OpenAI也在探索并计划使用AMDInstinctMI300xGPU！这无疑是对AMD这款高性能GPU的巨大认可，也预示着它将在AI算力
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
深度学习：梯度下降法数字化与智能化人工智能深度学习深度学习梯度下降法
一、梯度的概念（1）什么是梯度梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。对于一个多元函数f(x1,x2,...,xn)，其梯度是一个由函数偏导数组成的向量，其梯度表示为：Gradient=(∂f/∂x1,∂f/∂x2,...,∂f/∂xn)其中，∂f/∂xi表示函数f对第i个自变量
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f