计算机鬼才～

机器学习之神经网络

一、引言

二、人工神经网络基础

1、M-P神经元模型

2、前馈神经网络及其规律

三、误差逆传播算法

1、损失函数

Delta学习规则

前馈神经网络的目标函数

2、“修正”策略

①梯度下降法

②动量法SGDM

③Adagrad法

3、“修正”行为

①输出层权重改变量

②隐含层权重改变量

③举个例题

四、避免“过拟合”

1、添加数据

2、简化模型

3、早期停止训练

4、权重衰减

5、Dropout

一、引言

不知不觉我们今天要开始研究深度学习的基础内容了。而有关深度学习的内容，比前面几次课的机器学习算法（比如说贝叶斯分类器和决策树）听起来更为“玄学”与模糊。但是小编相信各位读者能耐着性子读下去，进步的飞快！

在讲解神经网络之前，我们得先理解深度学习与神经网络的关系是怎样的。

深度学习(Deep Learning)是一种基于无监督特征学习和特征层次结构的学习方法，它也被称为特征学习或无监督特征学习。深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。也就是说“深度模型”是手段，“特征学习”是目的。学习深度学习要具备一定的神经网络知识：一般需先学习掌握传统的人工神经网络 (主要有感知器、BP神经网络等) 的基础知识，再学习研究“深度学习”相关部分。

所以，我们学神经网络相关知识，说白了就是为深度学习铺路。那么带着这一层目的，我们开始今日份学习！

二、人工神经网络基础

1、M-P神经元模型

相信很多同学刚开始接触人工智能时，就听到过类似于“仿真”、“神经网络”之类的词语。而神经网络，自然仿真的就是我们大脑中神经元所构成的“网络”。我们先来学学微观模型。请看下图，我们暂且将这三个神经元称之为左神经元、右神经元以及下神经元：

在高中生物课上，我们学习过：每个神经元与其他层的神经元相连，当前面的神经元（比如说左神经元与右神经元）“兴奋”时，就会释放神经递质，向后面的神经元（比如说下神经元）“表达”这种兴奋，改变它的电位。而这种电位超过了某一阈值时，它会被“激活”，紧接着也会变得兴奋，以此类推继续向后面的神经元“表达”自己的兴奋。

那么，用计算机与数学的语言，如何去描绘后面这个神经元的状态呢？假设左神经元因为兴奋,电位为 $x_{1}$ ，它的电位与神经递质的转换比为 $\alpha _{1}$ （单位电位能产生 $\alpha _1{_{}}$ 个神经递质）。且释放的神经递质中，占比 $v_{1}$ 的能抵达下神经元，神经递质与电位转换比为 $\beta _{1}$ （也就是一个神经递质能产生 $\beta _{1}$ 的电位）。右神经元因为兴奋，电位为 $x_{2}$ ，它的电位与神经递质的转换比为 $\alpha _{2}$ ，且释放的神经递质中，占比 $v_{2}$ 的能抵达下神经元，神经递质与电位转换比为 $\beta _{2}$ 。下神经元的电位阈值为 $\theta$ 。所以此时下神经元的状态为 $y=f(x_{1}\alpha _{1}v_{1}\beta _{1}+x_{2}\alpha _{2}v_{2}\beta _{2}-\theta )$ 。其中f为激活函数，有一种是sgn函数：当自变量小于0时，f为0，表示它不兴奋；当自变量大于0时，它等于1，表示此时它很兴奋。

看起来很复杂对不对？其实计算机科学家在考虑神经网络时，并不会想那么多。他们可以用权重w代替掉 $\alpha$ 、v、 $\beta$ 三者的乘积，而把x当做是输入。而当前神经元有n个时，我们能得到更具有普遍意义的公式： $y=f(\sum_{i=1}^{n}w_{i}x_{i}-\theta )$

2、前馈神经网络及其规律

学完了微观的神经元输入输出原理，我们再来看看宏观的神经网络。神经网络是由大量神经元节点按一定体系架构连接成的网状结构，一般都有输入层，隐含层和输出层。传统的浅层网络，一般有3~5层，如下图。前馈神经网络遵循自己的规律，我们以下图的A、B、C神经元为例描述这些规律。

规律1：前馈神经网络，是人工神经网络的一种，各神经元从输入层开始，接收前一级输入，并输出到下一级，直到输出层。其中第一层称为输入层，最后一层为输出层，中间为隐含层。隐含层可以是一层，也可以是多层。

规律2：整个网络中无反馈，可用一个有向无环图表示。（也就是说神经元C所在的这一层可以通向神经元A所在的这一层，而神经元A所在的这一层无法通往神经元C所在的这一层）

规律3：前馈神经网络采用一种单向多层结构。其中每一层包含多个神经元，同一层的神经元之间没有相互连接，层间信息的传送只沿一个方向进行。（举个例子：同层的神经元A与神经元B没有连接）

三、误差逆传播算法

1、损失函数

Delta学习规则

delta学习规则是一种有监督的学习方法，该算法根据神经元的实际输出与期望输出差别来调整连接权，其数学表示如下：

$\Delta W_{ij}=a\cdot (d_{i}-y_{i})x_{j}(t)$

$\Delta W_{ij}$ 代表神经元j到神经元i的连接权重增量， $d_{i}$ 是神经元i的期望输出， $y_{i}$ 是神经元i的实际输出， $x_{j}$ 表示神经元j的状态，a是表示学习速度的常数，基于此思想规则，我们定义了前馈神经网络的目标函数。

前馈神经网络的目标函数

对于一系列的训练样本x，期望输出向量t=（ $t_{1},t_{2},$ …… $t_{n}$ ），网络实际输出向量y=( $y_{1},y_{2}$ …… $y_{n}$ ),对于传统BP算法，它的目标函数（损失函数）为 $J(w)=\frac{1}{2}\left \| t-y \right \|^{2}=\frac{1}{2}\sum_{c}^{k=1}(t_{k}-y_{k})^{2}$ ,也就是各个输出误差的平方之和的一半。常见的目标函数还有均方差函数、交叉熵函数等等，不过下述文章均以J（w）为例。

我们自然是期望通过调整各个神经元之间的权值w来使这个损失函数达到最小。最好的情况是损失函数为0，代表着期望值与实际输出值完全一样，预测的特别准。但实际上很难达到100%预测正确，所以需要我们不断地调整权值，使目标函数向0逼近。所以我们提出了很多“修正”策略。

2、“修正”策略

①梯度下降法

梯度下降法（简称GD）是我们计算函数极值的一种方式，我们会先选择一个初始点，将该点按照梯度下降的方向进行调整，就会使得J（w）往更低的方向进行变化，直到无法下降为止。如公式所示：

$W(m+1)=W(m)-\eta \frac{\partial J}{\partial w}$

w（m+1）表示新权值，w（m）代表旧权值。 $\eta$ 代表步长，代表着我们期待往修正方向走多远，它还有一个名字叫做学习率，一般该参数会被科学家给定，不是我们初学者所能考虑的。

为了让大家能够更好的理解梯度下降法，不如一起编个程，做个题目：

请用梯度下降法求出函数 $f(x,y)=3(x-1)^{2}+y^{2}+e^{(x+y)}$ 的极小值。（已知学习率为0.1，初始值为（3,2），迭代100次）

import math

# 原函数
def Z(x,y):
    return 3*(x-1)**2 + y**2 +math.exp(x+y)
# x方向上的梯度
def dx(x,y):
    return 6*x-6+math.exp(x+y)
# y方向上的梯度
def dy(x,y):
    return 2*y+math.exp(x+y)
# 初始值
X = x_0 = 3
Y = y_0 = 2
# 学习率
alpha = 0.1
# 迭代30次
for i in range(100):
    temX = X - alpha * dx(X,Y)
    temY = Y - alpha * dy(X,Y)
    temZ = Z(temX, temY)
    # X,Y 重新赋值
    X = temX
    Y = temY
    # 将新值存储起来
    print(u"第"+str(i+1)+"次：学习率为"+str(alpha)+"    X为"+str(X)+"    Y为"+str(Y))

output=Z(X,Y)
print("最终结果为"+str(output))

最终结果在1.7左右

对于机器学习来说，梯度下降法又可以细分为三类：

每次使用整个数据集计算损失后来更新参数的方法，我们称为GD，它的计算很慢，占用内存大且不能实时更新，优点是能够收敛到全局最小点，对异常数据不敏感。

每次更新度随机采用一个样本计算损失来更新参数的方法我们称为SGD，它的计算比较快，占用内存小，可以随时新增样本。这种方式对于样本中的异常数据敏感，损失函数容易震荡。容易收敛到局部极小值，但由于震荡严重，会跳出局部极小，从而寻找到接近全局最优的解。

为了解决上述二者的缺点，我们将GD和SGD结合在一起，每次从数据集合中选取一小批数据来计算损失并更新网络参数，这种方法称为BGD。

②动量法SGDM

这一方法模拟的惯性，下坡的时候，如果发现是陡坡，那就利用惯性跑的快一些。类似于一个小球从山坡上滚下，它的前进方向由梯度与之前的下降方向(momentum)共同决定，不只被梯度制约。SGDM不仅克服了之前SGD陷入局部最小值后得到非最优解的缺点，在落入局部最小值点时可以走出去，而且有效的防止了SGD可能造成的震荡问题。

③Adagrad法

Adagrad 是适应性学习率算法，基本思想是对每个变量用不同的学习率，这个学习率在一开始比较大，用于快速梯度下降。随着优化过程的进行，对于已经下降很多的变量，则减缓学习率，对于还没怎么下降的变量，则保持一个较大的学习率。就好比如果我们下坡的时候想下降的最快，那么面对陡坡，我们选择大步子会让自己下降的更快，而对于不陡的坡则迈小步子。

3、“修正”行为

接下来的“修正”行为，均是使用梯度下降法。

①输出层权重改变量

我们了解了梯度下降法的思路后，现在的问题逐步转化为了如何求 $\eta \frac{\partial J}{\partial w}$ ，即如何求解目标函数对权值的梯度。

我们先来算算输出层的权重改变量为多少。先定义一个函数 $\beta _{j}=\sum_{h=1}^{q}W_{hj}b_{h}$ ，这个函数代表着隐含层对输出层中某一个神经元的总输入。

那么J对隐含层中某个神经元到输出层的权重w求的偏导可以修改为 $\frac{\partial J}{\partial w_{hj}}=\frac{\partial J}{\partial \beta _{j} }\frac{\partial \beta _{j}}{\partial w_{hj}}$

而众所周知，右边部分的 $\frac{\partial \beta _{j}}{\partial w_{hj}}=b_{h}$ ，而左边部分可以等价代换为 $\frac{\partial J}{\partial \beta _{j}}=\frac{\partial J }{\partial y_{j}}\frac{\partial y_{j}}{\partial \beta _{j}}$ ，其中 $\frac{\partial J}{\partial y_{j}}=(t_{j}-y_{j})$ ，也就是说剩下一个需要自行求解的 $\frac{\partial y_{j}}{\partial \beta _{j}}$ ，仔细观察，想想我们刚刚学过的M-B神经元模型，我们发现它的值竟然为激活函数的导数！

②隐含层权重改变量

还是同样的道理，先定义一个函数 $\alpha _{j}=\sum_{i=1}^{d}V_{ih}x_{i}$ 。那么，依据我们刚刚求输出层权重改变量的思路，它可以拆解为 $\frac{\partial J}{\partial v_{ih}}=\frac{\partial J}{\partial b_{h}}\frac{\partial b_{h}}{\partial \alpha _{h}}\frac{\partial \alpha _{h}}{\partial v_{ih}}$ ，剩下的步骤与上面的如法炮制，读者们可以自行求解一下。

③举个例题

如果您大抵能够听懂，我们不妨来做一个题巩固一下求解思路。考虑到我们是以捋清楚思路为主，而非考计算，请读者们掏出自己的计算器完成。

假设有如下神经网络，各层相连接的神经元之间的参数如图所示，已知步长为1，实际输出值为0.5，激活函数为sigmod函数，即 $f(x)=\frac{1}{1+e^{-x}}$ ，请求出v1、v2经过梯度下降法修改后的值。

一步一步来，我们先求出各个神经元的输入P的输入为 $I_{1}=0.4\times 0.3+0.2\times 0.5=0.22$ ，Q的输入为 $I_{2}=0.8\times 0.3+0.6\times 0.5=0.54$ ，那么P的输出为 $O_{1}=\frac{1}{1+e^{-0.22}}\approx 0.555$ ，Q的输出为 $O_{2}=\frac{1}{1+e^{-0.54}}\approx 0.632$ ，y的输入为 $I_{3}=0.3\times 0.555+0.7\times 0.632=0.648$ ，所以实际输出与期望输出之差为0.148。而sigmod函数又有这样一个性质，借助这个性质能简化我们的计算量，即 $v_{1}$ 的变化量为 $\Delta v_{1}$ =0.555*0.648*（1-0.648）*0.148=0.0187，新的权重为 $v_{1}^{*}$ =0.3-0,0187=0.283，同理 $v_{2}$ 的变化量为 $\Delta v_{2}$ =0.632*0.648*(1-0.648)*0,148=0.0213，新的权重 $v_{2}^{*}$ =0.7-0.0213=0.6787。

四、避免“过拟合”

当权重参数太多，而样本不足的时候，神经网络可以采用下列方法避免过拟合。

1、添加数据

增加的数据必须是符合要求的实验数据，即与已有数据是独立同分布的。常见的数据扩增方式：采集更多数据、扩增原始数据、数据重采样、生成虚拟数据等等。

2、简化模型

不断降低模型的复杂度，最终达到一个平衡状态：模型足够简单以至于不会发生过拟合，又足够丰富可以从数据中学习到规律

3、早期停止训练

训练时，当每次Epoch结束时在验证集上进行测试，如果随着Epoch次数的增加发现误差在上升，那么就提前结束训练，将此时的权重作为网络的最终参数。如下图红色的这条竖线，代表着从这里开始停止。

4、权重衰减

有些位置的权重是无用的，我们可以使用权重衰减公式 $w=(1-\lambda )w-\eta \frac{\partial L}{\partial w}$ , $\lambda$ 为衰减率，大概在0.01左右，能够有效的减少连接。

5、Dropout

在训练过程中随机让神经元失活或让网络中的连接无效，每次训练忽略的神经元或连接是不同的，让神经网络没机会过度依赖。本质上Dropout就是用一小块数据来训练一系列的子网络。

那么，能颇具耐心的一点一点读到这里，我只能说各位都太优秀了，为自己鼓个掌吧！你的坚持学习必然会得到回报的！

小编接下来还有各方各面的文章，感兴趣的友友可以给我点个赞后再离开吗，小编在此鞠躬感谢啦！

机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
机器学习——KNN超参数练习AI两年半机器学习人工智能深度学习
sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵概率论线性代数 windows 微信机器学习
fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
客服机器人怎么才能精准的回答用户问题？玩人工智能的辣条哥 AI面试机器人客服机器人
环境：客服机器人问题描述：客服机器人怎么才能精准的回答用户问题？解决方案：客服机器人要精准回答用户问题，需综合技术、数据和用户体验等多方面因素。以下是关键策略和步骤：1.精准理解用户意图自然语言处理（NLP）技术分词与实体识别：提取关键词（如“订单号”“退货”）和实体（如时间、地点）。意图分类：通过机器学习模型（如BERT、Transformer）将问题归类（如“售后”“支付”）。上下文理解记录对
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

机器学习之神经网络

一、引言

二、人工神经网络基础

1、M-P神经元模型

2、前馈神经网络及其规律

三、误差逆传播算法

1、损失函数

Delta学习规则

前馈神经网络的目标函数

2、“修正”策略

①梯度下降法

②动量法SGDM

③Adagrad法

3、“修正”行为

①输出层权重改变量

②隐含层权重改变量

③举个例题

四、避免“过拟合”

1、添加数据

2、简化模型

3、早期停止训练

4、权重衰减

5、Dropout

你可能感兴趣的:(机器学习,神经网络,深度学习,人工智能)