weixin_30391339

BP神经网络

BP神经网络

人工神经网络与人工神经元模型

　　In machine learning and cognitive science, artificial neural networks (ANNs) are a family of statistical learning models inspired by biological neural networks (the central nervous systems of animals, in particular the brain) and are used to estimate or approximate functions that can depend on a large number of inputs and are generally unknown.

　　在机器学习和认知科学,人工神经网络(ann)是一个家庭的统计学习模型受生物神经网络(动物的中枢神经系统,特别是大脑)和用于估计或近似函数,可以依靠大量的输入和通常是未知的。

　　人工神经网络是人工智能研究的一种方法。实际上人工神经网络（Artificial Neural Netwroks，简称ANN）是对人类大脑系统的一种仿真，简单地讲，它是一个数学模型，可以用电子线路来实现，也可以用计算机程序来模拟，由大量的、功能比较简单的形式神经元互相连接而构成的复杂网络系统，用它可以模拟大脑的许多基本功能和简单的思维方式。尽管它还不是大脑的完美无缺的模型，但它可以通过学习来获取外部的知识并存贮在网络内，可以解决计算机不易处理的难题，特别是语音和图像的识别、理解、知识的处理、组合优化计算和智能控制等一系列本质上是非计算的问题。

　　生物神经元：

　　生物神经元模型就是一个简单的信号处理器。树突是神经元的信号输入通道，接受来自其他神经元的信息。轴突是神经元的信号输出通道。

　　信息的处理与传递主要发生在突触附近。神经元细胞体通过树突接受脉冲信号，通过轴突传到突触前膜。当脉冲幅度达到一定强度，即超过其阈值电位后，突触前膜将向突触间隙释放神经传递的化学物质(乙酰胆碱)，使位于突触后膜的离子通道(Ion Channel)开放，产生离子流，从而在突触后膜产生正的或负的电位，称为突触后电位。

BP神经网络_第1张图片

　　突触有两种：兴奋性突触和抑制性突触。前者产生正突触后电位，后者产生负突触后电位。一个神经元的各树突和细胞体往往通过突触和大量的其他神经元相连接。这些突触后电位的变化，将对该神经元产生综合作用，即当这些突触后电位的总和超过某一阎值时，该神经元便被激活，并产生脉冲，而且产生的脉冲数与该电位总和值的大小有关。脉冲沿轴突向其他神经元传送，从而实现了神经元之间信息的传递。

　　人工神经元模型的三要素：

　　①连接权ω ②求和单元∑ ③激活函数f(·)

BP神经网络_第2张图片

　　其中，

　　$X=[ \times 0, \times 1, \times 2, \ldots \ldots ., \times n]$ 　　$\mathbf{W}=\left[\begin{array}{c}{w_{10}} \\ {w_{i 1}} \\ {w_{i 2}} \\ {\vdots} \\ {w_{i n}}\end{array}\right]$ 　　

　　常用表达式一：

　　$\begin{array}{c}{\text { net }_{i}=\sum_{j=1}^{n} w_{i j} x_{j}-\theta} \\ {y_{i}=\mathrm{f}\left(\text { net }_{i}\right)}\end{array}$ 　　

　　常用表达式二：

$\begin{array}{c}{\text { net }_{i}=\mathrm{XW}} \\ {y_{i}=\mathrm{f}\left(\mathrm{net}_{i}\right)=\mathrm{f}(\mathrm{XW})}\end{array}$

　　常用的激活函数：

　　①线性函数

$$\mathrm{f}(\mathrm{x})=k * x+c$$

　　②斜坡函数

$$f(x)=\left\{\begin{array}{cc}{T} & {, \quad x>c} \\ {k * x,} & {|x| \leq c} \\ {-T,} & {x<-c}\end{array}\right.$$

　　③阈值函数

$$f(x)=\left\{\begin{array}{l}{1, x \geq c} \\ {0, x

　　④S型函数(Sigmoid)

$$\begin{array}{c}{f(x)=\frac{1}{1+e^{-\alpha x}}(0

　　⑤双极S型函数

$$\begin{array}{l}{f(x)=\frac{2}{1+e^{-\alpha x}}-1(-1

神经网络

连接方式

　　按照连接方式，可划分为前向神经网络与反馈(递归)神经网络。

　　前向神经网络：

　　

BP神经网络_第4张图片

　　反馈神经网络：

　　

BP神经网络_第5张图片

学习方式

　　按照连接方式，可分为有导师学习神经网络与无导师学习神经网络。

　　有导师学习神经网络：

　　外界存在一个教师，对给定的一组输入，提供应有的输出(标准答案)，学习系统可根据实际输出与标准答案之间的差值来调整系统参数。

　　

BP神经网络_第6张图片

　　无导师学习神经网络：

　　学习系统按照环境提供数据的某些统计规律来调节自身参数。

　　

　　♦强化学习：

　　环境对系统输出结果只给出评价信息(奖或惩)，系统通过强化受奖动作来改善自身性能。

　　

BP神经网络_第7张图片

　　学习规则

　　考察神经元 k 在 n 时刻的输入和输出。

　　输入： $x_{k}(n)$

　　实际输出： $y_{k}(n)$

　　理应输出： $d_{k}(n)$

　　误差信号： $e_{k}(n)=d_{k}(n)-y_{k}(n)$

　　由误差信号构造能量函数： $J(\omega)=E\left[\frac{1}{2} \sum_{k} e_{k}^{2}(n)\right]$。其中，$E( .)$为求期望算子。

　　求解最优化问题： $\min _{\omega} J(\omega)=E\left[\frac{1}{2} \sum_{k} e_{k}^{2}(n)\right]$

　　得出系统参数： ω

　　通常情况下用时刻 n 的瞬时值 $J_{n}(\omega)=\frac{1}{2} \sum_{k} e_{k}^{2}(n)$ 代替$J$。

　　即求解最优化问题： $\min _{\omega} J_{n}(\omega)=\frac{1}{2} \sum_{k} e_{k}^{2}(n)$

　　由数值迭代算法（如最速下降法、模拟退火算法等），可得 $\Delta \omega_{k j}=\eta e_{k}(n) x_{j}(n)$ 。 其中 $\eta$ 为学习步长。

　　

　　♦Hebb学习规则

　　神经学家Hebb提出的学习规则：当某一连接两端的神经元同步激活（或同为抑制）时，该连接的强度应增强，反之应减弱，数学描述如下：

　　$\Delta \omega_{k j}=F\left(h_{k}(n), h_{j}(n)\right)$

　　其中，$h_{k}(n), h_{j}(n)$ 分别为 $\omega_{i j}$ 两端神经元的状态。

　　最常用的一种情况是： $\Delta \omega_{k j}=\eta h_{k}(n) h_{j}(n)$

BP神经网络（向后传播算法）

　　Backpropagation is a common method of teaching artificial neural networks how to perform a given task.
　　It is a supervised learning method, and is a generalization of the delta rule. It requires a teacher that knows, or can calculate, the desired output for any input in the training set.
　　Backpropagation requires that the activation function used by the artificial neurons (or "nodes") be differentiable.

　　反向传播是教授人工神经网络如何执行给定任务的一种常用方法。

　　它是一种监督学习方法，是delta规则的推广。它要求教师知道或能够计算出训练集中任何输入所需的输出。

　　反向传播要求人工神经元(或“节点”)使用的激活函数是可微的。

　　对于多层网络，由于有隐层后学习比较困难，限制了多层网络的发展，BP算法的出现解决了这一困难。

　　

BP神经网络_第8张图片

　　BP算法的原理
　　对于多层前馈型网络，网络中有两种信号在流通。
　　①工作信号，施加的输入信号向前传播直到在输出层产生实际的输出信号，是输入信号和权值的函数。
　　②误差信号，网络实际输出与应有输出间的差值，它由输出层开始逐层向后传播。

　　BP网络的过程描述：

　　假设训练样本集为：

$$\left\{\left(x_{p}, t_{p}\right) ; x_{p}=\left(x_{p 1}, \ldots, x_{p N}\right)^{T}, t_{p}=\left(t_{p 1}, \ldots, t_{p M}\right)^{T}, p=1,2, \cdots, \Pi\right\}$$

　　其中 Π 表示样本集中样本个数，$\mathbb{x}_{p}$为输入向量，$\mathbb{t}_{p}$为输出向量。

　　BP网络主要有两个阶段：

　　①信号前传阶段

　　

　　②误差后传阶段

　　

　　推导用于多层前馈型网络学习的BP算法

　　设在第 n 次迭代中某一层的第 j 个单元的输出为 $y_{j}(n)$。

　　当 j 单元所在层为输出层时，

　　该单元的误差信号为 $e_{j}(n)=d_{j}(n)-y_{j}(n)$，定义单元 j 的平方误差为 $\frac{1}{2} e_{j}^{2}(n)$，则输出层总的平方误差的瞬时值为： $\xi(n)=\frac{1}{2} \sum_{j} e_{j}^{2}(n)$

　　下面就逐个样本学习的情况来推导BP算法。

　　

BP神经网络_第11张图片

　　如图，令单元 j 的净输入为 $v_{j}(n)=\sum_{i} \omega_{j i}(n) y_{i}(n)$，则 $y_{j}(n)=\varphi_{j}\left(v_{j}(n)\right)$。

　　求 $\xi(n)$ 对 $\omega_{j i}$ 的梯度

　　$\begin{aligned} \frac{\partial \xi(n)}{\partial \omega_{j i}} &=\frac{\partial \xi(n)}{\partial e_{j}(n)} \cdot \frac{\partial e_{j}(n)}{\partial y_{j}(n)} \cdot \frac{\partial y_{j}(n)}{\partial v_{j}(n)} \cdot \frac{\partial v_{j}(n)}{\partial \omega_{j i}(n)}=e_{j}(n) \cdot(-1) \cdot \varphi_{j}^{\prime}\left(v_{j}(n)\right) \cdot y_{i}(n) \\ &=-e_{j}(n) \varphi_{j}^{\prime}\left(v_{j}(n)\right) y_{i}(n) \end{aligned}$

　　权值 $\omega_{j i}$ 的修正量为 $\Delta \omega_{j i}=-\eta \frac{\partial \xi(n)}{\partial \omega_{j i}(n)}=\eta \delta_{j}(n) y_{i}(n)$

　　其中 ${\delta _j}(n) = - \frac{{\partial \xi (n)}}{{\partial {e_j}(n)}} \cdot \frac{{\partial {e_j}(n)}}{{\partial {y_j}(n)}} \cdot \frac{{\partial {y_j}(n)}}{{\partial {v_j}(n)}} = {e_j}(n){\varphi _j}^\prime ({v_j}(n))$ 称为局部梯度

　　当 j 单元所在层为隐层时，

　　

BP神经网络_第12张图片

　　权值${\omega _{ji}}$的修正量为 $${\omega _{ji}} = - \eta \frac{{\partial \xi \left( n \right)}}{{\partial {\omega _{ji}}\left( n \right)}} = \eta {\delta _j}\left( n \right){y_i}\left( n \right)$$

　　其中，

　　${\delta _j}(n) = {\varphi _j}^\prime ({v_j}(n))\sum\limits_k {{\delta _k}(n){\omega _{kj}}(n)} $

　　${\delta _k}(n) = {e_k}(n){\varphi _k}^\prime ({v_k}(n))$

　　构造多层前向神经网络

　　

BP神经网络_第13张图片

BP神经网络的优缺点

　　

MATLAB实现

训练集/测试集产生

1. 导入数据

load spectra_data.mat

2. 随机产生训练集和测试集

temp = randperm(size(NIR,1));
% 训练集——50个样本
P_train = NIR(temp(1:50),:)';
T_train = octane(temp(1:50),:)';
% 测试集——10个样本
P_test = NIR(temp(51:end),:)';
T_test = octane(temp(51:end),:)';
N = size(P_test,2);

BP神经网络创建、训练及仿真测试

1. 创建网络

net = newff(P_train,T_train,9);

2. 设置训练参数

net.trainParam.epochs = 1000;
net.trainParam.goal = 1e-3;
net.trainParam.lr = 0.01;

3. 训练网络

net = train(net,P_train,T_train);

4. 仿真测试

T_sim = sim(net,P_test);

性能评价

1. 相对误差error

error = abs(T_sim - T_test)./T_test;

2. 决定系数R^2

R2 = (N * sum(T_sim .* T_test) - sum(T_sim) * sum(T_test))^2 / ((N * sum((T_sim).^2) - (sum(T_sim))^2) * (N * sum((T_test).^2) - (sum(T_test))^2));

3. 结果对比

result = [T_test' T_sim' error']

　　

画图

figure
plot(1:N,T_test,'b:*',1:N,T_sim,'r-o')
legend('真实值','预测值')
xlabel('预测样本')
ylabel('辛烷值')
string = {'测试集辛烷值含量预测结果对比';['R^2=' num2str(R2)]};
title(string)

　　

转载于:https://www.cnblogs.com/fangxiaoqi/p/11306545.html

你可能感兴趣的:(BP神经网络)

机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测墨枣机器学习算法神经网络分类人工智能
机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测本项目链接：https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc1.算法简介和应用1.1算法简介BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经
python 随机数随机种子 AI算法网奇 python宝典 python 开发语言后端
目录神经网络推理随机种子gpu新版：神经网络推理随机种子gpu：神经网络推理随机种子含npu：numpy.full创建相同矩阵python生成n个随机整数python随机数种子，每次获取相同的随机数随机在区间M内取不重复的N个随机数取一个范围内均匀不重复的随机数神经网络推理随机种子gpu新版：defset_random_seed(seed):"""Setrandomseeds."""random.
2024Web前端人事面试题总结精选_前端面试项目相关提问 2401_86638424 面试职场和发展
api然后我们前端直接调用，当然如果后台还没写好就先自己造假数据来完成。平常都是用webpack来构建项目等等。2、你觉得你个性上最大的优点是什么？回答提示：沉着冷静、条理清楚、立场坚定、顽强向上、乐于助人和关心他人、适应能力和幽默感、乐观和友爱。3、说你最大的缺点？回答提示：这个问题企业问的概率很大，通常不希望听到直接回答的缺点是什么等，如果求职者说自己小心眼、爱忌妒人、非常懒、脾气大、工作效率
Transformer架构原理详解：多头注意力（MultiHead Attention） AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
Transformer,多头注意力,Multi-HeadAttention,机器翻译,自然语言处理,深度学习1.背景介绍近年来，深度学习在自然语言处理（NLP）领域取得了显著进展。传统的循环神经网络（RNN）在处理长序列数据时存在效率低下和梯度消失等问题。为了解决这些问题，谷歌于2017年提出了Transformer架构，并将其应用于机器翻译任务，取得了突破性的成果。Transformer的核心创
每天一篇逻辑漏洞不灭锦鲤学习
前言：本篇文章有b站博主，浪客剑心2510赞助发布某企业src中头像xss+cors利用_哔哩哔哩_bilibilixss+cors漏洞上传头像处存在xss漏洞，结合cors，获取其他用户敏感信息//上传一个正常的头像，服务器返回给图片地址，然后客户端在将这个img地址发送给服务器，下次在点击头像时，会加载一个图片地址，这样客户端就不用去服务器请求了，上传图片地址是打开bp拦截，然后修改为xss，
【Postgres_Python】使用python脚本批量导出PG数据库萌小丹Fighting Postgres_Python 数据库
示例代码说明：有多个数据库需要导出为.sql格式，数据库名与sql文件名一致,读取的数据库名需要根据文件名进行拼接importpsycopg2importsubprocessimportosfolder_path='D:/HQ/chongqing_20241112'#获取文件夹下所有文件和文件夹的名称filenames=[fforfinos.listdir(folder_path)ifos.pat
人类大脑与大规模神经网络的对比及未来展望东方佑量子变法神经网络人工智能深度学习
引言随着人工智能（AI）技术的迅猛发展，研究人员不断尝试构建更加复杂和强大的模型，以期实现与人类大脑相媲美的智能水平。本文将探讨当前大规模神经网络（LLM,LargeLanguageModels）的发展现状，并基于现有数据对未来进行预测。特别地，我们将分析达到人类大脑突触连接规模所需的时间框架、可能面临的挑战以及使用转义词表技术所带来的优势。人类大脑的基本结构人类大脑是一个极其复杂的系统，包含大约
一文大白话讲清楚webpack基本使用——8——开发环境和生产环境的配置和区别 16年上任的CTO webpack webpack 前端 node.js webpack开发环境 webpack生产环境
一文大白话讲清楚webpack基本使用——8——开发环境和生产环境的配置和区别1.建议按文章顺序从头看，一看到底，豁然开朗第一篇：一文大白话讲清楚啥是个webpack第二篇：一文大白话讲清楚webpack基本使用——1——完成webpack的初步构建第三篇一文大白话讲清楚webpack基本使用——2——css相关loader的配置和使用第四篇一文大白话讲清楚webpack基本使用——3——图像相关
npm和webpack学习 fechild npm webpack 学习
npmnpmnpminstallxxxnpminstallxxx--savenpminstallxxx--save-dev安装在node_modules不在package.json安装在node_modules，在package.json的dependencies，生产环境打包时，会出现在依赖包里。安装在node_modules，在package.json的devDependencies，生产环境
Webpack、Vite区别知多少？ brrdg_sefg webpack 前端 node.js
前端的项目打包，我们常用的构建工具有Webpack和Vite，那么Webpack和Vite是两种不同的前端构建工具,那么你们又是否了解它们的区别呢？我们在做项目时要如何选择呢？一、工具定义1、Webpack：是一个强大的静态模块打包工具，它可以将各种类型的文件，如JavaScript、CSS、图片等，作为模块进行打包，并生成最终的静态资源文件。Webpack使用各种loader和plugin来处理
深度学习模型开发文档 Ares代码行者深度学习
深度学习模型开发文档1.简介2.深度学习模型开发流程3.数据准备3.1数据加载3.2数据可视化4.构建卷积神经网络(CNN)5.模型训练5.1定义损失函数和优化器5.2训练过程6.模型评估与优化6.1模型评估6.2超参数调优7.模型部署8.总结参考资料1.简介深度学习是人工智能的一个分支，利用多层神经网络从数据中提取特征并进行学习。它被广泛应用于图像识别、自然语言处理、语音识别等领域。本文将以构建
联邦学习中客户端发送的梯度是vector而不是tensor wzx_Eleven 联邦学习机器学习网络安全人工智能
在联邦学习中，当本地使用神经网络或深度学习模型时，训练的梯度通常是与模型参数（权重和偏置）相对应的梯度数据。具体来说，梯度的类型和形状取决于模型的结构（例如，卷积神经网络、全连接网络等），以及模型的层数、每层的神经元数量等因素。1.梯度类型：梯度是一个张量：在神经网络中，梯度通常是一个张量（tensor），每一层的梯度张量的形状和该层的权重形状相匹配。具体来说，梯度是损失函数对每个参数的偏导数，表
使用 Python结合ffmpeg 实现单线程和多线程推流浪浪山小白兔 python ffmpeg opencv
一、引言在本文中，我们将详细介绍如何使用Python进行视频的推流操作。我们将通过两个不同的实现方式，即单线程推流和多线程推流，来展示如何利用cv2（OpenCV）和subprocess等库将视频帧推送到指定的RTMP地址。这两种方式都涉及到从摄像头读取视频帧，以及使用ffmpeg命令行工具将视频帧进行编码和推流的过程。二、单线程推流以下是单线程推流的代码：importcv2ascvimports
conv2former模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能 python 神经网络 conda
模型背景在Conv2Former模型提出之前，视觉识别领域的研究主要集中在两个方向：传统卷积神经网络（ConvNets）新兴的视觉Transformer（ViTs）ConvNets通过堆叠基本模块和采用金字塔结构取得了显著进展，但往往忽略了全局上下文信息的显式建模。ViTs则通过自注意力机制有效捕捉全局依赖关系，在多个视觉任务中展现出优异性能。然而，ViTs在处理高分辨率图像时面临计算成本过高的问
爬虫笔记21——DrissionPage自动化框架的使用墨菲马爬虫笔记爬虫笔记自动化
DrissionPage自动化框架的使用前言DrissionPage的使用1、准备工具及初步了解2、ChromiumPage的使用（操作浏览器）访问页面初始化配置元素定位iFrame切换元素监听动作链的简单使用3、SessionPage的使用（收发数据包）4、WebPage前言有人说，自动化框架降低了逆向的成本，当遇到不会的逆向，我用自动化解决问题，这其实是有道理的，哈哈哈~。但是，自动化框架其实
Python用 subprocess编写超时进程控制脚本 Steffen Python
一直都寻找在Python下方便控制子进程运行时间的脚本。虽然网上有很多的好方法，但是都不能满足我的需求（也是我资质太低看别人的脚本总感觉太吃力，总有些看不明白的地方）。下面这个脚本和网上一样利用了subprocess函数创建一个子进程控制脚本。（闲话少说，直接上菜！！！）#!/usr/bin/pythonimportsubprocess,timedefTest_ilo():ilo_ip='10.2
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
DCGAN - 深度卷积生成对抗网络：基于卷积神经网络的GAN 池央生成对抗网络 cnn 深度学习
深度卷积生成对抗网络（DCGAN，DeepConvolutionalGenerativeAdversarialNetwork）是生成对抗网络（GAN）的一种扩展，它通过使用卷积神经网络（CNN）来实现生成器和判别器的构建。与标准的GAN相比，DCGAN通过引入卷积层来改善图像生成质量，使得生成器能够生成更清晰、更高分辨率的图像。DCGAN提出了一种通过卷积结构来提高图像生成效果的策略，并在多个领域
分享一个基于webpack5 + react + antd的空后台,优化的不错,拿来即用
这是一个空的react+antd管理后台，只需要开发页面就能让它成为你想要的管理系统线上地址：https://chenlong-io.github.io/react-admin/index.html项目地址：https://github.com/chenlong-io/react-admin欢迎Star和提供更好的建议概述该管理后台基于webpack5、react@17、react-router@
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
python自动化系列：自动抓取网站文章的工具豆本-豆豆奶零基础教程 Python教程 Python python 自动化开发语言
作品介绍作品名称：自动抓取网站文章的工具用到的库：requests、bs4、urllib.parse、logging、subprocess、os、tempfile作品简介：该实例用于自动抓取特定网站文章并将其保存为Word文档(.docx)的脚本。它使用了requests库来获取网页内容，BeautifulSoup从bs4库中解析HTML，urljoin从urllib.parse模块中构建完整的U
【深度学习】Pytorch：在 ResNet 中加入注意力机制 T0uken 深度学习 pytorch 人工智能
在这篇教程中，我们将介绍如何在ResNet网络中加入注意力机制模块。我们将通过对标准ResNet50进行改进，向网络中添加两个自定义的注意力模块，并展示如何实现这一过程。为什么要加入注意力机制注意力机制可以帮助神经网络专注于图像中重要的特征区域，从而提高模型的性能。在卷积神经网络中，加入注意力机制能够有效增强特征提取能力，减少冗余信息的干扰，尤其在处理复杂图像时，能够提升网络的表现。在本教程中，我
2025美赛数学建模-备战2025数学建模美赛——神经网络预测模型详解 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模算法 2025年数学建模美赛 2025年 2025年美赛神经网络人工智能
（全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
vue项目报错取消页面红色遮罩（Uncaught runtime errors）菜鸟许良个人笔记 vue.js javascript 前端
1.取消前2.vue.config.js里面添加overlay:falseconstpath=require("path");constresolve=(dir)=>{returnpath.join(__dirname,dir);};module.exports={publicPath:"./",transpileDependencies:[],chainWebpack:(config)=>{co
深入理解GPT底层原理--从n-gram到RNN到LSTM/GRU到Transformer/GPT的进化网络安全研发随想 rnn gpt lstm
从简单的RNN到复杂的LSTM/GRU,再到引入注意力机制,研究者们一直在努力解决序列建模的核心问题。每一步的进展都为下一步的突破奠定了基础,最终孕育出了革命性的Transformer架构和GPT大模型。1.从n-gram到循环神经网络(RNN)的诞生1.1N-gram模型在深度学习兴起之前,处理序列数据主要依靠统计方法,如n-gram模型。N-gram是一种基于统计的语言模型,它的核心思想是:一
成功解决error while loading shared libraries: libpython2.7.so.1.0: cannot open shared object file: No su 哎呦，帅小伙哦安装
安装了python2.7，第一次执行时报错：errorwhileloadingsharedlibraries:libpython2.7.so.1.0:cannotopensharedobjectfile:Nosuchfileordirectory解决方法如下：1.编辑vi/etc/ld.so.conf如果是非root权限帐号登录，使用sudovi/etc/ld.so.conf添加上python2.
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他