咸鱼酱

#DeepLearningBook#Chapter 6 Deep Feedforward Networks [1]

Content

6.1 Example: XOR
6.2 Gradient-Based Learning
　　6.2.1 Cost Function
　　　6.2.1.1 Learning Conditional Distributions with Maximum Likelihood
　　　6.2.1.2 Learning Conditional Statistics
　　6.2.2 Output Units
　　　6.2.2.1 Linear Units for Gaussian Output Distributions
　　　6.2.2.2 Sigmoid Units for Bernoulli Output Distributions
　　　6.2.2.3 Softmax Units for Multinoulli Output Distributions
　　　6.2.2.4 Other Output Types
6.3 Hidden Units
　　6.3.1 Rectified Linear Units and their Generalizations
　　6.3.2 Logistic Sigmoid and Hyperbolic Tangent
　　6.3.3 Other Hidden Units
6.4 Architecture Design
　　6.4.1 Universal Approximation Properties and Depth
　　6.4.2 Other Architecture Considerations
6.5 Back-Propagation and Other Differentiation Algorithms
　　6.5.1 Computational Graphs
　　6.5.2 Chain Rule of Calculus
　　6.5.3 Recursively Applying the Chain Rule to Obtain Backprop
　　6.5.4 Back-Propagation Computation in Fully-Connected MLP
　　6.5.5 Symbol-to-Symbol Derivatives
　　6.5.6 General Back-Propagation
　　6.5.7 Example: Back-Propagation for MLP Training
　　6.5.8 Complications
　　6.5.9 Differentiation outside the Deep Learning Community
　　6.5.10 Higher-Order Derivatives
6.6 Historical Notes
　　　　

说在前面的话：

1. 什么是Deep feedforward networks？

前馈深度网络（Feedforward Deep Networks\feedforward neural networks），也称为多层感知机（multi-layer perceptrons(MLPs)）。它的目的是找到一个最佳的映射 y=f(x) ，将输入x映射到一个类别y中。同时，这个映射可以表示为 y=f(x,θ) 。而Deep feedforward networks就是要找出这个 θ ，使得我们得到的这个 f 可以以一定程度地逼近真实的f∗。
补充一点，对于MLPs而言，是不存在输出反馈给自己的回路的。如果存在的话，这个神经网络就是recurrent neural networds(RNN)。原文上写的是There are no feedback connections in which outputs of the model are fed back into iteself.这里个人目前还不是很理解outputs fed back into iteself的具体概念，等待后期学习。

2. 几个补充概念

output layer: 前馈网络的最后一层。
hidden layer: 对于一个完整的神经网络，除去输入层和输出层的其他部分。
first layer: 输入层后的第一层，注意输入层并不是第一层。

3. 神经网络的非线性性

神经网络使用的依旧是线性模型，但是该线性模型的作用对象并非输入 x ，而是x的一个经过非线性函数处理的变形体 ϕ(x) 。关于 ϕ(x) 的选择可以参考以下几点：
(1) ϕ(x) 的维数问题：简单来说， ϕ(x) 是可以利用好核的（kernel trick），比如RBF(径向基函数)。这里可以参考http://blog.csdn.net/cwcww1314/article/details/52425152。然而维数可以理解为这个变形体对Training set的特征的一个抽象和表达能力。维数越高，这个能力越强，但同时它的泛化能力就越弱。这里个人认为考虑的是一个模型复杂度引起的过拟合和欠拟合的问题。
(2) 在有深度学习之前，人们一直要用很多精力来完成这个manually engineer ϕ ，但具体这个manually engineer用到了那些步骤和方法，我也不是很懂啦。O(∩_∩)O~
(3) 在深度学习里，学习 ϕ 一般是使用模型：

y = f (x; θ, ω) = ϕ (x; θ) T ω

其中

ω 连接

ϕ(x) 和output layer。

θ 是我们需要使用某种优化算法计算获得的参数。在这里，

ϕ(x) 只需要人为给定一个概率分布家族就好，而不需要像(2)中一样精确为一个最优的概率函数。

6.1 Example: XOR

一个简单的例子，讨论神经网络的非线性性。
XOR这个函数本身就是非线性的，图1可以看出，不可能画出一根直线，把这四个点分成期望的两个类：

#DeepLearningBook#Chapter 6 Deep Feedforward Networks [1]_第1张图片

Figure 1

于是我们建立一个简单的前馈神经网络，如图2所示：

#DeepLearningBook#Chapter 6 Deep Feedforward Networks [1]_第2张图片

Figure 2

这个网络可以用下面的表达式来表达：

h ⃗ = f (1) (x ⃗; W ⃗, c ⃗)

y = f (2) (h ⃗; w ⃗, b)

总结来说就是：

f (x ⃗; W ⃗, c ⃗, w ⃗, b) = f (2) (f 1 (x))

而

f(1) 必须是一个非线性函数，这个非线性函数在神经网络中成为激活函数(Activation function)。假如说

f(1) 是一个线性函数，那么会导致

f 也是一个线性函数，简证如下（考虑bias = 0）：
Suppose

f (1) (x) = W ⃗ T x ⃗

f (2) (x) = h ⃗ T w ⃗

Then

f (x) = w ⃗ T W ⃗ T x ⃗

这样的话

f(x) 从本质上来说还是线性的。
因此对于隐藏层

h⃗ =g(W⃗ Tx⃗ +c⃗ ) ，

W⃗ 提供的是权值Weights，而

c⃗ 提供的是Bias。目前

g(x) 通常取为rectified linear units(ReLU)，即

g(z)=max(0,z) 。关于ReLU更多，请参考 https://www.zhihu.com/question/29021768。所以我们的网络可以表达为：

f (x ⃗; W ⃗, w ⃗, c ⃗, b) = w ⃗ T m a x (0, W ⃗ T x ⃗ + c ⃗) + b

具体求解过程在这个章节也怎么重要啦~到这里为止只需要明白1. 神经网络区别于Logistic Regression等可以处理非线性的问题; 2. 神经网络如果要想完成自己非线性分类的功能，其激活函数（Activation function）必须是个非线性函数，比如ReLU。

#DeepLearningBook#Chapter 6 Deep Feedforward Networks [1]_第3张图片

Figure 3. ReLU Function

6.2 Gradient -Based Learning

神经网络的非线性性导致了它相应的损失函数（loss functions）编程了非凸函数。这意味着神经网络需要通过迭代式的、基于梯度的优化器随机梯度下降（Stochastic gradient descend），这个优化器逐步将损失函数的值降到局部最低值，且这个值极大依赖于初值点。然而对于诸如Logistic Regression和SVM由于它们优化的目标函数都是凸函数，因此可以直接收敛到全局最优值。

6.2.1 Cost Function

一般训练神经网络的总Cost function由两部分组成：原始的cost function(比如likelihood, 训练集和预测集的cross-entropy)以及一个regularization term。
For more information concerning regularization term, please refer to http://blog.csdn.net/zouxy09/article/details/24971995/。

6.2.1.1 Learning Conditional Distributions with Maximum Likelihood

一种比较常见的损失函数就是-log likelihood了。它等价于training data和the model distribution之间的交叉熵(cross-entropy)。关于交叉熵的更多https://www.zhihu.com/question/41252833。用数学公式表达：

J (θ ⃗) = - E x ⃗, y ⃗ \sim P^d a t a [l o g P m o d e l (y ⃗ | x ⃗)]

而我们需要做的事情即是最小化这个loss function

J(θ⃗ ) 。
好，上面这些都是常识。下面则是关于设计神经网络中Cost function选择的原则：
Cost function的梯度值一定要足够大，来为我们的学习算法提供一个可靠的优化方向。饱和了的损失函数会比较平坦，因而不能完成优化的任务。隐藏层的激励函数和输出层的饱和经常导致损失函数发生饱和而难以进一步优化。（？这里个人暂时不是很能理解前向通道的饱和与损失函数的饱和之间的关系）Negative log-likelihood可以帮助很多模型解决上述问题。譬如说对于一个exp(x)函数，它在x<0的区间内基本上就饱和并且flat了。但是如果对这个exp(x)取一个log，那么这个函数即使是在x<0的时候也有一个比较可观的下降梯度。

6.2.1.2 Learning Conditional Statistics

这一节主要说的是一个学习的思想，在做这个学习的时候，我们优化的对象不再是一个固定函数类的对应参数，而是函数本身。而这一块需要的是变分方面的知识（calculus of variations）。例如有以下两种方法：
Mean squared error

f * = a r g m i n f E x ⃗, y ⃗ \sim P d a t a | | y ⃗ - f (x ⃗) | | 2

Mean absolute error

f * = a r g m i n f E x ⃗, y ⃗ \sim P d a t a | | y ⃗ - f (x ⃗) | |

但这两个损失函数十分容易饱和，造成优化效果不佳。因此还是交叉熵在这种情况下有更好的效果。具体如何使用这里不详述。

6.2.2 Output Units

为什么我们需要一个合适的Output Units？
因为Output units会影响最终cost function（cross-entropy）的形式。

6.2.2.1 Linear Units for Gaussian Output Distributions

线性output layer简单用公式表达就是：

y^\to = W ⃗ T h ⃗ + b ⃗

Linear output layer经常用在生成条件高斯分布均值上(Conditional Gaussian Distribution)，即

p(y⃗ |x⃗ )=N(y⃗ ;y^→,I⃗ ) 。因为在这种情况下maximizing the log-likelihood就相当于是minimizing the mean squared error。
另外，线性的output layer不会发生饱和。因此对于基于梯度的优化算法，这样的输出层不会对其造成负面的影响。

6.2.2.2 Sigmoid Units for Bernoulli Output Distributions

先来回忆一发：
Bernoulli distribution 有一个糖两个小朋友，随机给一个小朋友
Binomial distribution 有很多个糖和两个小朋友，随机分配糖
Categorical distribution 有一个糖很多小朋友，随机给一个小朋友
Multinomial distribution 有很多糖和很多小朋友，随机分配糖
下面正题：
Sigmoid Units主要是用在伯努利问题的输出层上。因为这个时候输出y确定是2类中的一类。这个神经网络需要预测的是 P(y=1|x)ϵ[0,1] 。
假如说我们选用的output layer是线性的，譬如下式：

P (y = 1 | x) = m a x {0, m i n {1, w ⃗ T h ⃗ + b}}

但是经常出现的问题就是，

P(y=1|x) 落在了[0, 1]这个区域外面。而上面的这个函数在区域外的梯度都是0，这会导致我们的优化算法没有了优化的方向。所以我们就要用Sigmoid units了。
Sigmoid units：

y^= σ (w ⃗ T h ⃗ + b)

σ (x) = 1 1 + e - x

Sigmoid output unit可以看作两步：
(1)

z=w⃗ Th⃗ +b
(2)利用sigmoid activation function将z转化为probability。
在这种情况下

P(y) 的和一般都不会为1。这个时候需要Normalize概率的分布。（这里Normalize的推导并没有看懂…马克一下…）
（

logP⃗ (y)=yz 个人认为可以理解为y表征的是符号，z表征的是数值。因此在这种情况下人为定义

P⃗ (y)=eyz 。）
总之就是在normalize之后有

P (y) = σ ((2 y - 1) z)

J (θ ⃗) = - l o g σ ((2 y - 1) z) = ζ ((1 - 2 y) z)

ζ(x)=log(e−x+1) 叫做softplus function，它当且仅当

(1−2y)z 非常负的时候才会饱和。这个时候一般是y = 0，z负得厉害；或是y = 1，z正得厉害。output layer工作正常的时候和上面的情况是契合的。因而这个特性可以帮助那些以梯度为工作基础的优化算法修正错误，收敛到正确的答案处。

你可能感兴趣的:(AI读书笔记,深度学习,神经网络)

【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
DeepSeek来袭！低代码+AI竟让程序员摸鱼接私单月入5W！工业甲酰苯胺低代码人工智能
目录一、引言：开启低代码+AI新时代二、DeepSeek与低代码、AI的关联（一）DeepSeek简介（二）低代码开发概述（三）AI赋能低代码三、低代码+AI开启私单赚钱大门（一）成功案例剖析（二）私单项目类型（三）赚钱模式解析四、实战：利用DeepSeek接私单（一）工具准备与环境搭建（二）需求分析与项目规划（三）低代码开发实战（四）AI技术融合应用（五）项目测试与交付五、挑战与应对策略（一）技
IncDec Sequence（洛谷P4552） GordenGhost java 算法开发语言洛谷差分模拟
importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intn=sc.nextInt();intw[]=newint[n+2],cnt[]=newint[n+2];for(inti=1;i=0)a+=cnt[i];elseb-=cnt[i]
【Q&A】Qt中直接渲染和离屏渲染效率哪个高？浅慕Antonio Q&A qt 信息可视化开发语言
直接渲染和离屏渲染的效率取决于具体场景和实现方式，以下是详细对比分析：一、直接渲染（On-screenRendering）原理直接将图形数据绘制到屏幕缓冲区（BackBuffer），完成后通过交换缓冲区显示到屏幕。通常在paintEvent等事件中通过QPainter直接绘制。优势减少数据复制：无需额外的缓冲区传输，直接写入屏幕缓冲区。实时性高：适合需要快速更新的场景（如动画、实时数据可视化）。简
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
cv2 orb 图像拼接_图像拼接Opencv源码重构是佐罗而非索隆 cv2 orb 图像拼接
请看赵春江https://me.csdn.net/zhaocj的主页，他已经对Opencv图像拼接流程中的代码做了很详细的解释。前人栽树，后人乘凉。一.本文所做的事1.重构了Opencv图像拼接的源代码，整个代码是面向过程的；2.在赵春江源码分析基础上，对一些细节部分进行说明。代码链接：https://github.com/mhhai/ImageStitch二.特征点检测一切起源于这段代码Ptrf
OpenCV图像拼接（2）基于羽化（feathering）技术的图像融合算法拼接类cv::detail::FeatherBlender 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::FeatherBlender是OpenCV中用于图像拼接的一个类，它属于stitching模块的一部分。这个类实现了基于羽化（feathering）技术的图像融合算法，用于平滑地混合重叠区域中的图像，从而生成无缝的全景图。主要特点羽化技术：
OpenCV图像拼接（1）自动校准之校准旋转相机的函数calibrateRotatingCamera() 村北头的码农 OpenCV opencv 人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::calibrateRotatingCamera是OpenCV中用于校准旋转相机的函数。它特别适用于那种相机相对于一个固定的场景进行纯旋转运动的情况，比如在全景拼接过程中。此函数可以从一系列单应性矩阵（HomographyMatrices）中
在网页跑3D多人互动之渲染效能瓶颈微网兔子後端技術前端网络服务器 c++unity 架构 3d
累积到目前测试回馈给我们的心得，主要问题还是在前端显示的部分。所以就来聊聊在网页跑3D多人互动之渲染效能瓶颈!!!数万个3D角色与场景物件需即时渲染，导致GPU/CPU过载，低端设备卡顿。已经使用的解决方案：LOD（LevelofDetail）技术：根据距离动态调整模型细节，远距离使用低多边形模型。InstancedRendering：批次渲染相同模型（如重复的树木、建筑物）。Culling（剔除
OpenAI 发布新一代 STT/TTS 模型，10 行代码构建 Voice Agent；声网推出对话式 AI 开发套件丨日报人工智能
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。本期编辑：@qqq、@鲍勃01有话题的技术1、OpenAI推出全新一代音频模型今日凌晨，Open
如何选择适合团队沟通管理的AI工具人工智能团队沟通团队协作工具
在现代的工作环境中，团队合作离不开高效的沟通与协作。尤其是当任务繁多、信息量庞大的时候，团队成员之间的沟通往往变得杂乱无章，效率低下。然而，在AI技术飞速发展的今天，许多智能工具应运而生，为团队带来了全新的解决方案。那么，是否有AI工具能够帮助团队打造高效顺畅的沟通与协作流程呢？答案是肯定的。通过集成AI助手、自动化任务和实时协作等功能，这些工具正逐步改变着团队协作的方式，让工作变得更加轻松、高效
Java使用FFmpegFrameGrabber进行视频拆帧，结合Thumbnails压缩图片保存到文件夹 Acmen-zym Java Java IO java 音视频开发语言
引入依赖net.coobirdthumbnailator0.4.17org.bytedecojavacv1.5.7org.bytedecojavacv-platform1.5.7视频拆帧处理publicstaticvoidmain(String[]args){Filefile=newFile("C:\\Users\\EDY\\Desktop\\frame");File[]files=file.li
【赵渝强老师】达梦数据库MPP集群的架构数据库信创
为了支持海量数据存储和处理等方面的需求，为高端数据仓库提供解决方案，达梦数据库提供了大规模并行处理MPP架构，以极低的成本代价，提供高性能的并行计算。通过使用MPP可以解决以下问题：需要较高的系统性能支持以支持大量的复杂查询操作硬件束缚对数据库响应能力的影响降低数据库成本视频讲解如下：https://www.bilibili.com/video/BV1dBftYoEkk/?aid=11386961
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期|数商云数商云网络 B2B系统数字化电商平台人工智能大数据云计算数据库运维 java spring
引言在数字经济时代，B2B（Business-to-Business）电子商务正在以前所未有的速度改变着企业的运营模式。随着交易量的不断攀升，传统的合同生成和审核流程逐渐成为制约交易效率的瓶颈。然而，随着人工智能（AI）技术的飞速发展，结合B2B系统的智能化升级，我们正见证一场合同生成效率的革命。本文将深入探讨“30秒生成电子合同：B2B系统+AI引擎缩短80%交易周期”这一创新模式，解析其背后的
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
关于神经网络中的激活函数文弱_书生乱七八糟神经网络人工智能深度学习
激活函数（ActivationFunction）详解理解首先煮波解释一下这四个字，“函数”相信大家都不陌生，能点进来看这篇文章说明你一定经历至少长达十年的数学的摧残，关于这个概念煮波就不巴巴了，煮波主要说一下“激活”，大家可能或多或少的看过类似于古装，玄幻，修仙等类型的小说或者电视剧。剧中的主角往往是天赋异禀或则什么神啊仙啊的转世，但是这一世他却被当成了普通人，指导某一时刻才会迸发出全部的能量（主
记20个忘10个之七：身体结构 nshkfhwr beauty美女 head头 body身 hand手 foot脚 lap大腿面 organ器官
记20个忘10个之七：身体结构附送几个单词：beautyn.美女lookern.靓女girln.女孩lassn.少女，年轻女子lassien.少女，小姑娘maidenn.少女，未婚女子maidn.女仆ladyn.女士；小姐hostessn.女主人；女房东mistressn.女主人，主妇；情妇blonden.金发女郎这样是不是很好记呀，^_^
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
python异步--asyncio HWQlet python python异步编程
在python2.x和python3.x早期版本的时候，协程的主流实现方法是gevent，这个我之前讲过asyncio在python3.4后内置在python中了，在后面还有async/await，更后面有aiohttp，flask实现就有参照aiohttpasync和await分别又来替换早期协程的asyncio.coroutine和yieldfrom。从此以后，协程就是python中一个新的语
关于神经网络中的正则化文弱_书生乱七八糟神经网络人工智能深度学习
神经网络训练中的正则化正则化（Regularization）是神经网络训练中的一个关键技术，主要用于防止模型过拟合（overfitting），提高泛化能力。1.为什么需要正则化？在神经网络训练过程中，模型的目标是找到能在训练数据上表现良好的参数，同时也能泛化到未见过的数据。如果一个模型过于复杂（如参数过多、层数过深），它可能会记住训练数据中的噪声，而不是学习数据的本质模式。这种情况称为过拟合（ov
Python异步编程 - asyncio库孤寒者 Python全栈系列教程 python 异步编程 asyncio yield 协程
目录：每篇前言：异步IOPython中的异步编程实现方式：协程Python传统协程示例：实现生产者-消费者模型消费者：生产者：运行流程：整体流程：传统协程——>现代协程：asyncio库async/await每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于爬虫必备前端技术栈专栏：《爬虫必备前端技术栈
（备忘） manjaro更换内核后 virtualBox 中打不开虚拟机（已经解决）波格斯特问题备忘 linux 内核
文章目录问题描述解决办法参考链接1问题描述更换完5.9内核后VirtualBox提示Kerneldrivernotinstalled(rc=-1908)"TheVirtualBoxLinuxkerneldriveriseithernotloadedornotsetupcorrectly.Pleasetrysettingitupagainbyexecuting'/sbin/vboxconfig'as
北斗导航｜接收机自主完好性监测算法研究现状及发展趋势单北斗SLAMer 卫星导航毕业论文设计算法
接收机自主完好性监测（RAIM）算法是保障卫星导航系统可靠性的核心技术，其研究现状与发展趋势可从算法设计、多系统融合、智能化技术等方面进行分析。以下基于现有研究成果及行业动态进行总结：一、研究现状传统故障检测算法RAIM的核心目标是通过冗余观测值检测并隔离故障卫星。早期研究聚焦单星故障场景，主要方法包括：残差分析法：通过比较观测残差与阈值判断故障，如最小二乘残差和法、奇偶矢量法等。距离比较法：基于
大学期间如何学习利用AI der丸子吱吱吱学习人工智能
一、引言人工智能（AI）是当今世界技术发展的重要方向，它已经渗透到医疗、金融、交通、娱乐等各个领域。随着AI技术的快速发展，它不仅改变了我们的生活，也带来了巨大的职业机会。然而，面对如此广阔的领域，作为大学生，如何在本科阶段有效地学习和利用AI，成了许多同学的困惑。本文将详细介绍大学生在本科阶段如何通过合理的学习路线、方法和工具，逐步掌握AI的核心技术，并为日后进入AI行业打下坚实的基础。通过这篇
ALO蚁狮优化算法：从背景到实战的全面解析 der丸子吱吱吱智能优化算法 ALO算法
目录引言背景2.1蚁狮优化算法的起源2.2自然启发式算法的背景2.3ALO的发展与应用原理3.1蚁狮的生物行为3.2ALO的数学建模3.3算法流程与关键步骤实战应用4.1函数优化问题4.2工程优化案例4.3组合优化与约束优化代码实现与结果分析5.1Python代码实现5.2实验设计与结果分析5.3性能评估与优化建议学习资源6.1工具推荐6.2网站与文献资源6.3ALO与AI结合的方法结论1.引言在
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他