张小殊.

神经网络常用激活函数详解

个人主页： https://zhangxiaoshu.blog.csdn.net
欢迎大家：关注+点赞+评论+收藏⭐️，如有错误敬请指正!
未来很长，值得我们全力奔赴更美好的生活！

前言

神经网络的激活函数是在每个神经元的输出上应用的非线性函数。激活函数的引入是为了给神经网络引入非线性特性，从而增强网络的表达能力，使其能够学习和表示更为复杂的关系。这篇文章主要介绍一些常见的神经网络激活函数，包括sigmoid、tanh、ReLU、Leoky ReLU、ReLU6和Softmax。

文章目录

前言
一、sigmoid
- 1.表达式及其图像：
- 2. Sigmoid激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
二、tanh
- 1. 表达式以及图像：
- 2. Tanh激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
三、ReLU
- 1.表达式及其图像：
- 2. ReLU激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
四、Leoky ReLU
- 1.表达式及其图像：
- 2. Leoky ReLU激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
五、ReLU6
- 1.表达式及其图像：
- 2. ReLU6激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
六、Softmax
- 1.表达式及其图像：
- 2. Softmax激活函数的优缺点：
- 3. 使用场景：
- 4. PyTorch代码：
总结

一、sigmoid

1.表达式及其图像：

Sigmoid激活函数是一种常用的非线性激活函数，通常用于神经网络的输出层，特别是在二分类问题中。其主要特点是将输入值映射到一个在 (0, 1) 范围内的输出，其数学表达式为：
$\sigma(x)=\frac{1}{1+e^{-x}}$

其中， $e$ 是自然对数的底。函数的图像呈 S 形曲线，中心点在 $x = 0$ 处，输出值在 $x$ 接近正无穷和负无穷时分别趋近于 1 和 0。

图像如下所示：

2. Sigmoid激活函数的优缺点：

优点：

输出范围在 (0, 1)： Sigmoid函数的输出范围在 (0, 1) 之间，可以被解释为概率值，特别适用于二分类问题，如判断一个样本属于某一类的概率。
平滑性： Sigmoid函数是光滑的、可导的函数，这在梯度下降等优化算法中很有用。

缺点：

梯度消失问题：Sigmoid函数在输入非常大或非常小的情况下，导数接近于零，可能导致梯度消失问题。在深度网络中，这可能影响训练的稳定性和速度。
输出非零均值： Sigmoid的输出均值接近于 0.5，这会导致下一层神经元得到的输入主要是正值，可能影响权重的更新效率。
计算复杂度：Sigmoid函数的计算涉及到指数运算，相对于一些计算简单的激活函数（如ReLU），计算复杂度较高。

3. 使用场景：

二分类问题： Sigmoid通常用于二分类问题的输出层，输出可以解释为样本属于某一类别的概率。
概率表示： 当需要将神经网络的输出解释为概率值时，Sigmoid是一个合适的选择。
输出范围限制： 在需要将输出限制在 (0, 1) 范围内的情况下，如图像生成等任务，Sigmoid可以确保输出在指定范围内。

尽管Sigmoid在过去被广泛使用，但由于其存在的梯度消失问题和其他缺点，近年来在深度学习中，一些其他激活函数如ReLU及其变体更受青睐。选择激活函数通常取决于具体的任务和网络结构。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
sigmoid_output = torch.sigmoid(x)

二、tanh

1. 表达式以及图像：

Tanh（双曲正切）激活函数是一种常用的非线性激活函数，其输出范围在 (-1, 1) 之间。其数学表达式为：

$tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}}$

Tanh函数在形状上类似于Sigmoid函数，但其输出范围更广，从 -1 到 1，均值接近于 0。与Sigmoid相比，Tanh对输入的响应更强烈，可以更好地处理具有负值的输入。

图像如下所示：

2. Tanh激活函数的优缺点：

优点：

归一化输出： Tanh的输出范围在(-1, 1)之间，相比于Sigmoid的(0, 1)，输出更接近于零均值，有助于减小梯度消失问题，提高模型的训练稳定性。
激活强度较大： Tanh对输入的响应相对更强烈，这有助于模型学习更复杂的特征和表示，使其在某些任务上比Sigmoid更有效。
零中心化： Tanh的输出均值接近零，有助于减小下一层神经元接收到的输入的均值，有助于提高网络的拟合能力。

缺点：

梯度消失问题：虽然相对于Sigmoid，Tanh缓解了梯度消失问题，但仍然可能在深度网络中存在。对于极端值的输入，Tanh函数的导数仍然会趋近于零。
计算复杂度： Tanh函数的计算同样涉及到指数运算，相对于一些计算简单的激活函数（如ReLU）而言，计算复杂度较高。

3. 使用场景：

中间层的激活函数： Tanh通常在神经网络的中间层中使用，特别是在循环神经网络（RNN）等结构中，有助于处理具有正负值的输入。
具有零均值要求的场景： 当输入数据有零均值要求时，Tanh激活函数可能更适用，因为它的输出均值接近零。
二分类问题： 在二分类问题中，Tanh可以用作输出层的激活函数，尤其是当输出需要在 (-1, 1) 范围内表示时。

总体而言，Tanh激活函数在某些场景下可以取代Sigmoid，并且相对于Sigmoid来说，具有更广的输出范围和更强的响应能力。然而，使用时需要注意梯度消失问题以及计算复杂度。在深度学习中，ReLU及其变体目前是更为常见的选择之一。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
tanh_output = torch.tanh(x)

三、ReLU

1.表达式及其图像：

ReLU（Rectified Linear Unit）是一种常用的非线性激活函数，其数学表达式为：
$f (x) = ma x (0, x)$
即，对于输入 $x$ ，如果 $x$ 大于零，输出为 $x$ ；否则，输出为零。ReLU函数是一个简单而有效的激活函数，它在神经网络中被广泛使用。其特点是在正值区域上保持线性增长，同时在负值区域上输出为零。

图像如下所示：

2. ReLU激活函数的优缺点：

优点：

计算简单： ReLU函数的计算非常简单，只需要一个阈值比较和取最大值的操作，相比于Sigmoid和tanh等函数的指数运算，计算速度更快。
稀疏激活性： ReLU激活函数在正值区域上保持线性增长，有助于网络的稀疏激活性，即只有少数神经元被激活，使网络更加稀疏。
解决梯度消失问题：相比于Sigmoid和tanh等激活函数，ReLU在正值区域上没有梯度饱和问题，可以缓解梯度消失问题，有助于训练深度网络。

缺点：

死亡神经元问题：在训练过程中，某些神经元可能永远不会被激活，称为“死亡神经元”问题。如果某个神经元在训练过程中对于所有样本都是负的，那么该神经元的权重将永远不会被更新。
不适合所有情况：对于一些数据分布特殊的任务，ReLU可能表现不佳。例如，在处理负值较多的数据时，可能导致大量神经元死亡。

3. 使用场景：

深度神经网络： ReLU在深度神经网络中广泛应用，特别是在卷积神经网络（CNN）和循环神经网络（RNN）等结构中，因为它有助于解决梯度消失问题。
计算资源受限的环境： 由于ReLU的计算简单，适用于资源受限的环境，例如移动设备、嵌入式系统等。
稀疏激活性要求： 当稀疏激活性是一个设计考虑因素时，ReLU是一个合适的选择，因为它更容易使网络保持稀疏性。

总体而言，ReLU是深度学习中常用的激活函数之一，尤其在解决梯度消失问题和提高计算效率方面表现优越。然而，需要注意一些可能出现的问题，如死亡神经元问题。在实际应用中，有时会采用ReLU的变体（如Leaky ReLU等）以缓解一些潜在问题。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
relu_output = F.relu(x)

四、Leoky ReLU

1.表达式及其图像：

Leaky ReLU是对标准ReLU激活函数的一种改进，旨在解决ReLU中可能出现的“死亡神经元”问题。Leaky ReLU允许在负值区域有一个小的斜率，而不是直接输出零。其数学表达式为：
$f(x)=\left\{\begin{array}{ll} x, & \text { if } x>0 \\ \alpha x, & \text { if } x \leq 0 \end{array}\right.$

其中， $\alpha$ 是一个小的正数，通常很小，比如 0.01。Leaky ReLU保留了负值区域，这有助于避免某些神经元在训练中变得“死亡”。

图像如下所示：

2. Leoky ReLU激活函数的优缺点：

优点：

避免死亡神经元问题： Leaky ReLU允许在负值区域有一个小的斜率，这有助于保持负值区域的梯度，避免神经元在训练过程中变得“死亡”。
简单计算：与ReLU相比，Leaky ReLU的计算仍然相对简单，只需添加一个额外的斜率。
稀疏激活性： Leaky ReLU保持了一定的稀疏激活性，即仍然有神经元保持非零输出。

缺点：

不一定适用于所有情况：尽管Leaky ReLU解决了死亡神经元问题，但它并不一定在所有任务中都表现得比标准ReLU更好。在某些数据分布下，Leaky ReLU可能仍然存在一些问题。
选择斜率的问题：选择 $\alpha$ 的值通常是一个超参数，需要进行调优。选择不当可能导致一些问题，过小的 $\alpha$ 可能无法解决死亡神经元问题，而过大的 $\alpha$ 可能导致Leaky ReLU失去ReLU的优势。

3. 使用场景：

深度神经网络： Leaky ReLU在深度神经网络中被广泛应用，尤其是在解决死亡神经元问题方面。
需要稀疏激活性： 当需要保持一定的稀疏激活性时，Leaky ReLU可以是一个合适的选择。
不确定数据分布： 在处理不同数据分布的任务时，Leaky ReLU可能是一个更健壮的激活函数选择，相对于ReLU在某些情况下可能表现得更好。

总体而言，Leaky ReLU是对标准ReLU的一种改进，通过引入一个小的负斜率解决了死亡神经元问题。在实际应用中，可以根据具体任务和数据分布选择合适的激活函数。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
leaky_relu_output = F.leaky_relu(x, negative_slope=0.01)  # 可根据需求调整负斜率

五、ReLU6

1.表达式及其图像：

ReLU6（Rectified Linear Unit 6）是对ReLU的一种变体，它在正值区域上仍然保持线性增长，但在负值区域上截断，并将负值限制在零以下。其数学表达式为：

$f (x) = min (ma x (0, x), 6)$

即，对于输入 $x$ ，如果 $x$ 大于零，输出为 $x$ ；如果 $x$ 小于等于零，输出为零；如果 $x$ 大于6，输出为6。ReLU6的主要特点是在负值区域上的截断，将负值限制在零以下，并且在正值区域上允许线性增长，最大值限制为6。

图像如下所示：

2. ReLU6激活函数的优缺点：

优点：

抑制过大的激活值：通过将激活值限制在6以下，ReLU6有助于抑制激活值的过大增长，使得网络的表示范围更受控制，尤其是在计算资源受限的环境中使用低精度的时候也能有很好的数值分辨率（低精度的Float 16 / INT 8无法很好地精确大范围的数值）。
计算简单：类似于ReLU，ReLU6的计算仍然相对简单，只需要比较和取最小值和最大值的操作。

缺点：

不适用于所有场景： ReLU6在一些任务和数据分布上可能表现不佳。对于一些特定的任务，可能有更适合的激活函数选择。

3. 使用场景：

限制激活值范围： 当需要限制激活值的范围，避免过大的激活值对网络造成负面影响时，ReLU6可以作为一种选择。
计算资源受限的环境： 由于ReLU6的计算仍然相对简单，适用于计算资源受限的环境，例如移动设备、嵌入式系统等。
对输入范围有要求的任务： 当输入数据有特定的范围要求时，ReLU6可以用来限制输出在一个固定的范围内。

总体而言，ReLU6是对ReLU的一种变体，主要通过将激活值限制在6以下来抑制激活值的过大增长。在实际应用中，选择激活函数通常要根据具体的任务和网络结构进行调整。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
relu6_output = F.relu6(x)

六、Softmax

1.表达式及其图像：

Softmax激活函数是一种常用于多分类问题的激活函数。它接受一个实数向量作为输入，并将其转换成一个概率分布。Softmax函数的数学表达式为：

$Softmax(z)_i=\frac{e^{z_{i} }}{ {\textstyle \sum_{j=1}^{K}} e^{z_{j} }}$

其中， $z$ 是输入向量的元素， $K$ 是类别的总数。Softmax函数对输入向量进行指数运算，然后进行归一化，使得输出的各个元素表示对应类别的概率，且概率之和为1。

图像如下所示：

2. Softmax激活函数的优缺点：

优点：

概率表示： Softmax将输入映射为概率分布，适用于多分类问题，输出的各个元素可以解释为对应类别的概率。
可导性： Softmax是可导的，这使得在使用梯度下降等优化算法进行训练时更容易处理。

缺点：

对输入敏感： Softmax对输入的敏感性较高，当输入中存在较大的值时，指数运算可能导致数值溢出（数值过大）或数值不稳定的问题。
类别之间相关性： Softmax假设各个类别是独立的，可能无法很好地处理类别之间的相关性。
标签不平衡：在处理标签不平衡的情况下，Softmax可能导致模型更加关注样本较多的类别，而对样本较少的类别学习不足。

3. 使用场景：

多分类问题： Softmax主要用于解决多分类问题，其中需要将输入映射为各个类别的概率分布。
输出层激活函数： Softmax通常作为神经网络输出层的激活函数，特别适用于需要将网络输出解释为概率分布的场景。
需要概率表示的任务： 当任务需要模型输出概率表示时，例如图像分类、语音识别等，Softmax是一个常用的选择。

总体而言，Softmax激活函数在多分类问题中表现出色，提供了一种将神经网络输出转换为概率分布的方式。然而，在一些特殊情况下，可能需要注意其对输入的敏感性以及类别之间的相关性问题。

4. PyTorch代码：

import torch
import torch.nn.functional as F

x = torch.randn(5, 5)
softmax_output = F.softmax(x, dim=1)

总结

在深度学习中，激活函数的选择对模型的性能和训练过程至关重要。以下是以上6种激活函数的简单总结及其使用建议：

Sigmoid激活函数：输出范围在 (0, 1)，适用于二分类问题，但容易导致梯度消失问题。适用于二分类问题的输出层，不建议在隐藏层使用，可以考虑其他更有效的激活函数。
Tanh激活函数： 输出范围在 (-1, 1)，零中心化，相对缓解了梯度消失问题。适用于隐藏层，特别是需要输出在 (-1, 1) 范围的任务。
ReLU激活函数：简单计算，解决了梯度消失问题，但可能导致死亡神经元问题。在隐藏层中广泛使用，特别适用于深度神经网络和计算资源受限的环境。
Leaky ReLU激活函数： 解决了死亡神经元问题，保持了稀疏激活性。用于隐藏层，尤其是在ReLU表现不佳时可以考虑使用，需要保持稀疏激活性的任务。
Softmax激活函数： 输出表示概率分布，适用于多分类问题。用于多分类问题的输出层，将网络输出映射为概率分布，例如图像分类、语音识别等。
ReLU6激活函数：对激活值进行限制，抑制过大的激活值。用于需要限制激活值范围的任务，例如计算资源受限的环境。

在隐藏层，通常首选ReLU及其变体，如Leaky ReLU，因为它们计算简单且在实践中表现良好。
对于二分类问题，Sigmoid仍然是一个合适的选择，但要注意梯度消失问题。
对于需要输出概率分布的多分类问题，Softmax是一个自然的选择。
根据任务和实验结果，可以进行激活函数的调整和尝试，选择最适合特定情况的激活函数。

参考和图片来源：

小wu学cv：常用的激活函数合集（详细版）

【前沿聚焦】机器学习的未来版图：从自动化到隐私保护的技术突破网罗开发人工智能 AI 大模型机器学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，深度学习作为其主要驱动力之一，已经在各个领域取得了显著的成果。然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况
LeetCode - #195 Swift 实现打印文件中的第十行网罗开发 Swift vue.js leetcode swift
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
# 第一章：认识chatgpt 出门喝奶茶 chatgpt chatgpt
chatgpt发展背景详细介绍一、基础理论背景人工智能和自然语言处理的兴起早期理论:20世纪中期，人工智能（AI）初见端倪，目标是模拟人类智能。自然语言处理作为AI的重要分支，致力于让机器理解和生成人类语言。关键里程碑:1980年代的统计方法和2000年代的神经网络技术，使NLP实现了从规则驱动到数据驱动的转变。神经网络与深度学习2010年代，深度学习的兴起极大推动了NLP的发展。基于大规模语料库
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
影视制作的未来：云渲染+虚拟制作+AI生成技术 LhcyyVSO AIGC 云渲染影视动画人工智能 3d 云渲染渲染农场 AI AICG 虚拟制作
在计算机技术和人工智能技术飞速发展的2024年，影视制作正在经历一场前所未有的变革。云渲染、虚拟制作和AI生成等新影视制作技术的结合，正在重新定义数字内容的创作流程，为影视产业带来了全新的可能性和机遇。这些前沿技术不仅提高了制作效率，还打开了无限的创作空间，有望引领未来的影视制作走向新的高峰。云渲染：加速创意实现影视的后期特效制作阶段需要大量的计算机参与渲染。传统的渲染过程耗时长且成本高，而云渲染
打造你的聊天助手：使用C#、OpenAI和Spectre.Console创建控制台ChatGPT客户端墨夶 C#学习资料1 c#chatgpt 开发语言
打造你的聊天助手：使用C#、OpenAI和Spectre.Console创建控制台ChatGPT客户端在这个人工智能飞速发展的时代，ChatGPT以其卓越的对话能力和智能回答在聊天领域引起了革命。你是否想过将这种能力融入到你的控制台应用中，让命令行界面也能拥有智能对话的体验？本文将带你一步步使用C#、OpenAI的API和Spectre.Console库，创建一个功能强大的控制台ChatGPT客户
软件测试中的AI-为什么它在软件自动化测试中很重要？测试界霄霄软件测试人工智能功能测试自动化测试软件测试程序人生职场和发展
通俗地说，人工智能（AI）是计算机科学的一个领域，它专注于使机器“智能化”。所谓智能，就是使系统能够像人类一样学习和做出决策。因此，人工智能机器将能够学习如何在特定情况下做出反应，然后根据其学习情况在未来场景中做出决策。人工智能（AI）在大多数领域的应用仍处于早期阶段，想要完美运行还需要很长时间。今天的人工智能（AI）技术可以帮助我们完成许多不需要复杂思考的重复性日常任务。接下来，让我们讨论软件测
遥感深度学习过程中图像分割的尺寸对模型训练结果的影响司南锤深度学习遥感深度学习人工智能
1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。解决方案：通常将大图裁剪为小尺寸的补丁（patches），例如256x256或512x512。小尺寸图像：显存占用低，但可能丢失全局上下文信息（如大面积地物分布），影响模型对复杂场景的理解。2.模型感受野与上下文信息小尺寸输入：模型感受野受限，可能无法捕捉大范围地物（如河流、
在计算机上本地运行 Deepseek R1 itmanll linux
DownloadOllamaonLinuxDownloadOllamaonWindowsDownloadOllamaonmacOSDeepseekR1是一个强大的人工智能模型，在科技界掀起了波澜。它是一个开源语言模型，可以与GPT-4等大玩家展开竞争。但更重要的是，与其他一些模型不同，您可以在自己的计算机上本地运行DeepseekR1。linux步骤第1步：下载Ollama并安装curl-fsSL
#深度学习：从基础到实践 single_ffish 深度学习 gpt 神经网络生成对抗网络 1024程序员节
深度学习是人工智能领域近年来最为火热的技术之一。它通过构建由多个隐藏层组成的神经网络模型，能够从海量数据中自动学习特征和表征,在图像识别、自然语言处理、语音识别等领域取得了突破性进展。本文将全面介绍深度学习的基础知识、主要算法和实践应用,帮助您快速掌握这一前沿技术。1.深度学习的基础1.1人工神经网络深度学习是基于人工神经网络(ArtificialNeuralNetwork,ANN)的一种机器学习
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析 985小水博一枚呀深度学习地学应用深度学习人工智能
【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析文章目录【深度学习|地学应用】遥感与深度学习：揭示梦柯冰川奥秘的前沿应用与实践解析前言一、使用高分6号遥感影像结合深度学习对梦柯冰川的研究方向1.冰川边界自动化提取2.冰川变化动态监测3.冰川分类与分布特征分析二、梦柯冰川（MunkuGlacier）的
Python中opencv的一些函数及应用灵封～ python opencv 开发语言
Sobel算子函数功能：Sobel算子用于计算图像的梯度（变化率），常用于边缘检测。它通过对图像应用一个基于一阶导数的滤波器来强调图像中的边缘部分，特别是水平和垂直方向上的边缘。通过计算图像的梯度，可以获得图像中亮度变化较大的地方，这些地方通常是物体的边界。Sobel算子有两个方向的变体：SobelX：计算水平方向的梯度。SobelY：计算垂直方向的梯度。Sobel算子函数：cv2.Sobel()
机器学习入门——机器学习基本概念四月是你的机器学习
@机器学习什么是机器学习机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎简单来说机器学习就是机
基于R-CNN深度学习的无人机目标检测系统：数据集、模型和UI界面的完整实现 2025年数学建模美赛 R-CNN检测系统深度学习 cnn 无人机计算机视觉目标检测人工智能
摘要随着无人机技术的迅猛发展，无人机在军事、农业、环境监测等多个领域的应用日益广泛。无人机目标检测系统的建设成为提升无人机自主飞行和环境感知能力的重要环节。本文将详细介绍如何构建一个基于深度学习的无人机目标检测系统，采用R-CNN（区域卷积神经网络）算法，通过用户界面设计和数据集处理，实现高效的目标检测功能。通过本项目，旨在为无人机目标检测提供一种可行的解决方案，并提高其在复杂环境下的工作效率。目
基于Multi-Agent的无人机集群体系自主作战系统设计龙腾亚太无人机
源自：系统工程与电子技术作者：张堃,华帅,袁斌林,杜睿怡“人工智能技术与咨询”发布摘要针对无人集群自主作战体系设计中的关键问题,提出基于Multi-Agent的无人集群自主作战系统设计方法。建立无人集群各节点的Agent模型及其推演规则;对于仿真系统模块化和通用化的需求,设计系统互操作式接口和无人集群自主作战的交互关系;开展无人集群系统仿真推演验证。仿真结果表明,所提设计方案不仅能够有效开展并完成
用 Neo4j GraphRAG 工具开启你的智能应用之旅步子哥 AGI通用人工智能 neo4j 人工智能
在这个人工智能飞速发展的时代，Neo4j带来了一项令人激动的创新——GraphRAG生态系统工具。这组开源工具为开发人员提供了一个全新的途径，以构建基于知识图谱的智能应用，让机器更好地理解和回应我们的查询。接下来，让我们一起探索这些工具如何帮助我们构建更智能、更准确的应用。什么是GraphRAG?GraphRAG是一种结合了检索增强生成（RAG）技术和知识图谱的解决方案。它不仅解决了大型语言模型常
探索未来对话的边界：Mixture-of-Agents（MoA）——大型语言模型的集体智慧引擎潘俭渝Erik
探索未来对话的边界：Mixture-of-Agents（MoA）——大型语言模型的集体智慧引擎项目地址:https://gitcode.com/gh_mirrors/mo/MoA在当前人工智能的浪潮中，我们迎来了一个令人兴奋的技术突破——Mixture-of-Agents(MoA)，它标志着大型语言模型（LLM）能力提升的新纪元。本文将引领您深入探索这一革命性项目，揭示其技术精粹，展望应用前景，并
【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
探索人工智能在计算机视觉领域的创新应用与挑战戒了9 人工智能学习方法
一、引言1.1研究背景与意义在科技飞速发展的当下，人工智能（ArtificialIntelligence,AI）已然成为引领新一轮科技革命和产业变革的重要驱动力。作为AI领域的关键分支，计算机视觉（ComputerVision,CV）致力于让计算机具备像人类一样理解和解析图像、视频等视觉信息的能力，近年来取得了令人瞩目的进展。二者的深度融合，更是为众多领域带来了前所未有的变革与机遇。从技术发展历程
人工智能前沿技术进展与应用前景探究戒了9 人工智能搜索引擎百度
一、引言1.1研究背景与意义人工智能作为一门极具变革性的前沿技术，正深刻地改变着人类社会的各个层面。从其诞生之初，人工智能便承载着人类对智能机器的无限遐想与探索。自20世纪中叶起，人工智能踏上了它的发展征程，历经了多个重要阶段，每一阶段都伴随着理论的突破、技术的革新以及应用领域的拓展。在初级阶段（1943-1956），沃伦・麦卡洛克和沃尔特・皮茨提出的人工神经网络基本模型，为人工智能的发展奠定了初
chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-中会写代码的孙悟空大模型从入门到放弃 chatgpt 人工智能深度学习机器学习 AIGC
导航chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-上chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-中chatGPT底层原理是什么，为什么chatGPT效果这么好？三万字长文深度剖析-下神经网络那么我们用于图像识别等任务的模型是如何工作的呢？目前最流行且最成功的方法是使用神经网络。神经网络在20世纪40年代就发明了——其形式与现
chatgpt赋能python：Python如何删除一个对象 atest166 ChatGpt chatgpt jvm java 计算机
Python如何删除一个对象Python是一种高级、面向对象、动态类型解释型语言，它有广泛的应用，尤其在数据分析、机器学习、人工智能和Web开发等领域。但是，在Python编程过程中，我们也可能需要删除对象。那么，Python如何删除一个对象呢？Python对象和变量在Python中，一切都是对象。对象是内存中的一块数据，有自己的身份、类型和值。变量是指向对象的引用，通过变量可以访问对象的属性和方
人工智能前沿技术进展与应用前景探究戒了9 搜索引擎
一、引言1.1研究背景与意义人工智能作为一门极具变革性的前沿技术，正深刻地改变着人类社会的各个层面。从其诞生之初，人工智能便承载着人类对智能机器的无限遐想与探索。自20世纪中叶起，人工智能踏上了它的发展征程，历经了多个重要阶段，每一阶段都伴随着理论的突破、技术的革新以及应用领域的拓展。在初级阶段（1943-1956），沃伦・麦卡洛克和沃尔特・皮茨提出的人工神经网络基本模型，为人工智能的发展奠定了初
探索 Meissonic：文本到图像生成的新星 zhangjiaofa 大模型文生图大模型 Meissonic
目录前言模型概述主要功能技术架构应用场景在线体验本地部署克隆存储库创建虚拟环境安装扩散器启动GradioWeb用户界面文本到图像生成结语项目地址一、前言在人工智能迅猛发展的今天，文本到图像生成技术已成为科技前沿的热点。从艺术创作到商业设计，从学术研究到工业应用，这一技术正以惊人的速度改变着我们与数字内容的交互方式。众多研究机构和企业纷纷投入这一领域，不断推动技术的边界。然而，尽管已有许多优秀的模型
AI在电商平台商品描述生成中的应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI在电商平台商品描述生成中的应用关键词：人工智能、电商平台、商品描述、自然语言处理、机器学习、深度学习摘要：本文深入探讨了人工智能在电商平台商品描述生成中的应用。首先，我们回顾了人工智能的概述和电商平台的发展背景。随后，分析了商品描述在电商平台中的重要性以及存在的问题。接下来，我们重点介绍了AI在商品描述生成中的应用技术，包括自然语言处理、机器学习和深度学习等。文章还通过实战案例展示了AI商品描
SpringAI基于API对大语言模型调用 _沉浮_ AI 语言模型人工智能 springAI
引言随着人工智能技术的迅猛发展，大型语言模型（LLM）在各个领域的应用越来越广泛。SpringAI作为一个旨在简化AI集成的框架，为开发者提供了高效、便捷的工具来连接和调用这些大模型。本文将详细探讨如何使用SpringAI整合通义千问等大语言模型，并通过实例演示这一过程，最后提供一些扩展建议。一、SpringAI简介SpringAI是一个专为AI工程设计的应用框架，旨在将Spring生态系统设计原
OpenCV相关函数〖是♂我〗 opencv 计算机视觉图像处理
一、Sobel算子函数(cv2.Sobel)功能Sobel算子是一个梯度算子，用于边缘检测。通过计算图像中像素的梯度，Sobel算子可以检测出水平和垂直方向上的边缘。参数src：输入图像。ddepth：输出图像的深度（如cv2.CV_8U,cv2.CV_64F）。一般为cv2.CV_8U（8位无符号整数）或cv2.CV_64F（64位浮动数）。dx：计算导数的x方向阶数，dx=1表示计算x方向的导
【Python】已解决：（cmd进入Python环境报错）No Python at ‘C:\Users…\Python\Python39\python.exe’ 屿小夏 python linux 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习之基于Django+YOLOv5商标识别 Q1744828575 python plotly python
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在数字化时代，商标作为企业的重要资产，其保护和管理显得尤为重要。然而，传统的商标识别方法往往依赖于人工审查，效率低下且容易出错。随着深度学习技术的不断发展，尤其是目标检测领域的进步，自动化、高精度的商标识别成为可能。本项目旨在利用DjangoWeb框架和YOLO
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

神经网络常用激活函数详解

前言

文章目录

一 、sigmoid

1.表达式及其图像：

2. Sigmoid激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

二、tanh

1. 表达式以及图像：

2. Tanh激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

三、ReLU

1.表达式及其图像：

2. ReLU激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

四、Leoky ReLU

1.表达式及其图像：

2. Leoky ReLU激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

五、ReLU6

1.表达式及其图像：

2. ReLU6激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

六、Softmax

1.表达式及其图像：

2. Softmax激活函数的优缺点：

3. 使用场景：

4. PyTorch代码：

总结

你可能感兴趣的:(#,神经网络算子,人工智能,深度学习,神经网络,激活函数)

一、sigmoid