飞大圣

深度学习常用的激活函数

深度学习的核心思想是通过多层次的神经网络结构，逐步抽取和表示数据中的高级特征，从而实现对复杂数据模式的学习和识别。

神经网络结构： 深度学习使用多层次的神经网络，包括输入层、隐藏层和输出层。这些网络结构允许模型自动学习数据中的特征层次。
反向传播算法： 反向传播是一种优化算法，用于调整神经网络中连接权重，以使模型的预测结果更加准确。它通过计算损失函数对权重的梯度，并使用梯度信息来更新权重。
大规模数据和计算能力： 深度学习模型通常需要大量的数据来训练，以及强大的计算资源来进行复杂的计算。随着大数据和GPU等硬件的发展，深度学习在实际应用中取得了显著的进展。
预训练和迁移学习： 预训练模型可以在大规模数据上进行预训练，然后在特定任务上进行微调，从而加速模型训练和提高性能。这种迁移学习的方法在很多领域都取得了良好的效果。

激活函数是神经网络中的一个关键组件，它决定了神经元是否被激活（激活值大于某个阈值）并传递信息给下一层。激活函数引入非线性性质，使得神经网络能够表示更加复杂的函数关系。

1.Sigmoid函数（Logistic函数）

Sigmoid 函数将输入值压缩到 0 和 1 之间，曲线形状平滑，适合用于较浅的网络层或二元分类问题。然而，Sigmoid 函数在输入较大或较小的情况下容易出现梯度消失的问题，限制了其在深层网络中的应用。

Sigmoid函数的数学表达式为： $f(x)=\frac{1}{1+e^{-x}}$ 其中 $x$ 是输入值， $e$ 是自然对数的底。这个函数将任意实数映射到一个范围在 0 到 1 之间的值，具有如下特点：

当 $x$ 趋近于正无穷大时， $f (x)$ 趋近于 1；
当 $x$ 趋近于正无穷小时， $f (x)$ 趋近于 0；
在 $x = 0$ 处， $f (x)$ 的值为 0.5，即中间值。

Sigmoid函数也存在一些问题：

梯度消失： 在输入较大或较小的区域，Sigmoid函数的梯度接近于零，这会导致反向传播时梯度逐渐消失，影响深层网络的训练。
输出不是零中心： Sigmoid函数的输出在大部分情况下是正的，这可能导致在网络训练过程中的参数更新不均匀。
计算代价高： 计算Sigmoid函数的指数运算较为昂贵，可能影响网络的计算效率。

2.ReLU函数（Rectified Linear Unit）

ReLU函数在输入大于零时输出输入值本身，否则输出0。它简单且计算高效，在深度学习中广泛使用。但是，ReLU函数在负数区域输出为0，可能导致神经元“死亡”，即不再激活，从而影响网络的训练。

ReLU函数的数学表达式为： $f(x)=\max(0,x)$ 其中， $x$ 是输入值， $f (x)$ 是激活后的输出值。具有如下特点：

当 $x$ 大于等于 0 时， $f (x) = x$ ，即输出等于输入；
当 $x$ 小于 0 时， $f (x) = 0$ ，即输出为零。

ReLU函数的优势包括：

非线性： 尽管ReLU在负数区域输出为零，但在正数区域仍然是非线性的，能够引入神经网络的非线性能力，使其能够表示更加复杂的函数关系。
计算高效： ReLU的计算非常简单，只需要比较输入值和零的大小，相对于其他一些激活函数，计算成本更低。
避免梯度消失： 在正数区域，ReLU函数的梯度为1，不会出现梯度消失问题，有助于在深层网络中传播梯度。

ReLU函数存在的一些问题：

死亡神经元问题： 当某个神经元在训练过程中始终输出为负数，其梯度为零，导致它的权重无法更新，即"死亡"。这种情况下，神经元将不再对网络的学习产生影响；
不是零中心： 当输入为负数时，ReLU的输出为零，这可能导致网络的激活分布不是零中心，可能对训练造成一些影响。

3.Leaky ReLU

Leaky ReLU是 ReLU 的变体，允许负数区域的斜率不为零，从而避免了死亡神经元问题。Leaky ReLU在负数区域保留一些激活，有助于减轻梯度消失问题。

Leaky ReLU函数的数学表达式为： $\begin{cases} x &\text{if } x \geq 0 \\ bx &\text{if } x \leq 0 \end{cases}$ 其中， $x$ 是输入值，b 是一个小于 1 的超参数，通常在训练过程中固定为一个较小的正数，如0.01。具有如下特点：

当 $x$ 大于等于零时， $f (x) = x$ ，即输出等于输入，与普通的ReLU相同；
当 $x$ 小于零时， $f (x) = a x$ ，即引入一个小的斜率 b 来保证负数区域不完全为零。

Leaky ReLU的优势包括：

避免死亡神经元问题： 引入了一个小的斜率 aa，使得在负数区域仍然具有非零的输出，从而减轻了死亡神经元问题。
计算简单： Leaky ReLU的计算非常简单，与ReLU相似，只需要比较输入值和零的大小。

Leaky ReLU 存在的一些问题：

需要调参： 超参数 b 需要手动设定，虽然通常取较小的值（如0.01）能够在大多数情况下工作，但仍然需要调参。
不自适应： Leaky ReLU的斜率在负数区域是固定的，而PReLU则能够通过学习自适应地确定斜率

4.PReLU（Parametric ReLU）

PReLU是 Leaky ReLU 的一种扩展形式，它引入了一个可学习的参数，允许网络自动学习在负数区域的斜率，从而更好地适应不同的数据分布。

PReLU函数的数学表达式为： $\begin{cases} x &\text{if } x \geq 0 \\ ax &\text{if } x \leq 0 \end{cases}$ 其中， $x$ 是输入值，a 是一个可学习的参数，通常在训练过程中通过反向传播进行更新。当 a 为 0 时，PReLU退化为普通的ReLU函数。当 a 大于 0 时，PReLU在负数区域引入了一个斜率，使得负数值也能够有非零的输出，从而避免死亡神经元问题。

PReLU函数的优势包括：

自适应斜率： PReLU通过学习参数 a 来自适应地确定负数区域的斜率，可以根据数据的分布和任务的需求来调整激活函数的形状。
减轻死亡神经元问题： 通过在负数区域引入斜率，PReLU有助于激活那些在训练过程中可能变得非激活的神经元，从而减轻了死亡神经元问题。
提高模型表达能力： PReLU的自适应斜率使得神经网络能够学习更加复杂的函数关系，提高了模型的表达能力。

PReLU函数存在的一些问题：

需要更多的参数进行学习，可能会增加模型的复杂度和训练时间。

Leaky ReLU 和 PReLU 都在负数区域引入了斜率，从而在一定程度上改进了ReLU的问题。Leaky ReLU的斜率通常是固定的超参数，而PReLU则通过学习参数来自适应地确定斜率。选择使用哪种激活函数取决于具体问题的需求和实验结果。

5.Tanh函数（双曲正切函数）

Tanh 函数将输入值映射到 -1 和 1 之间，类似于Sigmoid函数，但范围更大。它在某些情况下能够更好地处理输入数据的对称性，但也会存在梯度消失问题。

Tanh函数的数学表达式为： $f(x)=\frac{e^x - e^{-x}}{e^{x}+e^{-x}}$ 其中， $x$ 是输入值， $e$ 是自然对数的底。Tanh函数将任意实数映射到范围在 -1 到 1 之间的值，具有如下特点：

当 $x$ 趋近于正无穷大时， $f (x)$ 趋近于 1；
当 $x$ 趋近于正无穷小时， $f (x)$ 趋近于 -1；
在 $x = 0$ 处， $f (x)$ 的值为 0。

Tanh 函数的优势包括：

零中心性： Tanh函数的输出在大部分情况下是零中心的，相对于ReLU等激活函数，更有助于训练稳定性;
非线性： Tanh函数是非线性的，能够引入神经网络的非线性能力，使其能够表示更加复杂的函数关系。

Tanh函数存在的一些问题：

梯度消失： 在输入较大或较小的区域，Tanh函数的梯度接近于零，可能导致梯度消失问题，特别是在深层网络中。

6. Swish函数

Swish 函数是一种类似于 ReLU 的激活函数，它将输入值与 Sigmoid 函数的乘积作为输出。
Swish函数的数学表达式如下： $f(x)=x\cdot \sigma(\beta x)$ 其中， $x$ 是输入值， $σ$ 是Sigmoid函数， $β$ 是一个可调参数。Swish函数通过在输入值上引入Sigmoid函数，实现了在正数区域保留线性特性，同时在负数区域引入非线性的特性。

Swish函数的特点包括：

非线性性质： 在负数区域，Swish 函数的输出呈现非线性特性，有助于引入神经网络的非线性能力，使其能够表示更加复杂的函数关系。
自动缩放： 当输入为较大的正数时，Swish 函数趋近于线性，不会出现梯度爆炸问题。这有助于模型的稳定性。
适用范围广： Swish 函数在一些任务中表现出色，尤其在较大的模型中（如深度神经网络）可能表现良好。

Swish函数存在的一些问题：

计算开销： Swish函数的计算相对于ReLU等简单激活函数更复杂，需要涉及Sigmoid函数的计算。
不适用于所有情况： 尽管在某些情况下表现出色，Swish函数并不一定在所有任务和网络结构中都能取得最佳性能。

7. ELU（Exponential Linear Unit）

ELU是一种具有平滑非线性特性的激活函数。在正数区域，ELU函数与ReLU相似；而在负数区域，它的曲线更平滑，有助于减轻梯度消失问题。此外，ELU在负数区域的输出不仅不是0，还具有一个负值，有助于缓解神经元死亡问题。
ELU的数学表达式为： $\begin{cases} x &\text{if } x \geq 0 \\ \alpha(\exp (x)-1) &\text{if } x \leq 0 \end{cases}$
其中， $x$ 是输入值， $α$ 是一个可调参数，通常取一个较大的正数，如1。ELU函数通过在负数区域引入指数函数，实现了在负数区域具有非线性的平滑特性。

ELU函数的优势有：

平滑非线性性质： 在负数区域，ELU函数的输出是平滑的非线性特性，相对于ReLU等函数，能够更好地拟合复杂的函数关系。
避免死亡神经元问题： ELU在负数区域不会输出零，因此能够避免死亡神经元问题。
零中心性： ELU函数在大部分情况下是零中心的，有助于训练稳定性。
自适应斜率： 通过调整参数 $α$ 的值，可以自适应地调整负数区域的斜率，使得ELU能够适应不同的数据分布和任务需求。

ELU 存在的一些问题：

计算开销： ELU函数的计算相对于ReLU等简单激活函数较为复杂，涉及指数函数的计算。
参数调整： 参数 $α$ 的选择可能需要进行调参，不同的数据和任务可能需要不同的参数值。

8.SELU（Scaled Exponential Linear Unit）

SELU是ELU的扩展，它在一定条件下能够使得网络在前向传播时自我规范化。这意味着在使用SELU激活函数时，网络的每一层的输出的均值和方差能够保持稳定。这一性质有助于训练更深的网络，而无需过多的批标准化等技巧。

SELU函数的数学表达式如下： $=\lambda \begin{cases} x &\text{if } x \geq 0 \\ \beta (\exp (x)-1) &\text{if } x \leq 0 \end{cases}$ 其中， $x$ 是输入值， $\beta$ 是一个超参数（通常设置为1.6733）， $λ$ 是一个超参数（通常设置为1.0507）。SELU函数通过引入尺度参数 $λ$ ，使得输出值在正数区域逐渐缩放，从而实现网络自我规范化。

SELU函数的特点和优势包括：

自我规范化： 在一定条件下，使用SELU激活函数可以使得每一层的输出的均值和方差保持稳定，从而减轻梯度爆炸和梯度消失问题。
允许深层网络： 由于自我规范化的特性，SELU函数允许构建更深的神经网络，无需使用复杂的正则化技巧，如批标准化。
默认初始化： 在一些特定条件下，SELU激活函数使用零均值和单位方差的初始化可以保持自我规范化的特性。

SELU函数存在的问题：

不适用于所有情况： SELU函数在某些情况下表现出色，但并不一定在所有任务和网络结构中都能取得最佳性能。
需要满足条件： 自我规范化的特性需要满足一定的条件，包括输入数据的分布和权重的初始化方式等。

9.Maxout

Maxout函数是一种通用的激活函数，它不是像ReLU或Sigmoid那样固定的形式，而是一种更为灵活的结构。Maxout函数的主要思想是让每个神经元学习多个线性函数的最大值，从而能够逼近更加复杂的非线性函数。Maxout可以视为ReLU和线性激活函数的泛化，它可以学习各种形状的非线性函数。然而，Maxout的参数量较大，可能需要更多的参数调整。

Maxout函数的数学表达式如下： $f(x) = \max(w_1^Tx+b_1,w_2^Tx+b_2)$ 其中， $x$ 是输入向量， $w_1,w_2$ 是权重向量， $b_1,b_2$ 是偏置。。Maxout函数中有两个分支，每个分支都由一个线性变换 $w^Tx+b$ 组成，然后选择两者中的最大值作为输出。Maxout函数可以扩展到具有更多分支的情况。

Maxout函数的特点和优势包括：

灵活性： Maxout函数允许每个神经元学习多个线性函数的最大值，因此在逼近各种不同形状的非线性函数时具有灵活性。
适应性： 每个分支都可以学习数据的不同特征，从而在不同的输入区域自适应地选择最佳的线性函数。
抗过拟合： Maxout网络通常具有更多的参数，这有助于防止过拟合，尤其是在训练数据有限的情况下。

Maxout 存在的一些问题：

参数量大： Maxout网络的参数量较大，可能需要更多的训练数据和计算资源来训练。
计算成本： Maxout函数的计算成本较高，因为每个神经元有多个分支，每个分支都需要进行线性变换和比较操作。
复杂性： Maxout网络的结构较为复杂，可能需要更多的调参和实验来找到最佳的网络结构。

10.Softmax函数

Softmax函数常用于多分类问题的输出层，将一组原始分数（也称为“logits”）转化为表示各类别概率的概率分布。Softmax函数能够将任意实数值映射到一个范围在0到1之间，并且保证所有类别的概率之和为1。

Softmax函数的数学表达式如下： $\text{softmax}{(x_i)}=\frac{e^{x_{i}}}{\sum_{j=1}^{N}e^{x_j}}$ 其中， $x_i$ 是原始分数中的第 $i$ 个元素， $N$ 是类别的数量， $e$ 是自然对数的底。Softmax函数将每个原始分数进行指数化，并将指数化后的值除以所有指数化值的和，以获得每个类别的概率。

Softmax函数的特点和应用包括：

概率分布： Softmax函数的输出是一个概率分布，对于多类别分类问题，每个类别的输出表示为属于该类别的概率。
归一化： Softmax函数将原始分数进行指数化和归一化，使得网络的输出具有一定的可解释性和意义。
多类别分类： Softmax函数通常用于多类别分类问题，例如图像识别、文本分类等。

Softmax函数存在的一些问题：

数值稳定性： 当原始分数较大时，指数运算可能导致数值溢出问题。为了提高数值稳定性，通常会在计算Softmax时减去分数中的最大值。
互斥假设： Softmax函数假设每个样本只属于一个类别，不适用于多标签分类问题。
类别数限制： Softmax函数在处理大量类别时可能会引入计算和存储的问题，特别是在输出层的类别数量较大时。

11.GELU

GELU 在正数区域类似于 ReLU，在负数区域则具有平滑的 S 形曲线。GELU 在一些任务上表现出色，并且相对简单，没有额外的超参数。结合了线性和非线性特性，同时在计算效率和性能之间取得了一定的平衡。GELU函数的设计旨在尝试克服ReLU等函数的一些问题，如梯度饱和和死亡神经元问题。

GELU函数的数学表达式如下： $\text{GELU}(x)=\frac{1}{2}x(1+\tanh (\sqrt{\frac{2}{\pi}}(x+0.044715x^{3})))$ 其中， $x$ 是输入值， $t anh$ 是双曲正切函数。GELU函数的形式结合了线性函数和双曲正切函数，使得在输入的正负两个区域都有非线性的输出。

GELU函数的特点和优势包括：

平滑非线性性质： GELU函数在整个输入范围内都有非线性的输出，相对于ReLU等函数，能够更好地拟合复杂的函数关系。
减轻梯度饱和问题： GELU函数在输入为正数区域具有线性的输出，能够减轻梯度饱和问题，有助于提高训练效率。
避免死亡神经元问题： GELU函数在负数区域也具有非零输出，能够避免死亡神经元问题。
计算效率： 相对于一些复杂的激活函数，GELU的计算相对较快，特别是与Sigmoid和双曲正切等函数相比。

GELU函数存在的问题：

可能在某些情况下不如其他激活函数表现出色，具体效果可能会因问题的性质和数据分布而有所不同。

Java 程序员必读书单 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 Java实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Java是一门高级、新兴的静态面向对象编程语言，在互联网、移动互联网、大数据、云计算、人工智能、物联网等领域都有广泛应用。作为Java程序员的你是否也经常被面试官或者HR问到有关Java的知识点呢？如果你最近在准备面试或阅读相关技术文档，则本文正是适合你。在本文中，我将给你一些你可能不知道的关于Java的重要概念和知识，并通过具体的代码示例和图表来帮助你理解这些
一文彻底搞清楚HarmonyOS NEXT的元服务 harmonyos-next
程序员Feri一名12年+的程序员,做过开发带过团队创过业,擅长Java、嵌入式、鸿蒙、人工智能等,专注于程序员成长那点儿事,希望在成长的路上有你相伴！君志所向,一往无前！1.什么是元服务在万物互联时代，人均持有设备量不断攀升，设备种类和使用场景更加多样，使得应用开发、应用入口变得更加复杂。在此背景下，应用提供方和用户迫切需要一种新的服务提供方式，使应用开发更简单、服务（如听音乐、打车等）的获取和
从阅读空间到知识孵化器，AI时代智慧图书馆何为？技能咖生成式人工智能认证 GAI认证人工智能
在人工智能（AI）浪潮席卷全球的当下，图书馆作为知识传播与文化传承的重要场所，正面临着前所未有的变革。从传统的阅读空间到如今的知识孵化器，智慧图书馆在AI时代肩负着新的使命与挑战。本文将探讨智慧图书馆在AI时代的发展方向，并引入生成式人工智能认证（GAI）认证，为图书馆从业者的技能提升提供新思路。AI时代智慧图书馆的新角色知识资源整合与挖掘者在AI时代，信息爆炸式增长，图书馆不再仅仅是纸质书籍的收
基于人工智能的扫阅卷和数据分析服务需求文档 YiWait 人工智能人工智能数据分析数据挖掘
基于人工智能的扫阅卷和数据分析服务需求文档一、项目背景在教育领域，传统的人工阅卷方式效率低下、主观性强且易出错，难以满足大规模考试及频繁测评的需求。随着人工智能技术的飞速发展，基于人工智能的扫阅卷和数据分析服务应运而生。该服务利用先进的图像识别、自然语言处理等技术，实现试卷扫描、自动阅卷、成绩统计以及深度数据分析，为教育机构、学校提供高效、准确、全面的测评解决方案，助力教学质量提升和教育决策优化。
AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
深度学习：让机器学会“思考”的魔法 AI极客Jayden　 AI 深度学习
文章目录引言：从“鹦鹉学舌”到“举一反三”一、深度学习是什么？1.定义：机器的“大脑”2.核心思想：从数据中“悟”出规律二、深度学习的“大脑”结构：神经网络1.神经元：深度学习的基本单元2.神经网络：多层“神经元”的组合3.深度：为什么需要多层？三、深度学习如何“学习”？1.训练过程：从“笨拙”到“熟练”2.损失函数：衡量“错误”的尺子3.反向传播：从错误中“反思”四、深度学习的“超能力”1.图像
群体智能优化算法-模拟退火优化算法（Simulated Annealing, SA，含Matlab源代码） HR Zhou 算法模拟退火算法机器学习 matlab 群体智能优化优化人工智能
摘要模拟退火（SA）算法是一种基于物理退火过程的全局优化算法，其核心思想来源于热力学中的退火过程：将材料加热到高温后再缓慢冷却，使其分子结构趋于最低能量状态，从而获得稳定结构。SA算法利用Metropolis准则来决定接受新的解，以一定概率接受劣解，从而避免陷入局部最优。SA具有收敛速度快、计算复杂度低、适用于连续优化问题等特点，被广泛应用于组合优化、函数优化、神经网络训练等领域。算法介绍1.主要
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
2025年第二届机器学习与神经网络国际学术会议(MLNN 2025) 分享学术科研与论文的禁小默机器学习神经网络人工智能
重要信息官网：www.icmlnn.org时间：2025年4月22-24日地点：中国-重庆简介2025年第二届机器学习与神经网络国际学术会议（MLNN2025）围绕学习系统与神经网络的核心理论、关键技术和应用展开讨论，涵盖深度学习、计算机视觉、自然语言处理、强化学习等多个子领域，通过特邀报告、主题演讲、海报展示等形式，展示相关领域的最新研究成果和技术创新。征稿主题神经网络机器学习深度学习算法及应用
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！鸡腿爱学习人工智能学习自然语言处理服务器数据库
大家好，我是JackBytes，一个专注于将人工智能应用于日常生活的半吊子程序猿，平时主要分享AI、NAS、Docker、搞机技巧、开源项目等。在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进
深度学习--概率 fantasy_arch 深度学习人工智能
1基本概率论1.1假设我们掷骰子，想知道1而不是看到另一个数字的概率，如果骰子是公司，那么所有6个结果(1..6),都有相同的可能发生，因此，我们可以说1发生的概率为1/6.然而现实生活中，对于我们从工厂收到的真实骰子，我们需要检查它是否有瑕疵，唯一的办法就是多投掷骰子，对于每个骰子观察到的[1.2...6]的概率随着投掷次数的增加，越来越接近1/6.导入必要的包%matplotlibinline
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比