普修罗双战士

人工智能福利站，初识人工智能，机器学习，第三课

作者简介，普修罗双战士，一直追求不断学习和成长，在技术的道路上持续探索和实践。
多年互联网行业从业经验，历任核心研发工程师，项目技术负责人。
欢迎点赞✍评论⭐收藏

人工智能领域知识

链接	专栏
人工智能专业知识学习一	机器学习专栏
人工智能专业知识学习二	机器学习专栏
人工智能专业知识学习三	机器学习专栏

文章目录

初识人工智能(机器学习)
- 一、机器学习(3)
- - 21. 什么是K近邻（KNN）算法？
  - 22. 什么是逻辑回归？
  - 23. 什么是梯度下降？什么是批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）？
  - 24. 什么是人工神经网络（ANN）？
  - 25. 什么是反向传播算法？
  - 26. 什么是卷积神经网络（CNN）？
  - 27. 什么是循环神经网络（RNN）？什么是长短期记忆（LSTM）网络？
  - 28. 什么是生成对抗网络（GAN）？
  - 29. 什么是无监督聚类算法？给一个例子。
  - 30. 什么是聚类评估指标？举个例子。

初识人工智能(机器学习)

一、机器学习(3)

21. 什么是K近邻（KNN）算法？

K近邻（K-Nearest Neighbors，简称KNN）算法是一种基本而直观的分类和回归算法。它的工作原理是基于样本的特征相似性来进行预测。

KNN算法的工作流程如下：

训练数据准备：首先，需要准备一个带有类别标签的训练数据集。
计算距离：对于待预测样本，算法会计算其与训练集中每个样本之间的距离（如欧氏距离、曼哈顿距离等）。
选择K值：选择一个合适的K值，它表示在预测过程中要考虑的最近邻样本的数量。
选择K个最近邻：根据距离计算结果，选择距离最近的K个样本作为待预测样本的近邻。
分类或回归：对于分类任务，KNN算法采用投票法，选择K个近邻中出现频率最高的类别作为预测结果。对于回归任务，KNN算法采用平均法，将K个近邻的值进行平均作为预测结果。

在使用KNN算法时，需要注意以下几点：

特征选择：选择合适的特征对预测结果至关重要，不同的特征选择可能会影响算法的性能。
数据归一化：由于KNN算法是基于距离计算的，应对特征进行归一化处理，以防止某些特征对距离计算的影响过大。
K值选择：选择合适的K值很重要，较小的K值可能会导致噪音影响预测结果，过大的K值可能会导致模型过于简单。
决策边界：KNN算法的决策边界是非线性的，具有高度灵活性，但也容易受到样本分布的影响。

KNN算法的优点包括：

简单直观：KNN算法易于理解和实现，是一种常用的基准算法。
适用于各种数据类型：KNN算法可以用于分类和回归任务，并且适用于离散型和连续型特征。
对异常值不敏感：由于KNN是基于距离计算的，对单个异常值不敏感，能够处理噪音数据。

然而，KNN算法也有一些限制：

需要大量内存：KNN算法需要保存整个训练集，因此需要较大的内存空间。
预测速度较慢：对于大规模数据集，KNN算法的预测过程可能会较慢，因为它需要计算待预测样本与所有训练样本之间的距离。
需要确定合适的K值：选择合适的K值是一个挑战，不同的K值可能会导致不同的预测结果。

尽管KNN算法存在一些限制，但它仍然是一个简单且有效的分类和回归算法，在不同领域和实际问题中得到了广泛应用。

22. 什么是逻辑回归？

逻辑回归（Logistic Regression）是一种常用的统计学习方法，用于解决二分类问题。尽管名字中包含"回归"一词，但逻辑回归实际上是一种分类算法。

逻辑回归的基本思想是通过线性函数和逻辑函数的组合来建立一个分类模型。它假设输出变量（或目标变量）与输入变量（或特征）之间存在一个线性关系，并使用逻辑函数对这个线性关系进行建模。逻辑函数常用的形式是sigmoid函数（也称为逻辑函数），其输出范围在0和1之间。

逻辑回归的工作过程如下：

定义假设函数：定义一个逻辑回归模型的假设函数，通常是一个线性回归函数与逻辑函数的组合。
确定模型参数：通过最大似然估计或其他优化算法，确定模型中的参数，使得模型对训练数据的拟合程度最大化。
特征工程：对训练数据进行特征选择、预处理和转换等操作，以提取有用的特征信息。
模型训练：使用优化算法（如梯度下降）对模型进行训练，通过最小化损失函数来得到分类器的参数。
模型预测：使用训练得到的参数，对新的样本进行预测，将预测结果映射为0或1，以进行二分类任务。

逻辑回归具有以下特点和优点：

简单而高效：逻辑回归是一种简单的分类算法，计算效率高。
可解释性强：逻辑回归模型能够直观地解释特征对分类结果的贡献程度。
可以处理线性可分和线性不可分的问题：逻辑回归能够处理线性可分的问题，并且通过引入多项式项等方法，也可以处理线性不可分的问题。

然而，逻辑回归也有一些限制：

对于非线性的关系表达能力有限：逻辑回归只能对特征和目标之间的线性关系进行建模，对于非线性关系的拟合能力有限。
对异常值敏感：逻辑回归对异常值比较敏感，可能会影响模型的性能。

逻辑回归常用于各种领域的二分类问题，如信用风险评估、疾病预测、垃圾邮件过滤等任务。

23. 什么是梯度下降？什么是批量梯度下降（BGD）、随机梯度下降（SGD）和小批量梯度下降（MBGD）？

梯度下降（Gradient Descent）是一种常用的优化算法，用于最小化损失函数并更新模型参数。它通过迭代的方式，在参数空间中寻找最优解。

梯度下降的基本思想是沿着损失函数梯度的反方向更新参数，直至达到局部最小值或全局最小值。梯度是由损失函数对各个参数的偏导数构成，表示了损失函数在当前参数值处的变化率。

在梯度下降中，有以下几种不同的变体：

批量梯度下降（Batch Gradient Descent，BGD）：在每一次迭代中，使用训练数据集中的所有样本来计算梯度和更新模型参数。BGD能够保证在每次迭代时得到最准确的梯度，但它要求浩大的计算量和较长的训练时间，尤其在大规模数据集上。
随机梯度下降（Stochastic Gradient Descent，SGD）：在每一次迭代中，随机选择一个样本来计算梯度和更新模型参数。相较于BGD，SGD计算效率更高，但由于随机性的存在，可能会导致收敛较慢或不稳定。
小批量梯度下降（Mini-Batch Gradient Descent，MBGD）：在每一次迭代中，随机选择一小部分样本（称为mini-batch）来计算梯度和更新模型参数。MBGD综合了BGD和SGD的优点，既减少了计算开销，又相对稳定，因此在实践中被广泛应用。

这些梯度下降的变体在参数更新过程中都需要指定学习率（Learning Rate），它控制每次迭代中参数更新的步幅。学习率过大可能导致震荡或发散，而学习率过小可能会导致收敛速度较慢。

梯度下降算法的选择取决于许多因素，如数据集大小、计算资源和应用场景等。BGD使用了全部样本的信息，适用于小规模数据集；SGD适用于大规模数据集，并且每次迭代的时间较短；MBGD通常在实际应用中取得了平衡，较好地兼顾了计算效率和稳定性。

需要注意的是，梯度下降是一种常见的优化算法，它不仅适用于机器学习领域，也可用于其他优化问题的求解。

24. 什么是人工神经网络（ANN）？

人工神经网络（Artificial Neural Network，ANN），也称为神经网络，是一种计算模型，受到人类神经系统的启发。它由大量的人工神经元（或节点）相互连接而成，通过学习和适应数据来解决各种问题。

人工神经网络的基本单位是神经元。每个神经元接收来自其他神经元的输入信号，并通过权重对这些输入进行加权求和。然后，经过激活函数处理后，神经元将输出传递给连接的下一层神经元。这种输入-加权求和-激活的传递过程形成了神经网络的前向传播。

人工神经网络通常包含多个层次的神经元组织，被分为输入层、隐藏层（可包含多个隐藏层）和输出层。输入层接受外部输入或其他神经元的输出，并将其传递给隐藏层。隐藏层在内部进行计算和信息传递，最后将结果传递给输出层，输出层生成模型的最终输出。

在训练阶段，神经网络通过调整各个神经元之间的连接权重来适应给定的训练数据。这个优化过程通常使用反向传播算法。通过反向传播，网络可以计算出每个连接权重对整体损失函数的贡献，然后使用梯度下降等优化算法来更新这些权重，从而最小化损失函数。通过反复进行这个训练过程，神经网络可以逐渐调整参数，提高对输入数据的模式识别和预测能力。

人工神经网络在机器学习和人工智能领域有广泛的应用，例如图像识别、语音识别、自然语言处理等。不同类型的神经网络，如前馈神经网络、循环神经网络和卷积神经网络，以及各种改进和深化的变体，已经取得了许多重要的成果。

25. 什么是反向传播算法？

**反向传播算法（Backpropagation Algorithm）是一种用于训练人工神经网络（ANN）的常用技术。**它基于梯度下降优化算法，通过计算神经网络的输出和期望输出之间的误差，并沿着网络的反向传播误差信号进行参数更新，从而最小化误差和优化神经网络。

反向传播算法的关键思想是使用链式法则（Chain Rule）计算网络中各个层次的梯度。通过将误差信号从输出层向输入层反向传播，每个神经元都可以计算出对应的梯度。然后，根据梯度的信息，使用梯度下降或其他优化算法来更新各个连接权重，以最小化误差。

具体而言，反向传播算法的步骤如下：

前向传播：输入一个训练样本，将其在神经网络中进行前向传播，计算每个神经元的输出。
计算误差：将网络的输出与期望输出进行比较，计算误差。
反向传播：从输出层向输入层传播误差信号，计算每个神经元的梯度。
权重更新：根据梯度和学习率，更新神经网络中的连接权重。
重复步骤1至4，直到达到停止条件（如达到指定的迭代次数或误差阈值）。

通过反复迭代这些步骤，反向传播算法能够调整神经网络中的连接权重，从而训练出适应给定数据集的模型。它是一种经典的训练神经网络的方法，被广泛应用于各种任务，如图像识别、语音识别、自然语言处理等。

需要注意的是，反向传播算法中的梯度计算和权重更新是基于误差信号的传递，因此它要求网络中的激活函数是可微分的。目前，很多常用的激活函数，如Sigmoid、ReLU和Tanh函数，都满足这个要求。

26. 什么是卷积神经网络（CNN）？

**卷积神经网络（Convolutional Neural Network，CNN）是一种常用于图像识别和计算机视觉任务的神经网络架构。**它的设计灵感来自于生物视觉系统的结构，特别是哺乳动物的视觉皮层。

CNN 的核心思想在于利用卷积操作和权值共享来捕捉图像中的局部空间特征。相比于传统的全连接神经网络，CNN 更适用于处理高维输入数据（例如图像），并且能够有效地减少网络参数的数量。

CNN中主要的组件包括卷积层、池化层和全连接层：

卷积层：通过应用滤波器（也称为卷积核）对输入进行卷积操作，提取图像的局部特征，并生成一系列特征映射。每个特征映射代表一个滤波器对应的特征。
池化层：对特征映射进行下采样操作，减少维度和参数的数量。常用的池化操作包括最大池化（Max Pooling）和平均池化（Average Pooling）。
全连接层：在卷积和池化层之后，将提取到的特征映射进行展平操作，并连接到一个或多个全连接层上。全连接层的输出最终用于分类或回归等任务。

CNN的训练过程通常涉及到反向传播算法，以最小化输出与期望输出之间的误差。通过在训练集上进行反向传播和权重更新，CNN能够学习到适用于特定任务的特征，从而实现对输入图像的有效分类或识别。

由于卷积神经网络能够自动提取和学习图像中的特征，并具有位置不变性和参数共享等优势，因此在图像处理领域取得了显著的成功。除了图像识别，CNN也被广泛用于目标检测、语义分割、人脸识别和图像生成等任务。

27. 什么是循环神经网络（RNN）？什么是长短期记忆（LSTM）网络？

**循环神经网络（Recurrent Neural Network，RNN）是一类具有反馈连接的神经网络，用于处理序列数据。**与传统的前馈神经网络不同，RNN具有记忆功能，可以通过使用前一时刻的输出作为当前时刻的输入，使得网络可以处理具有时间相关性的数据。

RNN的基本结构是一个循环单元，它在不同时间步重复使用相同的权重参数。每个时间步的输入和前一时刻的输出被馈送给下一时刻的循环单元，从而构建起对序列数据进行处理和记忆的能力。

然而，传统的RNN存在梯度消失和梯度爆炸等问题，导致难以有效地处理长期依赖关系。为了解决这个问题，长短期记忆（Long Short-Term Memory，LSTM）网络被引入。

LSTM网络是一种特殊的循环神经网络，通过使用门控机制来处理长期依赖关系。LSTM单元中引入了三个门控单元：输入门（Input Gate）、遗忘门（Forget Gate）和输出门（Output Gate）。这些门控单元由激活函数和可学习的权重参数控制，使得LSTM网络可以选择性地接收、遗忘和输出信息。

LSTM的基本思想是在单位时间内决定应该接收哪些信息、遗忘哪些信息，然后更新和输出相应的记忆状态。这种门控机制有效地解决了传统RNN中的梯度消失和梯度爆炸问题，并使得网络能够更好地处理长期依赖关系。

LSTM网络被广泛应用于各种自然语言处理任务，如语言模型、机器翻译、语音识别等。它在许多序列数据的建模和处理任务中，表现出优秀的性能和泛化能力。

28. 什么是生成对抗网络（GAN）？

生成对抗网络（Generative Adversarial Network，GAN）是由生成器网络和判别器网络组成的一种框架，用于生成以假乱真的样本数据。GAN是由Ian Goodfellow等人于2014年提出的。

GAN的核心思想是通过两个网络之间的对抗学习来达到生成真实样本的目的。生成器网络通过学习数据分布的潜在空间表示，将这些潜在向量映射到样本空间，从而生成新的样本。判别器网络则根据输入是真实样本还是生成样本，来判断样本的真伪。

在训练过程中，生成器网络和判别器网络相互竞争，通过博弈的方式进行学习。生成器网络试图生成越来越逼真的样本，以欺骗判别器网络，而判别器网络则会努力提升自己的准确性，以区分真实样本和生成样本。这种对抗性的训练过程会使得生成器和判别器不断优化，最终生成器能够生成逼真的样本。

GAN可以应用于各种生成任务，如图像生成、文本生成和视频生成等。通过训练，GAN可以生成与训练数据相似的新样本，具有艺术创作、数据增强和生成虚拟场景等应用潜力。

然而，训练GAN网络也存在一些挑战，如模式崩溃（Mode Collapse），生成样本缺乏多样性等问题。为了克服这些问题，后续的研究提出了各种改进版本的GAN，如条件GAN（Conditional GAN）、Wasserstein GAN（WGAN）和CycleGAN等，进一步提升了GAN的性能和应用范围。

29. 什么是无监督聚类算法？给一个例子。

无监督聚类算法是一类机器学习算法，用于对无标签数据集进行分类或群组化。与有监督学习算法不同，无监督聚类算法不需要预先标记的训练样本，而是通过分析数据之间的相似性或距离来将数据划分为不同的组别（簇）。

一个经典的无监督聚类算法是K-means聚类。K-means算法将数据集划分为K个不重叠的簇，其中K是用户指定的参数。算法的核心思想是在迭代的过程中，将每个样本分配到离它最近的聚类中心，并通过重新计算聚类中心来更新每个簇的位置，直到满足停止准则（如簇内误差最小化）为止。

K-means聚类是一种常用的无监督聚类算法，用于将数据集分为K个不重叠的簇。该算法通过迭代的方式寻找最优的聚类中心，使得簇内的样本点与其所属簇内的聚类中心之间的距离最小化。

K-means算法的步骤如下：

初始化：随机选择K个样本作为初始聚类中心。
聚类分配：对于每个样本点，计算其与各个聚类中心的距离，并将其分配到与之最近的聚类中心所属的簇中。
更新聚类中心：对于每个簇，计算簇内所有样本点的均值，并将其作为新的聚类中心。
迭代：重复步骤2和3，直到聚类中心不再发生变化，或达到预定的迭代次数。

K-means算法的优化目标是最小化所有样本点与其所属簇内的聚类中心之间的距离之和（也称为簇内误差平方和，SSE），该目标通过迭代过程逐渐减小。

K-means算法的特点包括简单易实现、计算效率高和可解释性强。然而，它对初始聚类中心的选择敏感，可能会收敛到局部最优解，而不是全局最优解。为了克服这些问题，可以多次运行K-means算法，选择具有最小SSE的聚类结果，或者使用改进版本的K-means算法。

K-means算法在许多领域有广泛应用，例如市场分割、图像分割、推荐系统和生物信息学等。

例如，假设有一组包含样本点的二维数据集，我们希望将它们分为两个独立的簇。使用K-means算法，我们可以选择初始的聚类中心，并迭代地将样本点分配到最接近的聚类中心中，然后根据分配结果更新聚类中心的位置，直到最终收敛。最终，我们将获得两个簇，每个簇都包含与其最接近的聚类中心相关联的样本点。

除了K-means，还有其他许多无监督聚类算法，如层次聚类（Hierarchical Clustering）、DBSCAN（Density-Based Spatial Clustering of Applications with Noise）和高斯混合模型（Gaussian Mixture Model）等。这些算法适用于不同的数据分布和聚类需求，根据具体场景选择合适的算法能够有效地进行数据分类和群组化。

30. 什么是聚类评估指标？举个例子。

聚类评估指标是用来度量聚类结果质量的指标，用于评估聚类算法的性能和选择最佳的聚类数量。这些指标通常根据聚类结果与给定的标签或真实的类别信息之间的比较来计算。

其中两个常用的聚类评估指标是轮廓系数（Silhouette Coefficient）和调整兰德指数（Adjusted Rand Index）。

轮廓系数：轮廓系数用于对聚类质量进行评估，取值范围为[-1, 1]。轮廓系数结合了簇内样本相似性和簇间样本不相似性的概念。对于每个样本，轮廓系数首先计算其与同簇内其他样本的平均距离（a），然后计算其与最近的其他簇内样本的平均距离（b）。最终的轮廓系数是所有样本轮廓系数的平均值。较高的轮廓系数表示样本与簇内其他样本更相似，并且与最近的其他簇更不相似。
调整兰德指数：调整兰德指数用于衡量聚类结果与给定标签之间的相似性，取值范围为[-1, 1]。调整兰德指数考虑了聚类结果中簇的数量和相同簇样本分配的一致性。如果聚类结果与标签完全一致，则调整兰德指数为1；如果它们之间没有任何一致性，则调整兰德指数为0；如果它们的一致性与随机分配的一致性相当，则调整兰德指数为0。

举个例子，假设我们有一个数据集，我们使用K-means算法将数据分成了K个簇，并且存在真实的标签信息。我们可以使用轮廓系数和调整兰德指数来评估聚类结果。对于轮廓系数，我们计算每个样本的平均轮廓系数，并取所有样本的平均值作为最终结果。对于调整兰德指数，我们将聚类结果与真实标签信息进行比较，并计算两者之间的一致性程度。

通过聚类评估指标，我们可以对不同的聚类算法、聚类数量或参数进行比较和选择，从而获得更好的聚类结果。

SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
深入解读MaaS技术架构：从模型服务到智能部署的全流程分析 Cc不爱吃洋葱架构人工智能大语言模型大模型智能部署 MaaS技术架构 LLM
随着人工智能（AI）的迅速发展，MaaS（ModelasaService，模型即服务）技术架构应运而生。它通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。本文将深入解析MaaS技术架构，详细阐述其各个组成部分以及如何在实际应用中高效发挥其功能。一、使用方层：从应用接入到业务赋能MaaS技术架构的顶层是使用方层，它主要面向第三方应用，是企业与M
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
2025 年机器学习工作流程的 7 个 AI 代理框架盖瑞理 AI Agent 人工智能
介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。虽然这些操作任务至关重要，但它们通常会占用团队60%到80%的时间，几乎没有留下任何创新和模型改进的空间。传统的自动化工具可以处理简单的、基于规则的工作流程，但它们难以应对机器学习操作所需的动态决策。何时应该根据性能漂移重新训练模型？当数据分布发生变化时，如何自动调整超参数？这些场景需要能够推理复杂
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
人工智能-基础篇-23-智能体Agent到底是什么？怎么理解？（智能体=看+想+做） weisian151 人工智能人工智能
1、智能体是什么？想象你有一个超级聪明的小助手，它能：自己看环境（比如看到天气、听到声音、读到数据）；自己做决定（比如下雨了要关窗，电量低要去充电）；自己动手干活（比如帮你订外卖、打扫房间、开车）；越用越聪明（比如记住你的习惯，下次不用你提醒）。这个“小助手”就是智能体（Agent）——它是一个能自主感知、思考、行动并学习的系统，可以是软件（比如手机里的AI助手）、硬件（比如机器人），或者软硬结合
多角色AI Agent：基于LLM的虚拟角色扮演系统 AI天才研究院 AI人工智能与大数据人工智能 ai
多角色AIAgent：基于LLM的虚拟角色扮演系统关键词多角色AIAgentLargeLanguageModel(LLM)虚拟角色扮演系统人工智能自然语言处理程序设计摘要本文旨在探讨多角色AIAgent的基础知识以及其如何在虚拟角色扮演系统中发挥作用。我们将首先介绍多角色AIAgent的概念、历史背景和基本原理。随后，我们将深入探讨LLM（大语言模型）在虚拟角色扮演系统中的应用，包括其工作原理、核
【算法】解数独：C++ 实现与策略探讨 master_chenchengg 算法提升算法 java 开发语言
【算法】解数独：C++实现与策略探讨一、引言：C++算法技术的魔力与解数独的智慧二、技术概述：数独求解的艺术定义与技术框架核心特性和优势代码示例：基础回溯解法三、技术细节：解数独的逻辑与挑战原理解析难点分析四、实战应用：从游戏到人工智能应用场景解决方案展示五、优化与改进潜在问题改进建议六、常见问题与解决方案七、总结与展望一、引言：C++算法技术的魔力与解数独的智慧在算法领域，C++凭借其高效、灵活
FastMCP：用于构建MCP服务器的开源Python框架 NetX行者 AI编程服务器开源 python
在人工智能领域，模型上下文协议（ModelContextProtocol，简称MCP）作为一种标准化的协议，为大型语言模型（LLM）提供了丰富的上下文和工具支持。而FastMCP作为构建MCP服务器和客户端的Python框架，以其简洁的API设计、高效的开发体验以及强大的扩展能力，正逐渐成为开发者们的首选工具。一、FastMCP简介FastMCP是一个用于构建MCP服务器和客户端的Python框架
Python在人工智能领域的实际应用：示例代码解析辣条yyds python python 人工智能开发语言
摘要：本文将通过几个典型的人工智能应用场景，展示Python在图像识别、自然语言处理、推荐系统等方面的高级用法。通过示例代码，带大家深入理解Python在人工智能领域的实际应用。正文：Python作为一门流行的编程语言，凭借其简洁的语法、丰富的库和框架，成为了人工智能（AI）领域的主流开发语言。下面，我们将通过几个示例，探讨Python在人工智能方向的实际应用。示例一：图像识别-使用OpenCV进
Tansformer的Multi-Head Attention组件数字化与智能化大模型基础 Transformer框架 transformer 多头注意力机制
一、Transformer的注意力机制Transformer的注意力机制是对传统序列建模方法的颠覆性创新。它通过全局并行的关联计算解决了RNN的效率与长距离依赖瓶颈，通过动态权重和多头设计增强了模型对复杂信息的捕捉能力，最终成为现代人工智能的核心技术基石。其意义不仅在于提升了模型性能，更在于提供了一种“计算关联”的通用思路，推动了人工智能向更高效、更通用的方向发展。在Transformer之前，循
生成式人工智能实战 | 条件生成对抗网络（conditional Generative Adversarial Network, cGAN）盼小辉丶生成对抗网络神经网络深度学习生成式人工智能 pytorch
生成式人工智能实战|条件生成对抗网络0.前言1.条件生成对抗网络1.1GAN基础回顾1.2cGAN核心思想2.cGAN网络架构2.1数学原理2.2网络架构3.实现cGAN3.1环境准备与数据加载3.2模型构建3.3模型训练0.前言生成对抗网络(GenerativeAdversarialNetwork,GAN)是近年来深度学习领域最具突破性的技术之一，能够生成逼真的图像、音频甚至文本。然而，传统的G
【人工智能】Maas（模型即服务）（Model as a Service）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。本本本添哥 A -AIGC 人工智能大模型人工智能云计算
ModelasaService（模型即服务，MaaS）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。MaaS通过云原生架构和标准化服务，正在重塑AI技术的开发和消费方式，推动人工智能从“技术专有”向“普惠工具”转变。以下是其核心要点：1.定义与核心理念MaaS将大模型（如GPT-3、多模态模型等）封装为标准化服务，用户
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 实例化 OCR 对象的 predict() 方法介绍
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
NumPy：科学计算的超能引擎[特殊字符]（深入剖析+实战技巧）码海漫游者8 numpy 其他
文章目录为什么NumPy是Python科学计算的绝对核心？三维痛点直击ndarray：NumPy的核武器剖析内存布局揭秘（超级重要‼️）维度操作黑科技广播机制（Broadcasting）性能屠杀现场️高级技巧武装包️内存映射大文件爱因斯坦求和约定结构化数组真实世界应用场景图像处理机器学习数据预处理踩坑预警⚠️视图vs副本整数溢出性能压榨终极指南避免复制四法则终极加速方案你知道吗？就在你刷短视频的几
Python 机器学习实战：Scikit-learn 算法宝典，从线性回归到支持向量机清水白石008 python Python题库 python 机器学习算法
Python机器学习实战：Scikit-learn算法宝典，从线性回归到支持向量机引言各位Python工程师，大家好！欢迎来到激动人心的机器学习世界！在这个数据驱动的时代，机器学习已经渗透到我们生活的方方面面，从智能推荐系统到自动驾驶汽车，都离不开机器学习技术的支撑。作为一名Python开发者，掌握机器学习技能，无疑将为您的职业发展注入强大的动力，让您在人工智能浪潮中占据先机。Scikit-lea
提示词工程在实体关系抽取中的创新 AI天才研究院计算 ChatGPT AI人工智能与大数据 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
1.5概念结构与核心要素组成在深入探讨提示词工程在实体关系抽取中的应用之前，我们需要对其概念结构与核心要素组成有一个清晰的理解。这一部分将介绍提示词工程的基本框架，以及实体关系抽取的关键技术。提示词工程的基本框架提示词工程（PromptEngineering）是指利用人工智能技术和自然语言处理方法，设计并优化用于训练语言模型的输入提示（prompt），以达到特定任务目标的过程。其核心框架包括以下几
别再瞎摸索了！HarmonyOS AI 字幕控件用法全解析
引言现在视频、音频这些多媒体内容越来越多，用户对字幕的需求也跟着水涨船高，毕竟谁不想轻松看懂听不懂的内容呢？而且这两年人工智能技术发展得这么快，早就该用到字幕领域了——以前全靠人工打字幕，费时费力还容易出错，现在有了AI帮忙，简直是解放双手！正好HarmonyOS推出了AI字幕控件，这东西能自动识别语音、生成字幕，一下子就让视频和音频内容变得更易用了。对咱们做鸿蒙原生应用的人来说，更是省了大事儿—
Python机器学习入门必看！从原理到实战，手把手教你线性回归模型小张在编程 python 机器学习线性回归
引言在人工智能浪潮席卷全球的今天，机器学习（MachineLearning）早已不再是实验室的“黑科技”——打开购物APP的“猜你喜欢”、输入搜索词后的“相关推荐”、甚至天气预报中的温度预测，背后都有机器学习模型的身影。而在线性回归（LinearRegression）作为机器学习中最基础、最经典的监督学习模型，堪称机器学习的“敲门砖”。本文将从原理到实战，带你彻底掌握这一核心算法。一、机器学习的“
【linux】ssh 远程执行命令自动输入密码方式檀越@新空间 s5 Linux学习 linux ssh 服务器
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。✨✨欢迎订阅本专栏✨✨博客目录一.自动输入密码二.sshpass方式1.安装sshpass2.源码下载3.安装过程4.验证三.expect方式1.脚本2.执行前些天发现了一个巨牛的人工智能
机器学习的数学基础-线性代数
本文用于复习并记录机器学习中的相关数学基础，仅供学习参考。很多总结和例子来源于mml项目（mml-book.github.io）十分感谢这本书的作者，PS：这本书目前没有中文版。线性代数线性方程组矩阵矩阵的加法与乘法矩阵加法矩阵乘法单位矩阵与标量相乘逆与转置逆转置解决线性方程组特解与通解高斯消元法初级变换应用：“-1”trick应用：求逆总结-如何解决线性方程组？向量空间群向量空间向量子空间线性独
【AIGC时代】OneCode前端框架入门指南：从环境搭建到第一个应用低代码老李 OneCode实战低代码软件行业学习前端框架
在人工智能生成内容(AIGC)技术飞速发展的今天，前端开发领域正经历着前所未有的变革。AI工具能够批量生成代码，但如何将这些自动生成的代码转化为可维护、高质量的生产级应用，成为开发者面临的核心挑战。OneCode框架凭借其独特的设计理念，在这一背景下展现出显著优势，本文将带您从零开始，快速掌握OneCode框架的使用方法。一、AIGC背景下选择OneCode框架的四大理由AIGC工具的普及为前端开
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
人工智能驱动下的可再生能源气象预测：构建绿色能源时代的新大脑一ge科研小菜菜人工智能人工智能能源
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、背景：新能源快速发展下的预测焦虑为应对气候变化和实现碳中和目标，全球能源系统正在加速从“化石主导”向“可再生主导”过渡。风能、太阳能等清洁能源已成为未来能源结构的关键支柱。根据国际能源署（IEA）预测，到2050年，全球超70%的电力将来自可再生能源。然而，可再生能源具有显著的**“天气依赖性”和“波动不确定性”**，风速、光照、温度、湿度等
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro