许多仙

【机器学习】

说明：机器学习总结

0、数据集

1、贝叶斯分类器

（一）计算题

所有样本分为两类（c ）：好瓜=是、好瓜=否
（1）计算先验概率：P(c )

（2）计算每个属性的条件概率：P(xi | c)

（3）代入朴素贝叶斯公式：

（4）结论：

（5）拉普拉斯修正（平滑处理，可选）
上面的公式中出现连乘现象，这会导致对于0特别敏感，比如出现一个0，就会直接导致最终结果直接为0

其中：
N——所有类别数，这里一个有两类，所以N=2

Ni——第i个属性可能的取值数，也就是某个属性的取值可能有多少个

（二）概念题

（1）EM算法

EM算法是一种迭代式的、常用的估计参数隐变量的方法，常用于高斯混合模型参数的学习。
``
E步：期望步，利用当前估计的参数值，来计算对数似然的期望值，用作下一步的输入。
M步：最大化步，寻找能够使得似然期望最大化的参数值
然后不断迭代，直到达到终止条件。

不断迭代，E步的值不断用于M步。

2、SVM支持向量机（Support Vector Machine)

是一个有监督的学习模型，通常用来进行模式识别、分类以及回归分析。

使用的是最优化方法的相关理论，所以通过引入【松弛变量】的方法克服过拟合。

支持向量机的求解通常是借助于凸优化技术，如何提高效率,使SVM能适用于大规模数据一直是研究重点.

对线性核SVM已有很多成果,例如基于割平面法(cutting plane algorithm)的 SVMperf具有线性复杂度

基于随机梯度下降的 Pegasos速度甚至更快，而坐标下降法则在稀疏数据上有很高的效率。

3、决策树

（一）计算题

（1）计算【色泽】这个属性的信息熵：Ent

公式比较好记：类别累加
比如二分类任务（只有两个类比，比如好瓜=是、好瓜=否）

核心公式：
好瓜比例*log(好瓜比例) + 坏瓜比例*log(坏瓜比例)

别忘取负值

总体的信息熵：

各个属性的信息熵：

（2）计算信息增益：Gain

（3）计算其他信息增益，比较得出结点应该是哪一个：

随后，忽略已经确定为结点的属性（比如纹理已经确定）
再依次以纹理下面的数据集为基础计算，从而确定下一个结点应该用哪一个属性

（二）概念题

（1）决策树优化
决策树是一种强大而灵活的机器学习算法。尽管它有一些局限性，但通过剪枝、集成方法、选择合适的决策树变种，可以在很大程度上克服这些缺点。

剪枝（Pruning）：剪枝是为了防止决策树过拟合的一种常用技术。剪枝的过程是在决策树生成后，对其进行简化。主要有预剪枝和后剪枝两种方法。

预剪枝是在生成决策树的过程中，对每个节点在划分前先进行估计，若当前节点的划分不能带来决策树泛化性能提升，则停止划分并将当前节点标记为叶节点。

后剪枝则是先从训练集生成一颗完整的决策树，然后自底向上地对非叶节点进行考察，若将该节点对应的子树替换为叶节点能提高决策树的泛化性能，则将该子树替换为叶节点。

随机森林（Random Forest）：随机森林是由多个决策树组成的集成模型。在训练时，随机森林会随机抽取样本和特征来生成多个决策树，然后通过投票或平均的方式集成各个决策树的预测结果。这种方法能够显著提高模型的泛化性能，并且能够提供特征的重要性评估。

决策树的变种：如CART（Classification and Regression Tree）、ID3、C4.5、C5.0等都是决策树的不同变种，它们在特征选择、树的生成和剪枝等方面有所不同，适用于不同的场景。

4、集成学习

根据个体学习器的生成方式,目前的集成学习方法大致可分为两大类：
个体学习器间存在强依赖关系、必须串行生成的序列化方法,
个体学习器间不存在强依赖关系、可同时生成的并行化方法;

前者的代表是 Boosting, Boosting族算法最著名的代表是AdaBoost
后者的代表是Bagging和“随机森林”(Random Forest).

1、
Boosting是一族可将弱学习器提升为强学习器的算法,一种串行集成学习策略，Boosting中的每个模型都试图纠正其前一个模型的错误。
这族算法的工作机制类似：先从初始训练集训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直至基学习器数目达到事先指定的值T,最终将这T个基学习器进行加权结合.
Boosting族算法最著名的代表是AdaBoost，还有梯度提升（Gradient Boosting）和XGBoost等。
·
个人理解：串行学习策略：每一个模型都试图纠正其前一个模型的错误，所以形成了强依赖、串行的形式

2、
Bagging（自举汇聚法）：Bagging是并行集成学习的一种策略。它通过在原始数据上使用自举样本（即带有替换的随机样本）训练多个基模型，并将它们的预测结果进行投票（分类问题）或平均（回归问题）来提高预测性能。随机森林是最常用的Bagging算法。
·
个人理解：随机森林是决策树的集成，树是并行的。并行的方式最后需要一个汇总，也就是投票或者平均。

5、关联规则

（一）计算题

（1）关联规则XY的支持度support、置信度Confidence
因为支持度本身就是出现频率（分母都是D），所以一般可以直接从图中直接看出来。
而支持度是跟【频繁项集】判断相关。
置信度跟【强关联规则】判断相关

（二）概念题

（1）Apriori算法：

假设有一个超市，这个超市正在尝试了解哪些产品经常被一起购买，以便于可以更好地放置产品，或者提供优惠以增加销售。他们拥有以下五笔购物数据（事务）：

{牛奶, 鸡蛋, 面包}
{牛奶, 面包, 黄油}
{面包, 鸡蛋}
{牛奶, 鸡蛋, 黄油}
{面包, 黄油}
现在，他们想找出最常被一起购买的商品对。Apriori算法就可以用来解决这个问题。
为了简化，我们这里设最小支持度（即最小频繁度）为2。
-------------------------------------------------------------
步骤1：首先，我们从k=1，也就是单项集开始考虑
我们计算所有单个商品的支持度（在所有事务中出现的次数）。得到的结果如下：

牛奶: 3
鸡蛋: 3
面包: 4
黄油: 3
这些都大于我们的最小支持度2，所以都是频繁项集。
-------------------------------------------------------------
步骤2：我们生成候选的2-项集，并计算他们的支持度(X且Y同时出现的次数，也就是频率)。

{牛奶, 鸡蛋}: 2
{牛奶, 面包}: 2
{牛奶, 黄油}: 2
{鸡蛋, 面包}: 2
{鸡蛋, 黄油}: 1
{面包, 黄油}: 2
{鸡蛋, 黄油}的支持度低于我们设定的最小支持度2，因此我们将其剔除。
-------------------------------------------------------------
步骤3：然后我们会根据2-项集生成3-项集，但在这个例子中所有的3-项集在事务中的出现次数都小于最小支持度2，
所以都被剔除。具体过程如下：
在上一步，我们找出了所有支持度大于等于2的2-项集，分别是：
{牛奶, 鸡蛋}
{牛奶, 面包}
{牛奶, 黄油}
{鸡蛋, 面包}
{面包, 黄油}
现在，我们来生成可能的3-项集。这里我们会使用到Apriori的一个重要性质：如果一个项集是频繁的，那么它的所有子集也必须是频繁的。这意味着，如果一个3-项集是频繁的，那么它的所有2-项子集也必须是频繁的。

在生成3-项集的过程中，我们只需要将两个有公共元素的2-项集合并，然后检查生成的3-项集的所有2-项子集是否都在我们的频繁2-项集中。

下面是所有可能的3-项集及其支持度：

{牛奶, 鸡蛋, 面包}: 1
{牛奶, 鸡蛋, 黄油}: 1
{牛奶, 面包, 黄油}: 1
{鸡蛋, 面包, 黄油}: 0
可以看到，所有的3-项集的支持度都小于最小支持度2，因此没有频繁的3-项集。

所以，在这个例子中，最常被一起购买的商品对仍然是：{牛奶, 鸡蛋}、{牛奶, 面包}、{牛奶, 黄油}、{鸡蛋, 面包}和{面包, 黄油}。

所以，最常被一起购买的商品对（k>=2）是：
{牛奶, 鸡蛋}、
{牛奶, 面包}、
{牛奶, 黄油}、
{鸡蛋, 面包}、
{面包, 黄油}。

这就是Apriori算法在市场篮子分析中的一个简单例子。

Apriori算法是一种用于发现频繁项集的经典关联规则挖掘算法。它基于一种称为"Apriori原理"的观念，该原理认为在一个频繁项集中的任何子集都必须是频繁的。Apriori算法通过迭代的方式逐步生成频繁项集，从而发现数据集中的关联规则。

以下是Apriori算法的步骤：

1、初始化：首先，算法扫描数据集，确定所有单个项的支持度（出现频率）。然后，根据一个预设的最小支持度阈值，筛选出满足支持度要求的频繁1项集。

2、生成候选项集：根据频繁k-1项集生成候选k项集。具体而言，算法通过连接操作将频繁k-1项集的项组合起来，生成候选k项集。

3、剪枝步骤：在生成的候选k项集中，删除不满足"Apriori原理"的项集。即，如果一个候选项集的任何k-1项子集不是频繁k-1项集，则该候选项集也不会是频繁k项集。

4、计算支持度：对于剪枝后的候选k项集，算法重新扫描数据集，计算每个候选项集的支持度。

5、筛选频繁项集：根据预设的最小支持度阈值，筛选出满足支持度要求的频繁k项集。这些频繁k项集将成为下一轮迭代的基础，用于生成候选k+1项集。

重复步骤2至步骤5，直到没有更多的频繁项集生成。在每一轮迭代中，Apriori算法逐步生成更高阶的频繁项集，直到无法生成更多的频繁项集为止。

通过这些步骤，Apriori算法能够发现频繁项集，并基于频繁项集构建关联规则，
其中规则的置信度可以通过支持度进行计算。这些关联规则可以用于分析数据集中的相关性和依赖关系。

项集：最基本的模式是项集，它是指若干个项的集合。

1、支持度相关：频繁项集（简称频集）：所有支持度大于最小支持度的项集的集合

2、置信度相关：强关联规则：置信度大于最小置信度的关联规则

首先找出所有的频集，这些项集出现的频繁性至少和预定义的最小支持度一样。
然后由频集产生强关联规则，这些规则必须满足最小支持度和最小可信度。
·
然后使用第1步找到的频集产生期望的规则，产生只包含集合的项的所有规则，其中每一条规则的右部只有一项，这里采用的是中规则的定义。
一旦这些规则被生成，那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集，使用了递归的方法。

6、聚类

（1）K-means聚类算法的工作原理

假设我们有一组二维点（即每个点有两个属性或特征），如下：

(1,  1)
(1.5,2)
(3,  4)
(5,  7)
(3.5,5)
(4.5,5)
(3.5,4.5)
我们想把这些点聚为两类。以下是K-means算法的执行步骤：

步骤1：初始化（聚类中心，也就是【质心】）

首先，我们随机选择两个点作为初始的聚类中心。假设我们选择点1（1,1）和点4（5,7）作为初始的聚类中心。

---------------------------------------------------------------------
步骤2：分配点到最近的聚类中心

我们计算每个点到两个聚类中心的距离，并把每个点分配到最近的聚类中心。计算距离的常用方式是欧氏距离。现在我们得到两个聚类：

聚类1（中心点为1）：(1,1), (1.5,2)
聚类2（中心点为4）：(3,4), (5,7), (3.5,5), (4.5,5), (3.5,4.5)

具体步骤：
我们有两个聚类中心，分别是点1（1,1）和点4（5,7）。
接下来我们将计算每个点到这两个聚类中心的距离，
并将它们分配到最近的聚类中心。

使用欧氏距离公式（高中最简单的两点间距离公式）：距离 = sqrt((x2-x1)^2 + (y2-y1)^2)

对于点(1,1)：
距离聚类中心1：0（点(1,1)本身就是聚类中心1）
距离聚类中心2：sqrt((5-1)^2 + (7-1)^2) = sqrt(16 + 36) = sqrt(52)
结论：点(1,1)距离聚类中心1更近，所以被分配到聚类1
点(1.5,2)：

对于点(1.5,2)：
距离聚类中心1：sqrt((1.5-1)^2 + (2-1)^2) = sqrt(0.25 + 1) = sqrt(1.25)
距离聚类中心2：sqrt((5-1.5)^2 + (7-2)^2) = sqrt(3.5^2 + 5^2) = sqrt(12.25 + 25) = sqrt(37.25)
结论：点(1.5,2)距离聚类中心1更近，所以被分配到聚类1
点(3,4)：

......


---------------------------------------------------------------------
步骤3：重新计算聚类中心

我们计算每个聚类中所有点的平均值，得到新的聚类中心：

聚类1的新中心点：((1+1.5)/2, (1+2)/2) = (1.25, 1.5)
聚类2的新中心点：((3+5+3.5+4.5+3.5)/5, (4+7+5+5+4.5)/5) = (3.9, 5.1)


---------------------------------------------------------------------
步骤4：重复步骤2和3，直到聚类中心不再变化，或者达到终止条件

我们重复步骤2和3，直到聚类中心不再变化，或者变化很小。在这个例子中，如果我们继续执行算法，聚类中心可能会在下一步变为：

聚类1的新中心点：(1.25, 1.5)
聚类2的新中心点：(4, 5)
最终，我们的结果是两个聚类：

聚类1：(1,1), (1.5,2)
聚类2：(3,4), (5,7), (3.5,5), (4.5,5), (3.5,4.5)
这就是K-means聚类算法的一个简单例子。

7、其他

监督学习：在这种学习模式中，机器学习算法从标记的训练数据中学习，即每个数据样本都有一个相应的标签或结果。例如，一个分类算法会学习从一组数据特征到一个或多个定义的类别标签的映射。
常见的监督学习算法包括线性回归、逻辑回归、决策树、随机森林、支持向量机等。

无监督学习：与监督学习不同，无监督学习算法处理的是未标记的数据。这类算法试图在数据中发现隐藏的结构和关系。
常见的无监督学习算法包括K-means聚类、层次聚类、DBSCAN、主成分分析（PCA）等。

2024最新动物识别数据集（12-02已更新) 数据猎手小k 机器学习自然语言处理人工智能
动物识别数据集是用于训练和评估动物识别模型的集合，这些数据集通常包含多种动物的图像或视频，以及对应的标签信息。它们在生物多样性监测、生态研究、农业和城市安全管理等领域发挥着重要作用。随着深度学习技术的发展，动物识别数据集的处理方式、算法逻辑和模型搭建与训练流程也在不断进步，以提高识别的准确性和效率。一、背景意义动物识别技术的发展对于生物多样性保护、生态学研究、农业和野生动物保护等多个领域具有重要意
Python 领域 vllm 优化模型推理速度的方法 Python编程之道 Python编程之道 python 开发语言 ai
Python领域vLLM优化模型推理速度的方法关键词：Python、vLLM、模型推理速度、优化方法、推理性能摘要：本文聚焦于Python领域中vLLM对模型推理速度的优化方法。首先介绍了相关背景知识，包括vLLM的概念和优化模型推理速度的重要性。接着阐述了vLLM的核心概念与架构，详细分析了其优化的原理。通过具体的Python代码展示了核心算法原理及操作步骤，同时给出了相应的数学模型和公式进行理
c++11 标准模板（STL）（std::locale）（一）繁星璀璨G 本地化库 c++标准库模板 STL locale 本地环境
用以封装文化差异的多态刻面的集合classlocale;std::locale类型对象是不可变平面的不可变索引集。C++输入/输出库的每个流对象与一个std::locale对象关联，并用其平面分析及格式化所有数据。另外，locale对象与每个std::basic_regex对象关联。locale对象亦可在标准容器和算法中用作进行字符串对照的谓词，而且能被直接访问，以获得或修改其所保有的平面。C++
【牛客刷题】实现返回最大的不大于n的完美数的函数字节卷动牛客刷题 java 算法牛客
文章目录一、题目介绍1.1题目描述1.2输入描述1.3输出描述1.4示例二、解题思路2.1核心算法设计2.2性能优化关键2.3算法流程图三、解法实现3.1解法一：借位+贪心3.1.1初级版本分析3.2解法二：优化版（推荐）3.2.1优化版本分析四、总结与拓展4.1关键优化技术4.2进阶优化方向4.3应用场景扩展一、题目介绍1.1题目描述给定一个正整数n，定义一个完美数为每一位数字只包含1、2、3的
机器学习的数学基础-线性代数
本文用于复习并记录机器学习中的相关数学基础，仅供学习参考。很多总结和例子来源于mml项目（mml-book.github.io）十分感谢这本书的作者，PS：这本书目前没有中文版。线性代数线性方程组矩阵矩阵的加法与乘法矩阵加法矩阵乘法单位矩阵与标量相乘逆与转置逆转置解决线性方程组特解与通解高斯消元法初级变换应用：“-1”trick应用：求逆总结-如何解决线性方程组？向量空间群向量空间向量子空间线性独
AlphaGPT通过国家AIGC生成式算法备案，为法律专业人士提供更加合规可靠的ai技术支持资讯分享周 AIGC 人工智能
在当前互联网信息时代,大模型算法已成各行业不可或缺的核心,不仅改善生活和工作,也在创新中展现巨大潜力。然而,随着算法应用的普及,如何合规管理算法,保护用户权益和隐私,确保公正运行,成为重要议题。日前,国内领先的法律科技企业iCourt宣布,其自主研发的法律垂类领域大模型AlphaGPT成功通过国家生成式模型深度学习合成算法备案。本次备案的通过,彰显了iCourt在法律AI领域有迈向了一个新的里程碑
C++11标准库算法：深入理解std::none_of 码事漫谈 c++11 c++算法 java
文章目录函数原型与核心语义模板参数约束实现原理与标准库设计思想与all_of/any_of的逻辑关系应用场景1.输入验证2.状态检查3.与函数对象结合4.替代传统循环性能特性与注意事项复杂度保证迭代器选择建议谓词设计要点C++标准演进与扩展总结C++11标准为STL带来了诸多革命性改进，其中算法库的扩展尤为引人注目。std::none_of作为新增的三大逻辑判断算法之一（与std::all_of、
三种方法详解最长回文子串问题
文章目录题目描述方法一：动态规划状态转移方程：状态转移公式：代码实现：使用滚动数组优化空间方法二：中心扩展法核心思想算法步骤代码实现复杂度分析方法三：马拉车算法算法思路代码实现复杂度分析三种方法对比回文子串是字符串处理中的经典问题，本文将通过动态规划、中心扩展和马拉车算法三种方法，详细解析如何高效求解最长回文子串，并对比各方法的优劣。题目描述方法一：动态规划我们定义一个二维布尔数组dp，其中：dp
力扣经典算法之爬楼梯
今天来用两种的方法解一道题题目如下：假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？先分析题目吧，我觉得它在考我数学思维，解数学题嘛，一步步来吧。n=1：走1步，只能有1种解法n=2：可以走1+1步，也可以直接走2步，2种解法n=3：可以走的方式有：1+1+1，1+2，2+1，共3种n=4：走法有1+1+1+1，1+2+1，2+1+1，1+1
【LeetCode 热题 100】54. 螺旋矩阵 xumistore LeetCode leetcode 矩阵算法 java
Problem:54.螺旋矩阵题目：给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。文章目录整体思路完整代码时空复杂度时间复杂度：O(M*N)空间复杂度：O(1)(不考虑输出列表)整体思路这段代码旨在解决一个经典的矩阵问题：螺旋矩阵(SpiralMatrix)。问题要求按照顺时针螺旋的顺序，返回矩阵中的所有元素。该算法采用了一种非常直观的“路径模拟”策略。它模拟一个
算法45：动态规划专练(力扣70: 爬楼梯力扣746：使用最小花费爬楼梯) 适合java程序员的算法算法算法动态规划 leetcode
力扣70题：爬楼梯假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？示例1：输入：n=2输出：2解释：有两种方法可以爬到楼顶。1.1阶+1阶2.2阶示例2：输入：n=3输出：3解释：有三种方法可以爬到楼顶。1.1阶+1阶+1阶2.1阶+2阶3.2阶+1阶分析：1.如果有1个楼梯，那只能走1步登顶。1中方法2.如果有2个楼梯。a.我们可以一次走一
区块链重塑域名商业版图：技术革新、市场机遇与未来图景 boyedu 区块链终端域名区块链终端域名
在Web3.0时代，区块链技术正以去中心化、抗审查、身份绑定等特性重构域名系统，不仅解决了传统DNS的安全漏洞与中心化风险，更开创了数字身份、品牌资产化等全新商业模式。以下从技术革新、市场现状、挑战应对及典型案例四个维度，深入剖析区块链域名的商业潜力。一、技术革新：区块链如何重构域名基础设施？去中心化根域名系统Handshake协议：通过UTXO模型与SHA3算法构建无需许可的域名注册体系，其HN
SEO优化技巧深度解析：从算法逻辑到实战策略的全链路突破 boyedu 网站建设网站建设网站运营网站架构
第一章搜索引擎算法逻辑：SEO优化的底层密码1.1算法进化史：从关键词匹配到意图理解搜索引擎算法经历了从简单关键词匹配到复杂语义理解的跨越式发展。早期算法以PageRank为核心，通过分析网页间链接关系评估权威性。随着Hummingbird算法的推出，搜索引擎开始解析自然语言，BERT算法进一步实现上下文语义理解。当前算法已形成多维度评估体系，涵盖内容质量、用户体验、权威性建设等层面。以Googl
香港推出的稳定币和数字货币的区别 boyedu 加密货币数字货币香港稳定币加密货币虚拟货币
香港推出的稳定币与数字货币在定义、发行主体、监管框架、使用场景及战略定位上存在显著差异。以下为具体解析：一、定义与性质的核心区别稳定币定义：与法定货币（如美元、港元）或资产挂钩的加密货币，旨在通过抵押或算法维持价值稳定。示例：京东币链科技测试的稳定币锚定港元，用于跨境支付；蚂蚁数科计划发行与美元挂钩的稳定币。特点：保留加密货币的去中心化特性，但通过储备资产（如现金、国债）减少价格波动。数字货币定义
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
云原生API Gateway：连接微服务的桥梁 AI云原生与云计算技术学院云原生 gateway 微服务 ai
云原生APIGateway：连接微服务的桥梁关键词：云原生、API网关、微服务架构、服务治理、流量管理、服务网格、DevOps摘要：本文深入探讨云原生环境下API网关的核心原理与实践应用，解析其在微服务架构中作为统一入口的关键作用。通过详细阐述API网关的核心功能、技术架构、算法原理及数学模型，结合Kubernetes实战案例演示流量管理、安全防护、服务编排等核心能力。同时分析典型应用场景，推荐前
开源的人像动画生成工具LivePortrait 研创通之逍遥峰图像处理人工智能作画
LivePortrait是由快手科技联合中国科学技术大学和复旦大学共同开发的一款先进AI驱动肖像动画工具，它能够将静态的人像照片转化为带有真实面部表情和头部运动的动态视频。这项技术代表了当前AI生成内容(AIGC)领域的最新进展，通过创新的算法设计和高效的计算框架，为用户提供了强大且易用的动画生成能力。以下将从技术原理、核心功能、应用场景、使用方法和比较优势等多个维度，全面介绍这一工具。LiveP
AI人工智能领域，Stable Diffusion掀起的技术风暴 AI大模型应用工坊人工智能 stable diffusion ai
AI人工智能领域，StableDiffusion掀起的技术风暴关键词：AI人工智能、StableDiffusion、技术风暴、图像生成、扩散模型摘要：本文深入探讨了AI人工智能领域中StableDiffusion所掀起的技术风暴。首先介绍了StableDiffusion的背景，包括其目的、预期读者和文档结构等。详细阐述了核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。对核心算法原
AIGC 领域 AI 写作如何实现智能内容推荐 SuperAGI2025 AIGC 人工智能 ai
AIGC领域AI写作如何实现智能内容推荐关键词：AIGC、AI写作、智能内容推荐、推荐算法、用户画像摘要：本文聚焦于AIGC领域中AI写作的智能内容推荐实现。首先介绍了该主题的背景，包括目的、预期读者等内容。接着阐述了核心概念与联系，如AIGC、AI写作、智能内容推荐等概念及其关联。详细讲解了核心算法原理，包括协同过滤、基于内容的推荐等，并给出Python代码示例。探讨了相关数学模型和公式，通过具
华为OD机试 2025B卷 - 字符串加密 (C++ & Python & JAVA & JS & C语言) YOLO大师华为od 华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述给你一串未加密的字符串str，通过对字符串的每一个字母进行改变来实现加密，加密方式是在每一个字母str[i]偏移特定数组元素a[i]的量，数组a前三位已经赋值：a[0]=1,a[1]=2,a[2]=4。当i>=3时，数组元素a[i]=a[i-1]+a[i-2]+a[i-3]。例如：
俄罗斯方块AI深度解析：从算法原理到实现细节智算菩萨 Python小游戏项目实战人工智能算法
俄罗斯方块AI深度解析：从算法原理到实现细节前言俄罗斯方块，这个诞生于1984年的经典游戏，至今仍然是人工智能研究领域的热门课题。当简单的几何形状在网格中不断下落时，看似简单的规则背后却隐藏着复杂的策略决策问题。本文将深入剖析一个基于Python实现的俄罗斯方块AI系统，探讨其如何通过精巧的算法设计实现近乎完美的自动游戏表现。游戏状态的数字化抽象在构建任何游戏AI之前，我们首先需要将人类直观理解的
基于 STM32+FPGA 的快速傅里叶频域图像在 TFT 中显示的设计与实现(项目资料)（ID:8）嵌入式资料库嵌入式项目合集 fpga开发 stm32 嵌入式硬件单片机
目录摘要1绪论1.1研究背景与意义1.2国内外研究现状1.3研究内容与目标2系统方案设计2.1总体架构设计2.2硬件方案设计2.2.1主控模块选型2.2.2FPGA模块选型2.2.3TFT显示模块选型2.2.4通信方案设计2.3软件方案设计2.3.1FFT算法实现方案2.3.2频域图像渲染方案3硬件电路设计3.1STM32最小系统电路3.2FPGA模块电路3.3TFT显示模块电路3.4软件IIC通
专知智库数据场景生态：开启全球数字文明新纪元——数据零件×场景编码×SEI指数构建下一代数字经济基座人形机器人专利池研究中心数据场景架构师数据零件架构师数据场景生态人工智能数据场景架构师算法大数据
一、传统数字经济的“柏林墙困境”全球产业痛点扫描：数据孤岛化：企业间数据流通成本高达交易额37%（麦肯锡2024）价值黑箱化：85%数据资产无法量化定价（普华永道审计报告）技术碎片化：同类算法重复开发年耗$1800亿破局宣言：专知智库提出“可拆解、可组合、可交易”三可原则，以数据零件+场景编码+SEI计量重构全球数字基础设施二、三大基座：数字经济的新操作系统1.数据零件（DP）：技术场景最小单元革
算法题目记录 iamwiam java
数据空间研究院-后端试题题目一：线程安全的链表描述：实现题目二：自定义注解与反射描述：实现题目三：简化的消息队列描述实现题目一：线程安全的链表描述：实现一个线程安全的链表类ThreadSafeLinkedList，支持以下操作：add(Telement)-在链表末尾添加元素。remove(Telement)-移除链表中的指定元素。contains(Telement)-检查链表中是否包含指定元素。要
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
人工智能学习资源 Hemy08 人工智能学习
无机器学习基础：https://www.coursera.org/learn/machine-learning有机器学习基础：MachineYearning深度学习入门：https://www.coursera.org/learn/neural-networks-deep-learning
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
OpenCV 人脸分析------面部关键点检测类cv::face::FacemarkLBF 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述使用LocalBinaryFeatures(LBF)算法进行面部关键点检测（faciallandmarkdetection）。该算法通过级联回归树预测人脸的68个关键点，具有较高的精度和速度。公共成员函数staticPtrcreate(constParams&pa
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

【机器学习】

0、数据集

1、贝叶斯分类器

（一）计算题

（二）概念题

2、SVM支持向量机（Support Vector Machine)

3、决策树

（一）计算题

（二）概念题

4、集成学习

5、关联规则

（一）计算题

（二）概念题

6、聚类

7、其他

你可能感兴趣的:(机器学习,算法,支持向量机)