naive-bayesian-朴素贝叶斯

var m = window.__blog.preRenderPosts; if (m) { m(); }

算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)

2010-09-17 13:09 by T2噬菌体, … 阅读, … 评论, 收藏, 编辑

0、写在前面的话

我个人一直很喜欢算法一类的东西，在我看来算法是人类智慧的精华，其中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中，并解决了实际问题后，那种快感更是我在其它地方体会不到的。

一直想写关于算法的博文，也曾写过零散的两篇，但也许是相比于工程性文章来说太小众，并没有引起大家的兴趣。最近面临毕业找工作，为了能给自己增加筹码，决定再次复习算法方面的知识，我决定趁这个机会，写一系列关于算法的文章。这样做，主要是为了加强自己复习的效果，我想，如果能将复习的东西用自己的理解写成文章，势必比单纯的读书做题掌握的更牢固，也更能触发自己的思考。如果能有感兴趣的朋友从中有所收获，那自然更好。

这个系列我将其命名为“算法杂货铺”，其原因就是这些文章一大特征就是“杂”，我不会专门讨论堆栈、链表、二叉树、查找、排序等任何一本数据结构教科书都会讲的基础内容，我会从一个“专题”出发，如概率算法、分类算法、NP问题、遗传算法等，然后做一个引申，可能会涉及到算法与数据结构、离散数学、概率论、统计学、运筹学、数据挖掘、形式语言与自动机等诸多方面，因此其内容结构就像一个杂货铺。当然，我会竭尽所能，尽量使内容“杂而不乱”。

1.1、摘要

贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。本文作为分类算法的第一篇，将首先介绍分类问题，对分类问题进行一个正式的定义。然后，介绍贝叶斯分类算法的基础——贝叶斯定理。最后，通过实例讨论贝叶斯分类中最简单的一种：朴素贝叶斯分类。

1.2、分类问题综述

对于分类问题，其实谁都不会陌生，说我们每个人每天都在执行分类操作一点都不夸张，只是我们没有意识到罢了。例如，当你看到一个陌生人，你的脑子下意识判断TA是男是女；你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱、那边有个非主流”之类的话，其实这就是一种分类操作。

从数学角度来说，分类问题可做如下定义：

已知集合： $C=\{y_1,y_2,...,y_n\}$ 和 $I=\{x_1,x_2,...,x_m,...\}$ ，确定映射规则，使得任意有且仅有一个使得成立。（不考虑模糊数学里的模糊集情况）

其中C叫做类别集合，其中每一个元素是一个类别，而I叫做项集合，其中每一个元素是一个待分类项，f叫做分类器。分类算法的任务就是构造分类器f。

这里要着重强调，分类问题往往采用经验性方法构造映射规则，即一般情况下的分类问题缺少足够的信息来构造100%正确的映射规则，而是通过对经验数据的学习从而实现一定概率意义上正确的分类，因此所训练出的分类器并不是一定能将每个待分类项准确映射到其分类，分类器的质量与分类器构造方法、待分类数据的特性以及训练样本数量等诸多因素有关。

例如，医生对病人进行诊断就是一个典型的分类过程，任何一个医生都无法直接看到病人的病情，只能观察病人表现出的症状和各种化验检测数据来推断病情，这时医生就好比一个分类器，而这个医生诊断的准确率，与他当初受到的教育方式（构造方法）、病人的症状是否突出（待分类数据的特性）以及医生的经验多少（训练样本数量）都有密切关系。

1.3、贝叶斯分类的基础——贝叶斯定理

每次提到贝叶斯定理，我心中的崇敬之情都油然而生，倒不是因为这个定理多高深，而是因为它特别有用。这个定理解决了现实生活里经常遇到的问题：已知某条件概率，如何得到两个事件交换后的概率，也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率：

表示事件B已经发生的前提下，事件A发生的概率，叫做事件B发生下事件A的条件概率。其基本求解公式为： $P(A|B)=\frac{P(AB)}{P(B)}$ 。

下面不加证明地直接给出贝叶斯定理：

$P(B|A)=\frac{P(A|B)P(B)}{P(A)}$

1.4、朴素贝叶斯分类

1.4.1、朴素贝叶斯分类的原理与流程

朴素贝叶斯分类是一种十分简单的分类算法，叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素，朴素贝叶斯的思想基础是这样的：对于给出的待分类项，求解在此项出现的条件下各个类别出现的概率，哪个最大，就认为此待分类项属于哪个类别。通俗来说，就好比这么个道理，你在街上看到一个黑人，我问你你猜这哥们哪里来的，你十有八九猜非洲。为什么呢？因为黑人中非洲人的比率最高，当然人家也可能是美洲人或亚洲人，但在没有其它可用信息下，我们会选择条件概率最大的类别，这就是朴素贝叶斯的思想基础。

朴素贝叶斯分类的正式定义如下：

1、设 $x=\{a_1,a_2,...,a_m\}$ 为一个待分类项，而每个a为x的一个特征属性。

2、有类别集合 $C=\{y_1,y_2,...,y_n\}$ 。

3、计算。

4、如果 $P(y_k|x)=max\{P(y_1|x),P(y_2|x),...,P(y_n|x)\}$ ，则。

那么现在的关键就是如何计算第3步中的各个条件概率。我们可以这么做：

1、找到一个已知分类的待分类项集合，这个集合叫做训练样本集。

2、统计得到在各类别下各个特征属性的条件概率估计。即。

3、如果各个特征属性是条件独立的，则根据贝叶斯定理有如下推导：

$P(y_i|x)=\frac{P(x|y_i)P(y_i)}{P(x)}$

因为分母对于所有类别为常数，因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的，所以有：

$P(x|y_i)P(y_i)=P(a_1|y_i)P(a_2|y_i)...P(a_m|y_i)P(y_i)=P(y_i)\prod^m_{j=1}P(a_j|y_i)$

根据上述分析，朴素贝叶斯分类的流程可以由下图表示（暂时不考虑验证）：

可以看到，整个朴素贝叶斯分类分为三个阶段：

第一阶段——准备工作阶段，这个阶段的任务是为朴素贝叶斯分类做必要的准备，主要工作是根据具体情况确定特征属性，并对每个特征属性进行适当划分，然后由人工对一部分待分类项进行分类，形成训练样本集合。这一阶段的输入是所有待分类数据，输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段，其质量对整个过程将有重要影响，分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。

第二阶段——分类器训练阶段，这个阶段的任务就是生成分类器，主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计，并将结果记录。其输入是特征属性和训练样本，输出是分类器。这一阶段是机械性阶段，根据前面讨论的公式可以由程序自动计算完成。

第三阶段——应用阶段。这个阶段的任务是使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。这一阶段也是机械性阶段，由程序完成。

1.4.2、估计类别下特征属性划分的条件概率及Laplace校准

这一节讨论P(a|y)的估计。

由上文看出，计算各个划分的条件概率P(a|y)是朴素贝叶斯分类的关键性步骤，当特征属性为离散值时，只要很方便的统计训练样本中各个划分在每个类别中出现的频率即可用来估计P(a|y)，下面重点讨论特征属性是连续值的情况。

当特征属性为连续值时，通常假定其值服从高斯分布（也称正态分布）。即：

而 $P(a_k|y_i)=g(a_k,\eta_{y_i},\sigma_{y_i})$

因此只要计算出训练样本中各个类别中此特征项划分的各均值和标准差，代入上述公式即可得到需要的估计值。均值与标准差的计算在此不再赘述。

另一个需要讨论的问题就是当P(a|y)=0怎么办，当某个类别下某个特征项划分没有出现时，就是产生这种现象，这会令分类器质量大大降低。为了解决这个问题，我们引入Laplace校准，它的思想非常简单，就是对没类别下所有划分的计数加1，这样如果训练样本集数量充分大时，并不会对结果产生影响，并且解决了上述频率为0的尴尬局面。

1.4.3、朴素贝叶斯分类实例：检测SNS社区中不真实账号

下面讨论一个使用朴素贝叶斯分类解决实际问题的例子，为了简单起见，对例子中的数据做了适当的简化。

这个问题是这样的，对于SNS社区来说，不真实账号（使用虚假身份或用户的小号）是一个普遍存在的问题，作为SNS社区的运营商，希望可以检测出这些不真实账号，从而在一些运营分析报告中避免这些账号的干扰，亦可以加强对SNS社区的了解与监管。

如果通过纯人工检测，需要耗费大量的人力，效率也十分低下，如能引入自动检测机制，必将大大提升工作效率。这个问题说白了，就是要将社区中所有账号在真实账号和不真实账号两个类别上进行分类，下面我们一步一步实现这个过程。

首先设C=0表示真实账号，C=1表示不真实账号。

1、确定特征属性及划分

这一步要找出可以帮助我们区分真实账号与不真实账号的特征属性，在实际应用中，特征属性的数量是很多的，划分也会比较细致，但这里为了简单起见，我们用少量的特征属性以及较粗的划分，并对数据做了修改。

我们选择三个特征属性：a1：日志数量/注册天数，a2：好友数量/注册天数，a3：是否使用真实头像。在SNS社区中这三项都是可以直接从数据库里得到或计算出来的。

下面给出划分：a1：{a<=0.05, 0.05<a<0.2, a>=0.2}，a1：{a<=0.1, 0.1<a<0.8, a>=0.8}，a3：{a=0（不是）,a=1（是）}。

2、获取训练样本

这里使用运维人员曾经人工检测过的1万个账号作为训练样本。

3、计算训练样本中每个类别的频率

用训练样本中真实账号和不真实账号数量分别除以一万，得到：

4、计算每个类别条件下各个特征属性划分的频率

5、使用分类器进行鉴别

下面我们使用上面训练得到的分类器鉴别一个账号，这个账号使用非真实头像，日志数量与注册天数的比率为0.1，好友数与注册天数的比率为0.2。

可以看到，虽然这个用户没有使用真实头像，但是通过分类器的鉴别，更倾向于将此账号归入真实账号类别。这个例子也展示了当特征属性充分多时，朴素贝叶斯分类对个别属性的抗干扰性。

1.5、分类器的评价

虽然后续还会提到其它分类算法，不过这里我想先提一下如何评价分类器的质量。

首先要定义，分类器的正确率指分类器正确分类的项目占所有被分类项目的比率。

通常使用回归测试来评估分类器的准确率，最简单的方法是用构造完成的分类器对训练数据进行分类，然后根据结果给出正确率评估。但这不是一个好方法，因为使用训练数据作为检测数据有可能因为过分拟合而导致结果过于乐观，所以一种更好的方法是在构造初期将训练数据一分为二，用一部分构造分类器，然后用另一部分检测分类器的准确率。

<ul class="postmetadata">
    <li class="icon_cat" id="BlogPostCategory"></li>
    <li class="icon_bullet" id="EntryTag"></li>
</ul>

var m = window.__blog.postRendered; if (m) { m(__$("post")); } var m = window.__blog.postRenderPosts; if (m) { m(); }

刷新评论刷新页面返回顶部

博客园首页博问新闻闪存程序员招聘知识库

fixPostBodyFormat();

(adsbygoogle = window.adsbygoogle || []).push({});

$(function () { loadNewsAndKb(); loadBlogSignature(); LoadPostInfoBlock(cb_blogId, cb_entryId, cb_blogApp, cb_blogUserGuid); GetPrevNextPost(cb_entryId, cb_blogId, cb_entryCreatedDate); loadOptUnderPost(); GetHistoryToday(cb_blogId, cb_blogApp, cb_entryCreatedDate); setTimeout(function () { incrementViewCount(cb_entryId); }, 200); });

    </div>

    <script type="text/javascript">
        var m = window.__blog.contentRendered;
        if (m) { m(__$("content")); }
    </script>

    <div id="sidebar">

About

        <script type="text/javascript">
            var m = window.__blog.aboutRendered;
            if (m) { m(__$("about")); }
        </script>

        <script type="text/javascript">
            var m = window.__blog.searchFormRendered;
            if (m) { m(__$("searchform")); }
        </script>
        <div id="sideMain">
        </div>
        <div id="sideRight">
        </div>
        <div id="sideLeft">
        </div>

            <div id="sideContainer">
            </div>
            <script type="text/javascript">
                $.ajax({
                    url: '/' + currentBlogApp + '/mvc/blog/Minyx2_Lite_SideColumn.aspx',
                    data: '{}',
                    type: 'post',
                    dataType: 'text',
                    contentType: 'application/json; charset=utf-8',
                    success: function (data) {
                        if (data) {
                            $("#sideContainer").html(data);
                            loadBlogDefaultCalendar();
                            loadBlogSideBlocks();
                            var m = window.__blog.sideContainerRendered;
                            if (m) { m(__$("sideContainer")); }
                            window.__blog.sidebar.__layout();
                        }
                    }
                });

            </script>

    </div>

    <script type="text/javascript">
        var m = window.__blog.sidebarRendered;
        if (m) { m(__$("sidebar")); }
    </script>

    <div id="footer">

www.spiga.com.mx

博客园

    </div>
</div>

<script type="text/javascript">
    var m = window.__blog.wrapperRendered;
    if (m) { m(__$("wrapper")); }
</script>

【机器学习】朴素贝叶斯可口的冰可乐机器学习机器学习概率论
3.朴素贝叶斯素贝叶斯算法（NaiveBayes）是一种基于贝叶斯定理的简单而有效的分类算法。其“朴素”之处在于假设各特征之间相互独立，即在给定类别的条件下，各个特征是独立的。尽管这一假设在实际中不一定成立，合理的平滑技术和数据预处理仍能使其在许多任务中表现良好。优点：速度快：由于朴素贝叶斯仅需计算简单的概率，训练和预测的速度非常快。适用于高维数据：即使在特征数量多的情况下，朴素贝叶斯仍然表现良好
【统计学习方法读书笔记】（四）朴素贝叶斯法 Y.G Bingo 统计学习方法人工智能统计学习概率概率论
终于到了贝叶斯估计这章了，贝叶斯估计在我心中一直是很重要的地位，不过发现书中只用了不到10页介绍这一章，深度内容后，发现贝叶斯估计的基础公式确实不多，但是由于正态分布在生活中的普遍性，贝叶斯估计才应用的非常多吧！默认输入变量用XXX表示，输出变量用YYY表示概率公式描述：P(X=x)P(X=x)P(X=x)：表示当X=xX=xX=x时的概率P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣
【机器学习】朴素贝叶斯方法的概率图表示以及贝叶斯统计中的共轭先验方法 Lossya 机器学习概率论人工智能朴素贝叶斯共轭先验
引言朴素贝叶斯方法是一种基于贝叶斯定理的简单概率模型，它假设特征之间相互独立。文章目录引言一、朴素贝叶斯方法的概率图表示1.1节点表示1.2边表示1.3无其他连接1.4总结二、朴素贝叶斯的应用场景2.1文本分类2.2推荐系统2.3医疗诊断2.4欺诈检测2.5情感分析2.6邮件过滤2.7信息检索2.8生物信息学三、朴素贝叶斯的优点四、朴素贝叶斯的局限性4.1特征独立性假设4.2敏感于输入数据的表示4
【机器学习】朴素贝叶斯网络的基本概念以及朴素贝叶斯网络在python中的实例 Lossya 机器学习 python 人工智能算法朴素贝叶斯
引言文章目录引言一、朴素贝叶斯网络1.1基本概念1.1.1节点1.1.2边（Edges）1.1.3条件独立性1.2特点1.2.1结构简单1.2.2易于理解和实现1.2.3计算效率高1.3应用1.4数学表示1.5局限性二、朴素贝叶斯网络在python中的实例2.1实例背景2.2实现步骤2.3python代码2.4代码解释三、概率推断在医疗领域中的使用3.1概率推断在医疗领域的使用3.2自动化推断的优
人工智能与机器学习原理精解【17】叶绿先锋基础数学与应用数学人工智能机器学习概率论
文章目录贝叶斯贝叶斯定理的公式推导一、条件概率的定义二、联合概率的分解三、贝叶斯定理的推导四、全概率公式的应用五、总结全概率公式推导一、全概率公式的定义二、全概率公式的推导三、全概率公式的应用贝叶斯定理的原理一、基本原理二、核心概念三、数学表达式四、原理应用五、原理特点朴素贝叶斯定理一、贝叶斯定理基础二、朴素贝叶斯的原理三、朴素贝叶斯的特点朴素贝叶斯公式一、贝叶斯定理二、特征独立性假设三、朴素贝叶
利用贝叶斯和决策树来进行医疗诊断的杨航 AI 决策树算法机器学习
要使用Python实现一个基于贝叶斯分类器和决策树的医疗诊断功能，我们需要构建一个模型，该模型可以根据病人描述的症状预测可能的病症。这个模型将利用贝叶斯分类器和决策树来进行预测。以下是一个基本的实现思路：数据准备：我们需要一个包含不同症状和对应病症的数据集。这个数据集将用于训练我们的贝叶斯分类器和决策树。贝叶斯分类器：我们使用朴素贝叶斯分类器来根据给定的症状计算每个病症的概率。决策树：我们使用决策
Python实战：爬取小红书评论并进行情感分析 Mr 睡不醒 python 开发语言机器学习
在这篇博客中，我们将探讨如何使用Python爬取小红书的评论数据，并使用朴素贝叶斯分类器进行情感分析。本教程将涵盖从数据采集到模型训练和预测的完整流程。准备工作首先，确保你的Python环境中已安装以下库：pipinstallpandassklearnrequestsbeautifulsoup4seleniumselenium需要环境搭建爬取小红书评论我们将使用requests和Beautiful
【机器学习理论基础】一文看尽朴素贝叶斯算法大数据AI Machine Learning 机器学习
在所有的机器学习分类算法中，朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法，比如决策树,KNN,逻辑回归，支持向量机等，他们都是判别方法，也就是直接学习出特征输出Y和特征X之间的关系，要么是决策函数Y=f(X)Y=f(X)Y=f(X),要么是条件分布P(Y∣X)P(Y|X)P(Y∣X)。但是朴素贝叶斯却是生成方法，也就是直接找出特征输出YYY和特征XXX的联合分布P(X,Y)P(X
【机器学习笔记】4 朴素贝叶斯 RIKI_1 机器学习机器学习笔记人工智能
贝叶斯方法贝叶斯分类贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。朴素贝叶斯分类是这一类算法中最简单的较为常见的算法。先验概率根据以往经验和分析得到的概率。我们用()来代表在没有训练数据前假设拥有的初始概率。后验概率根据已经发生的事件来分析得到的概率。以(|)代表假设成立的情下观察到数据的概率，因为它反映了在看到训练数据后成立的置信度。联合概率是指在多元的概率分
朴素贝叶斯算法 YuanDaima2048 机器学习算法学习算法机器学习人工智能深度学习 python sklearn
朴素贝叶斯算法一、基本概念二、算法及代码应用朴素贝叶斯NB算法分类算法区别其他机器学习算法：机器学习实战工具安装和使用一、基本概念朴素贝叶斯（NB）是一种基于贝叶斯定理与特征条件独立假设的分类算法。它被广泛应用于文本分类、垃圾邮件过滤等领域。朴素贝叶斯算法简单易懂，其核心思想是假设在给定目标值时，各个属性之间相互独立。在实际应用中，朴素贝叶斯算法在垃圾邮件过滤中表现出色。它不仅准确率高，而且速度快
21丨朴素贝叶斯分类（下）：如何对文档进行分类？张九日zx
朴素贝叶斯分类最适合的场景就是文本分类、情感分析和垃圾邮件识别。sklearn机器学习包sklearn的全称叫Scikit-learn，它给我们提供了3个朴素贝叶斯分类算法，分别是高斯朴素贝叶斯（GaussianNB）、多项式朴素贝叶斯（MultinomialNB）和伯努利朴素贝叶斯（BernoulliNB）。自然界的现象比较适合用高斯朴素贝叶斯来处理，而文本分类是使用多项式朴素贝叶斯或者伯努利朴
机器学习：多项式模型朴素贝叶斯分类器（原理+python实现） DocPark 机器学习 python
简介多项式朴素贝叶斯也是多用于文本处理，其原理和计算的流程和伯努利朴素贝叶斯基本一致，唯一的区别在于单词的计数方式，由《伯努利朴素贝叶斯》一文可知，在文本处理的环节中，我们将单词是否出现在词组作为特征，但在多项式朴素贝叶斯中，我们将单词在词组中出现的次数作为特征，因此只需要更改文中setOfWords2Vec的函数即可，变成如下方式：defbagOfWords2VecMN(vocabList,in
8、python多项式贝叶斯文本分类（完整） UP Lee 数据挖掘实战多项式贝叶斯文章分类
1、贝叶斯定理（BayesTheorem）朴素贝叶斯分类（NaiveBayesClassifier）贝叶斯分类算法，是统计学的一种分类方法，它是利用贝叶斯定理的概率统计知识，对离散型的数据进行分类的算法2、贝叶斯算法的类型sklearn包naive_bayes模块GaussianNB高斯贝叶斯BernoulliNB伯努利贝叶斯MultionmialNB多项式贝叶斯（需要知道具体每个特征的数值大小）
机器学习入门--朴素贝叶斯原理与实践 Dr.Cup 机器学习入门机器学习概率论人工智能
朴素贝叶斯算法朴素贝叶斯是一种常用的分类算法，其基本思想是根据已有数据的特征和标签，学习出一个概率模型，并利用该模型对新样本进行分类。其优点在于简单快速、易于实现和解释，缺点在于对输入数据的分布做了严格的假设。具体来说，朴素贝叶斯分类器首先根据训练数据计算出每个类别的先验概率P©，即样本中每个类别占比。然后，对于给定的待分类样本，计算出它属于每个类别的条件概率P(X|C)，其中X表示样本的特征向量
Python概率建模算法和图示亚图跨际数学机器学习 Python python 算法概率建模统计
要点Python朴素贝叶斯分类器解释概率学习示例Python概率论，衡量一个或多个变量相互依赖性，从数据中学习概率模型参数，贝叶斯决策论，信息论，线性代数和优化Python线性判别分析分类模型，逻辑回归，线性回归，广义线性模型Python结构化数据，图像和序列神经网络朴素贝叶斯分类器示例概率学习在机器学习的广阔领域中，概率学习开辟了自己独特的空间。在统计和概率的驱动下，概率学习侧重于对数据中存在的
机器学习各种算法汇总模板怎么菜成这样机器学习机器学习 python 算法随机森林支持向量机
机器学习算法模板包含了KNN，线性回归，逻辑回归，朴素贝叶斯，决策树，支持向量机，随机森林，kmeans，集成算法各种算法，特征工程，评估方式任你选择！！！#导包fromsklearn.neighborsimportKNeighborsClassifierfromsklearn.linear_modelimportLinearRegressionfromsklearn.naive_bayesimp
【机器学习笔记】贝叶斯学习住在天上的云机器学习机器学习笔记学习贝叶斯学习人工智能
贝叶斯学习文章目录贝叶斯学习1贝叶斯学习背景2贝叶斯定理3最大后验假设MAP(MaxAPosterior)4极大似然假设ML(MaximumLikelihood)5朴素贝叶斯NB6最小描述长度MDL1贝叶斯学习背景试图发现两件事情的关系（因果关系，先决条件&结论）。执果索因：肺炎→肺癌？不好确定，换成确诊肺癌得肺炎的概率2贝叶斯定理贝叶斯定理是一种用先验慨率来推断后验慨率的公式，它可以表示为：P(
sklearn中一些简单机器学习算法的使用橘柚jvyou 机器学习 sklearn 算法
目录前言KNN算法决策树算法朴素贝叶斯算法岭回归算法线性优化算法前言本篇文章会介绍一些sklearn库中简单的机器学习算法如何使用，一些注释已经写在代码中，帮助一些小伙伴入门sklearn库的使用。注意：本篇文章只涉及到如何使用，并不会讲解原理，如果想了解原理的小伙伴请自行搜索其他技术博客或者查看官方文档。KNN算法fromsklearn.datasetsimportload_iris#导入莺尾花
【初中生讲机器学习】5. 从概率到朴素贝叶斯算法，一篇带你看明白！ Geeker · LStar 人工智能机器学习算法机器学习算法人工智能分类算法监督学习朴素贝叶斯
创建时间：2024-02-04最后编辑时间：2024-02-05作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名初三学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！上两篇文章中，我详细讲了支持向量机（SVM）算法的原理，并用一个实例实现了它。在这一篇和下一篇中，我将分别讲解&实现朴素
【初中生讲机器学习】6. 分类算法中常用的模型评价指标有哪些？here! Geeker · LStar 人工智能机器学习算法机器学习人工智能分类算法评价指标监督学习
创建时间：2024-02-07最后编辑时间：2024-02-09作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名初三学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！前面已经讲了两个分类算法（SVM&朴素贝叶斯），其中在【初中生讲机器学习】4.支持向量机算法怎么用？一个实例带你看懂！中
机器学习：朴素贝叶斯笔记 Ningbo_JiaYT 机器学习机器学习笔记分类算法
朴素贝叶斯（NaiveBayes）是一种基于贝叶斯定理的简单概率分类算法，广泛应用于机器学习和数据挖掘中。“朴素”体现在对特征之间的独立性做出了假设，即一个特征或者一个属性的出现不依赖于其他特征的出现。目录基本原理1.贝叶斯定理2.朴素的独立性假设贝叶斯定理1.简介2.贝叶斯公式算法过程1.训练模型2.预测类别类型注意事项基本原理1.贝叶斯定理朴素贝叶斯算法的核心是贝叶斯定理，即对于给定的样本数据
图解机器学习 | 朴素贝叶斯算法详解 Dashesand 机器学习算法人工智能
图解机器学习|朴素贝叶斯算法详解引言在众多机器学习分类算法中，本篇我们提到的朴素贝叶斯模型，和其他绝大多数分类算法都不同，也是很重要的模型之一。在机器学习中如KNN、逻辑回归、决策树等模型都是判别方法，也就是直接学习出特征输出YYY和特征XXX之间的关系（决策函数Y=f(X)Y=f(X)Y=f(X)或者条件分布P(Y∣X)P(Y|X)P(Y∣X)）。但朴素贝叶斯是生成方法，它直接找出特征输出YYY
机器学习-朴素贝叶斯【手撕】 alstonlou 机器学习机器学习人工智能 python
朴素贝叶斯概述在许多分类算法应用中，特征和标签之间的关系并非是决定性的。比如说，我们想预测一个人究竟是否会在泰坦尼克号海难中生存下来，那我们可以建一棵决策树来学习我们的训练集。在训练中，其中一个人的特征为：30岁，男，普通舱，他最后在泰坦尼克号海难中去世了。当我们测试的时候，我们发现有另一个人的特征也为：30岁，男，普通舱。基于在训练集中的学习，我们的决策树必然会给这个人打上标签：去世。然而这个人
机器学习 | 探索朴素贝叶斯算法的应用亦世凡华、 #机器学习机器学习算法人工智能朴素贝叶斯经验分享
朴素贝叶斯算法是一种基于贝叶斯定理和特征条件独立假设的分类算法。它被广泛应用于文本分类、垃圾邮件过滤、情感分析等领域，并且在实际应用中表现出色。朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法：1）对于给定的待分类项r，通过学习到的模型计算后验概率分布。2）此项出现的条件下各个目标类别出现的概率，将后验概率最大的类作为α所属的类别。核心思想：是利用特征之间的条件独立性，来对给定的数据进行分
4 朴素贝叶斯奋斗的喵儿
1定义朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法2.算法及实例极大似然估计：在这里插入图片描述在这里插入图片描述在这里插入图片描述贝叶斯估计：在这里插入图片描述在这里插入图片描述总结：朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布P(X,Y)，然后求后验概率分布P(Y|X)。即利用训练数据学习P(X|Y)和P(Y)的估计，得到联合概率分布在这里插入图片描述朴素贝
机器学习实战朴素贝叶斯分类器 shenny_
基于概率论的分类方法：朴素贝叶斯我的微信公众号：s406205391;欢迎大家一起学习，一起进步！！！k-近邻算法和决策树会给出“该数据属于哪一类”的明确回答。不过，分类器有时会产生错误结果，这是可以要求分类器给出一个最优的类别的猜测结果，同事给出这个猜测的概率估计值。朴素贝叶斯就是一个概率分类器。我们称之为“朴素”，是因为整个形式化的过程只做最原始、最简单的假设。朴素贝叶斯的优点：在数据较少的情
第七章朴素贝叶斯机器学习颜大哦人工智能学习笔记机器学习人工智能
朴素贝叶斯是一组功能强大且易于训练的分类器，它使用贝叶斯定理来确定给定一组条件的结果的概率，“朴素”的含义是指所给定的条件都能独立存在和发生.朴素贝叶斯是多用途分类器，能在很多不同的情景下找到它的应用，例如垃圾邮件过滤、自然语言处理等.一.概率1.定义概率是反映随机事件出现的可能性大小.随机事件是指在相同条件下，可能出现也可能不出现的事件.例如：（1）抛一枚硬币，可能正面朝上，可能反面朝上，这是随
朴素贝叶斯原理小森( ﹡ˆoˆ﹡ ) 机器学习算法算法人工智能机器学习
朴素贝叶斯的介绍朴素贝叶斯算法（NaiveBayes,NB)是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到，有着坚实的数学基础，以及稳定的分类效率。NB模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。条件概率：表示事件A在另外一个事件B已经发生条件下的发生概率，P(A|B)在女神喜欢的条件下，职业是程序员的概率？女
python校园舆情分析系统可视化情感分析朴素贝叶斯分类算法爬虫大数据毕业设计（源码）✅ vx_biyesheji0001 毕业设计 biyesheji0001 biyesheji0002 python 分类爬虫毕业设计贝叶斯算法舆情分析情感分析
毕业设计：2023-2024年计算机专业毕业设计选题汇总（建议收藏）毕业设计：2023-2024年最新最全计算机专业毕设选题推荐汇总感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。1、项目介绍技术栈：Python语言、Django框架、数据库、Echarts可视化、scrapy爬虫技术、HTML朴素贝叶斯分类算法（情感
机器学习_15_贝叶斯算法少云清机器学习机器学习算法概率论贝叶斯算法
文章目录1贝叶斯定理相关公式2朴素贝叶斯算法2.1朴素贝叶斯算法推导2.2朴素贝叶斯算法流程3高斯朴素贝叶斯4伯努利朴素贝叶斯5多项式朴素贝叶斯6贝叶斯网络6.1最简单的一个贝叶斯网络6.2全连接贝叶斯网络6.3“正常”贝叶斯网络6.4实际贝叶斯网络：判断是否下雨6.5贝叶斯网络判定条件独立-016.6贝叶斯网络判定条件独立-026.7贝叶斯网络判定条件独立-031贝叶斯定理相关公式**先验概率P
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他