弄鹊

机器学习的练功方式（六）——朴素贝叶斯

文章目录

- 致谢
6 朴素贝叶斯
- 6.1 概述
- 6.2 概率论
- - 6.2.1 大数定律
  - 6.2.2 基本概念
  - 6.2.3 极大似然估计
  - 6.2.4 多项式分布
  - - 6.2.4.1 伯努利分布
    - 6.2.4.2 二项分布
  - 6.2.5 朴素贝叶斯
- 6.3 朴素贝叶斯文本分类
- - 6.3.1 一个例子
  - 6.3.2 拉普拉斯平滑系数
  - 6.3.3 算法实现
- 6.4 贝叶斯分类器
- - 6.4.1 多项式贝叶斯分类器
  - 6.4.2 高斯贝叶斯分类器
  - 6.4.3 伯努利贝叶斯分类器
  - 6.4.4 代码实现

致谢

本文参考资料如下

拉普拉斯平滑（Laplacian smoothing）_潜心学习的渣渣的博客-CSDN博客_拉普拉斯平滑

极大似然估计详解_知行流浪-CSDN博客_极大似然估计

极大似然估计原理详细说明_majunfu-CSDN博客_极大似然估计的原理

(1条消息) 多项式分布的理解概率公式的理解_猪逻辑公园-CSDN博客_多项式分布

常用的概率分布:伯努利分布、二项式分布、多项式分布、先验概率，后验概率 - 志光 - 博客园 (cnblogs.com)

十分钟学习统计学习方法李航第二版之《4.1 朴素贝叶斯法：核心——贝叶斯定理》_哔哩哔哩_bilibili

【AI 版】十分钟学习统计学习方法李航第二版之《4.4 朴素贝叶斯法：极大似然法之原理篇》_哔哩哔哩_bilibili

6 朴素贝叶斯

6.1 概述

这一讲我们要学习的是朴素贝叶斯算法。其属于有监督学习。

贝叶斯分类是一种分类算法的总称，这种算法均以贝叶斯定理为基础，故统称为贝叶斯分类。

贝叶斯分类器的主要特点有：

属性可以离散，也可以稳定。
数学基础扎实，分类效率稳定。
对缺失和噪声数据不太敏感。
属性如果不相关，分类效果很好，如果相关，则不低于决策树

让我们来直观对比一下KNN和朴素贝叶斯吧。在KNN中，我们通过模型来预测的结果一般可以通过和某类别的点距离远近给出该样本的所在分类；而对于朴素贝叶斯来说，其一般是算出该样本在各个类别中的概率，在哪个类别概率大就属于哪个类别。

现在假如我们引出一个事件。

有一天我们坐在办公室里，看到有人快速的走过，我们没有看到这个人是谁。但是我们做一个猜测，Alex和Brenda坐在办公室的时间一样长，那么这两人都各有百分之五十的概率是那个快速走过的人。

那现在我们又有一条新的推断信息，两个人都有一件红色的毛衣，而那个快速走过的人身上就穿了一件红色的毛衣。对于Alex来说她一个星期穿两次，而Brenda一个星期穿三次，所以这样的话快速走过的人是Alex的概率变成了百分之四十，是Brenda的概率变成了百分之六十。

在这里，在我们还没有新信息时，我们得到的百分之五十是先验概率。然后我们有了新信息后，我们得到了百分之四十和百分之六十。最后猜测的这两个概率被称为后验概率。

现在还是刚才那个例子，加入我们还是看到一个人飞跑过去，跑的太快我们没注意，然后靠推断看看这个人是谁。我们最开始知道的消息是，Alex一个星期中有三天是待在办公室的，而Brenda一个星期只有一天是待在办公室的。所以Alex的先验概率是0.75，而Brenda是0.25，然后我们假设连续好几周都是这种情况，那么我们可以很简单的列一个表格。

那么现在很先前一样，Alex每周有两次穿红色毛衣，而Brenda每周有三次穿红色毛衣。那么穿毛衣总数我们把他在表格中标红，两人穿红色毛衣的次数共九次。

因此，如果我们看到一个穿着红色毛衣的人快速经过，这个人是Alex的概率（后验概率）是三分之二，是Brenda的概率（后验概率）是三分之一。那么穿毛衣总数我们把他在表格中标红，两人穿红色毛衣的次数共九次。

因此，如果我们看到一个穿着红色毛衣的人快速经过，这个人是Alex的概率（后验概率）是三分之二，是Brenda的概率（后验概率）是三分之一。

总的来说就是：先验概率为主观判断的概率，某种新信息改变我们的主观判断后，得出的最终结论我们叫做后验概率。

让我们用下面的数学方式来算一次：

我们开始的时候，Alex一个星期在办公室三次，Brenda一个星期在办公室一次，那么就是四分之三和四分之一的概率，而后，两人穿红毛衣的概率和不穿红毛衣概率分别是0.4和0.6，0.6和0.4。然后分别计算他们的条件概率，如下图所示。

然而，我们要的仅仅是找出那个人，找不出的因素和我们没什么关系，所以我们把其他因素舍去，然后使主要因素的总数之和为一。

由上图我们可以把步骤一般化，那么可得贝叶斯公式如下。

现在我们换一个更好的例子来理解贝叶斯公式。

假如你身体不舒服，要去医院看医生，医生告诉你，你可能的了某种严重的疾病，而且诊断这种疾病的准确率是百分之99。（先验概率）然后你在等待检测的过程中，上网搜索了一下资料，然后发现平均有万分之一的人患这种病。结果你在检测完的第二天医生就打电话来告诉你，你的检查结果为阳性，这时候你感到开始恐慌了，那请问我们患病的概率是多少？

我们用数学的方法好好来计算一下，假设现在有一百万人，那么就有999900人健康，100人患病，健康的人中，可能有9999的人会被误诊，有989901个人检测正确，而患病的人里面有99个成功检测并得到治疗，有一个人是诊断不出来而乖乖送死。

那么按我们刚才的计算，我们应该计算出来的患病概率为：0.0098

6.2 概率论

6.2.1 大数定律

我们来对上面的知识做一个归档。假如现在我们有一枚硬币，我们定义一个概率事件：扔出一个硬币，结果头像朝上的可能性为几。

如果在这个硬币质地均匀的情况下，我们会不加思索地回答：百分之50。实际上，这个浅显易懂的道理是根据大数定律推断出来的。大数定律的内容是：如果统计数据足够大，那么事件出现的概率就能无限接近它的期望值。

6.2.2 基本概念

事件：每种结果
样本空间（结果空间）：所有基本事件的集合Ω，例如投掷一次硬币的样本空间是：{正,反}；投掷一次骰子的样本空间是：{1,2,3,4,5,6}
样本点：样本空间元素（基本事件w）
联合概率：联合概率也是我们说的and事件，即A = a和B = b同时发生的概率是多少。
条件概率：设AB两个事件，且P(B)>0，则称 $\frac {P(AB)}{P(B)}$ 为事件B已发生的条件下事件A发生的条件概率记为P(A|B)。
独立性：我们常说的独立性说成大白话就是互不影响，比如连续抛出两次骰子，第二次抛出不会受第一次影响；还有投篮啊，打靶啊都是独立的；也就是说，设有A、B是两个任意事件，如果P(AB) = P(A)P(B)，则称事件A和B相互独立，简称A和B独立。
乘法定理：P(A|B) = $\frac {P(AB)}{P(B)}$
贝叶斯定理：贝叶斯定理也叫逆概公式。由于P(AB)可以以乘法定理为桥梁，拓展出 $P (A B) = P (B ∣ A) P (A) 或者 P (A B) = P (A ∣ B) P (B)$ , 所以当以P(AB)为桥梁时，贝叶斯定理就产生了

$\frac {P(B|A)P(A)}{P(B)}$

6.2.3 极大似然估计

为了下面的学习更加顺畅，我们有必要讲述一下概率论中的极大似然估计（最大似然估计）。

最大似然估计原理的思想可以用一个例子来说明。假设由两个外形完全相同的箱子，甲箱有99只白球，1只黑球；乙箱有99只黑球，一只白球。假设现在有个人摸到一颗球拿到你的面前，你大概率认为它是从乙箱拿出来的。

这里我们讲的“大概率”，被人们称为最大似然原理。

如果从前面的叙述来看，我们用标准的叙述来表述上面的知识点，最大似然估计在做一件事是：利用已知的样本结果，反推最有可能导致这个结果的参数值。在概率论中，极大似然估计提供了一种给定观察数据来评估模型参数的方法，即模型已定，参数位置。通过若干次实验，观察其结果，利用试验结果得到某个参数值能够使样本出现的概率为最大，则称为最大似然估计。

6.2.4 多项式分布

多项式分布式二项分布的推广。在这之前，我们先了解一些其他的概念。

6.2.4.1 伯努利分布

伯努利分布又叫0-1分布，指一次随机试验，结果只有两种。这种分布典型的是投一次硬币，预测结果是正是反。

6.2.4.2 二项分布

二项分布为n次伯努利实验的结果。如果我们扔n次硬币，p为硬币朝上的概率，那么扔第k次硬币朝上的概率如下所示：
$C^k_np^k(1-p)^{n-k},k = 0,1,2,3,4,...n$

6.2.5 朴素贝叶斯

下面我们来举个朴素贝叶斯最热门的应用——垃圾邮件过滤器。我们手机上或多或少都收到垃圾邮件过，每个垃圾邮件上面写的是什么：赢钱很容易之类的词，而正常邮件上面写的是什么：你好，你过的怎么样之类的词。而我们要做的，就是拿到一封邮件时，赢钱这类词属于垃圾邮件的概率是多少。如下图：

这里我们根据上面可以看出，垃圾邮件含有容易这个词的概率是三分之一，含有钱这个词的概率是三分之二。我们现在就是根据贝叶斯公式算出含有容易这个词的垃圾邮件出现的概率是二分之一，含有钱这个词垃圾邮件出现的概率是三分之二。

而朴素贝叶斯的“朴素”此时就要体现在这里了。

我们假设“容易”和“钱”是相互独立互不影响的两个词，那么我们可以利用事件的独立性对两个概率相乘。那么我们得出来的概率即为：如果同时含有“容易”和“钱”的两个词，那么这个邮件是垃圾邮件的概率是多少三分之一。

当然，这种想法肯定在数学上是不合逻辑的，但是这样的假设通常能帮我们得到理想的结果，毕竟他还是有一定道理的。即使这种假设是天真、不成立的假设，但是在实践中效果很好，使算法效率变高。

总结一句话就是：朴素贝叶斯实际上等于朴素+贝叶斯，其中朴素是指特征相互独立，而贝叶斯是指贝叶斯公式。朴素贝叶斯常用于文本分类。

6.3 朴素贝叶斯文本分类

6.3.1 一个例子

我们把上述的贝叶斯公式应用于文本分类中，则公式可变为：
$P(C|F_1,F_2,...) = \frac{P(F_1,F_2,...|C)P(C)}{P(F_1,F_2,...)}$
其中公式可以分为三个部分：

P©：每个文档类别的概率（某文档的类别数/总文档数量）
P(W|C)：给定类别下特征的概率（被预测文档中出现的词）。
- 计算方法： $P(F_1) = N_i/N(训练文档中去计算)$ ，其中 $N i$ 为该 $F_1$ 词在C类别所有文档中出现的次数，N为所属类别C下的文档所有词出现的次数和。
P(F_1,F_2，…)：预测文档中每个词的概率

可能以上的公式绕的你眼花缭乱，我们结合例子来看一下。

在下面的例子中我们要做的是这么一件事，在某些特别的分类文档如China类中，它们时常会出现训练集中的词，如Chinese Beijing、Chinese等。但是出现这类词不一定就是China类。而我们要做的，就是在测试集中给出一篇新文章，根据文章中的词来判断该文章属不属于China类。

让我们用贝叶斯公式来计算一下，我们实际上是要计算测试集中该文档的$P = (C|Chinese,Chinese,Chinese,Tokyo,Japan) 和 P(非C|Chinese,Chinese,Chinese,Tokyo,Japan) $，然后比对其大小即可判断该文档是否属于该类别。我们看一下下面的计算过程，如果不是没有笔的情况，我建议你也算一下。

可以看出，最后算出来 $P (F ∣ C)$ 的概率为0，也就意味着带入贝叶斯公式， $P (C ∣ F)$ 的概率也为0，这怎么可能！从测试集中文档含有三个Chinese来看，这篇文档再怎么不济也不可能属于Chinese的概率是0。而之所以概率为0，究其原因是因为样本量太少，没有出现Tokyo和Japan。为了防止这种概率为0的情况发生，我们引入下面的知识点。

6.3.2 拉普拉斯平滑系数

拉普拉斯平滑系数是法国数学家拉普拉斯首先提出来的，是为了解决零概率问题的发生。其基本思想是假定训练样本很大，每个分量x的计数加1造成的估计概率变化可以忽略不计，但是这种操作却可以有效地避免零概率问题。

对于上述6.3.1的文本分类问题，我们可以把拉普拉斯平滑系数改写为如下形式：
$\frac {N_i+a}{N+am} \\其中a为指定的系数，一般为1 \\m为训练文档中统计出的特征词个数$
结果拉普拉斯平滑系数这把利剑，让我们再次计算上面的 $P (F ∣ C)$ 。

6.3.3 算法实现

我们要做一个案例来加强我们前面的学习，我们要利用多项式贝叶斯分类器来对新闻组数据集进行分类。分类的步骤如下：

获取数据
划分数据集
特征工程
朴素贝叶斯估计器流程
模型评估

在sklearn中朴素贝叶斯的API为：

sklearn.naive_bayes.MultinomialNB(alpha = 1.0，fit_prior = True, class_prior = None)

其中alpha为拉普拉斯平滑系数，浮点数类型

新闻数据集的来源为：

20个新闻组数据集是大约20000个新闻组文档的集合，平均分布在20个不同的新闻组中。它最初是由Ken lang手机的。

数据被组织成20个不同的新闻组，每个新闻组对应不同的主题。

# 导入模块
from sklearn.datasets import fetch_20newsgroups
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer


def nb_news():
    """导入数据并且处理"""
    # 获取数据
    news = fetch_20newsgroups(subset="all")

    # 2 划分数据集
    x_train, x_test, y_train, y_test = train_test_split(news.data, news.target, random_state=6)

    # 3 文本特征抽取
    transfer = TfidfVectorizer()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)

    # 4 朴素贝叶斯算法预估器流程
    estimator = MultinomialNB()
    estimator.fit(x_train, y_train)

    # 5 模型评估
    y_predict = estimator.predict(x_test)
    print("y_predict:\n", y_predict)
    print("直接比对预测值和真实值：\n", y_test == y_predict)

    # 计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为：\n", score)

    return None


nb_news()

6.4 贝叶斯分类器

虽然掌握一个贝叶斯分类器已经很艰难了，但请允许我让你更难受。在下面，我们讲述其余种类的贝叶斯分类器。我们将使用手写数据集为例子进行分类。

6.4.1 多项式贝叶斯分类器

实际上，我们前面用到的贝叶斯分类器是多项式贝叶斯分类器，让我们仔细看一下它。

sklearn.naive_bayes.MultinomialNB(alpha = 1.0，fit_prior = True, class_prior = None)

其中alpha为拉普拉斯平滑系数，浮点数类型

多项式贝叶斯分类器实际上假设特征的条件概率符合多项式分布

6.4.2 高斯贝叶斯分类器

sklearn.naive_bayes.GaussianNB

该分类器没有参数

该分类器假设特征的条件概率分布满足高斯分布

6.4.3 伯努利贝叶斯分类器

sklearn.naive_bayes.BernoulliNB(alpha = 1.0,binarize = 0.0,fit_prior = True,class_prior = None)

alpha：拉普拉斯平滑系数

binarize：一个浮点数或者None，如果是None则假定原始数据已经二元化，如果是浮点数则以该数为界，特征取值大于它的作为1，特征取值小于它的作为0

fit_prior：布尔值。如果为True，则不去学习P( $y = c_k$ )，替代以均匀分布；如果为false，择取学习P( $y = c_k$ )

class_prior：一个数组。它指定了每个分类的先验概率。如果指定了该参数，则每个分类的先验概率不再从数据集中学得

6.4.4 代码实现

# 导入模块
from sklearn import datasets, naive_bayes
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt


def show_digits():
    """查看手写数据集内容"""
    digits = datasets.load_digits()
    # 构建画布
    fig = plt.figure()
    # 输出
    print("vector from image 0:", digits.data[0])
    for i in range(25):
        ax = fig.add_subplot(5, 5, i + 1)
        ax.imshow(digits.images[i], cmap=plt.cm.gray_r, interpolation='nearest')
        plt.show()


def load_data():
    """加载数据集"""
    digits = datasets.load_digits()
    return train_test_split(digits.data, digits.target, test_size=0.25, random_state=0)


def test_MutinomialNB():
    """调用多项式贝叶斯分类器"""
    digits = datasets.load_digits()
    x_train, x_test, y_train, y_test = load_data()
    # 设置转换器
    estimator = naive_bayes.MultinomialNB()
    estimator.fit(x_train, y_train)
    # 模型评估
    print("MutinomialNB Train Score:\n", estimator.score(x_train, y_train))
    print("MutinomialNB Test Score:\n", estimator.score(x_test, y_test))


def test_GaussianNB():
    """调用高斯贝叶斯分类器"""
    x_train, x_test, y_train, y_test = load_data()
    # 设置转换器
    estimator = naive_bayes.GaussianNB
    estimator.fit(x_train, y_train)
    # 模型评估
    print("GaussianNB Train Score:\n", estimator.score(x_train, y_train))
    print("GaussianNB Test Score:\n", estimator.score(x_test, y_test))


def test_BernoulliNB():
    """调用伯努利贝叶斯分类器"""
    x_train, x_test, y_train, y_test = load_data()
    # 设置转换器
    estimator = naive_bayes.BernoulliNB
    estimator.fit(x_train, y_train)
    # 模型评估
    print("BernoulliNB Train Score:\n", estimator.score(x_train, y_train))
    print("BernoulliNB Test Score:\n", estimator.score(x_test, y_test))


# 调用函数
# test_MutinomialNB()
# test_GaussianNB()
test_BernoulliNB()

【核心算法篇七】《DeepSeek异常检测：孤立森林与AutoEncoder对比》再见孙悟空_ 「2025 DeepSeek技术全景实战」算法分布式 docker 计算机视觉人工智能自然语言处理 DeepSeek
大家好，今天我们来深入探讨一下《DeepSeek异常检测：孤立森林与AutoEncoder对比》这篇技术博客。我们将从核心内容、原理、应用场景等多个方面进行详细解析，力求让大家对这两种异常检测方法有一个全面而深入的理解。一、引言在数据科学和机器学习领域，异常检测（AnomalyDetection）是一个非常重要的任务。它的目标是从数据集中识别出那些与大多数数据显著不同的异常点。这些异常点可能是由于
吐血整理！模型热加载能力大比拼，谁才是真正王者？盼达思文体科创经验分享
吐血整理！模型热加载能力大比拼，谁才是真正王者？引言你是否在开发过程中，为了模型更新而频繁重启服务，浪费大量时间？又是否疑惑为什么有些模型加载速度快如闪电，而有些却慢得像蜗牛？今天就带你深入了解模型热加载能力的支持对比，让你不再为模型加载问题而烦恼！核心内容模型热加载概念科普场景化描述：想象一下，你正在运营一个基于机器学习模型的在线推荐系统。当你训练出了一个新的、性能更好的模型时，如果不能进行热加
【第四届网络安全、人工智能与数字经济国际学术会议（CSAIDE 2025】网络安全，人工智能，数字经济的研究禁默学术会议话题探讨 web安全人工智能安全数字经济学术论文
重要信息会议官网：www.csaide.net会议时间：2025年3月7-9日会议地点：马来西亚-马来西亚理工大学新山校区（线上+线下混合）简介过去几年，数字经济蓬勃发展，已成为全球经济增长的驱动力。然而，网络安全成为其最大的挑战。为了确保数字经济的可持续发展，人工智能被认为是至关重要的技术手段。第四届网络安全、人工智能与数字经济（CSAIDE2025）将于2025年3月7日至9日在马来西亚举行。
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
人工智能与机器学习入门：决策树应用决策树机器学习入门
在人工智能与机器学习入门：使用Kaggle完成Titanic推断学习一文中，给出了使用Kaggle进行机器学习入门的方法，本文基于上文的需求。尝试使用决策树模型来训练数据，并进行test数据集的测试。什么是决策树决策树，简单来讲可以认为是一个大的ifelse判断树，有了决策树后，测试集中的数据便可以使用该决策树进行判断了。比如根据Titanic的训练数据构造了上次决策树后，便可以根据测试数据的性别
怎么使用DeepSeek？DeepSeek使用教程轻创思维网络
1.简介DeepSeek是一款基于人工智能技术的智能搜索引擎和信息检索工具。它能够通过自然语言处理技术理解用户的查询需求，并提供精准、全面的搜索结果。无论您是想查找信息、解答问题还是进行创意写作，DeepSeek都能为您提供高效的支持。2.主要功能智能搜索：支持自然语言输入，快速获取精准结果。多语言支持：支持中文、英文及其他多种语言的输入和输出。知识库覆盖：整合海量互联网信息，覆盖百科、新闻、学术
深度学习torch之19种优化算法（optimizer）解析 @Mr_LiuYang 论文阅读深度学习 optimizer Adam 学习率调整优化算法
提示：有谬误请指正摘要本博客详细介绍了多种常见的深度学习优化算法，包括经典的LBFGS、Rprop、Adagrad、RMSprop、Adadelta、ASGD、Adamax、Adam、AdamW、NAdam、RAdam以及SparseAdam等，通过对这些算法的公式和参数说明进行详细解析，博客旨在为机器学习工程师和研究人员提供清晰的理论指导，帮助读者选择合适的优化算法提升模型训练效率。父类定义Op
《机器学习数学基础》补充资料：四元数、点积和叉积 CS创新实验室机器学习数学基础机器学习人工智能机器学习数学基础
《机器学习数学基础》第1章1.4节介绍了内积、点积的有关概念，特别辨析了内积空间、欧几里得空间；第4章4.1.1节介绍了叉积的有关概念；4.1.2节介绍了张量积（也称外积）的概念。以上这些内容，在不同资料中，所用术语的含义会有所差别，读者阅读的时候，不妨注意，一般资料中，都是在欧几里得空间探讨有关问题，并且是在三维的欧氏空间中，其实质所指即相同。但是，如果不是在欧氏空间中，各概念、术语则不能混用。
DeepSeek的实用方法DeepSeek+kimi生成PPT C_V_Better AI人工智能人工智能 ppt ai
在人工智能领域，DeepSeek和KimiAI作为强大的语言模型，为开发者和普通用户提供了丰富的功能。本文将详细介绍DeepSeek的实用方法，以及如何结合KimiAI生成PPT，帮助您快速上手并发挥其强大能力。一、DeepSeek的使用方法（一）注册与登录访问官网：打开浏览器，输入DeepSeek官网。注册账号：点击“注册”按钮，填写邮箱地址、设置密码，并完成邮箱验证。登录：注册成功后，使用注册
《机器学习数学基础》补充资料：求解线性方程组的克拉默法则 CS创新实验室机器学习数学基础机器学习人工智能机器学习数学基础
《机器学习数学基础》中并没有将解线性方程组作为重点，只是在第2章2.4.2节做了比较完整的概述。这是因为，如果用程序求解线性方程组，相对于高等数学教材中强调的手工求解，要简单得多了。本文是关于线性方程组的拓展，供对此有兴趣的读者阅读。1.线性方程组的解位于一条直线不失一般性，这里讨论三维空间的情况，对于多维空间，可以由此外推，毕竟三维空间便于想象和作图说明。设矩阵A=[124135]\pmb{A}
从零到入门：人工智能学习路径全解析这题有点难度人工智能学习
一、打破迷雾：重新认识人工智能人工智能（AI）早已不再是科幻电影中的专属概念，而是渗透到我们生活的方方面面。从手机里的语音助手到电商平台的推荐系统，从自动驾驶到医疗影像分析，AI技术正在重塑人类社会的运行方式。对于初学者而言，建立正确的认知框架至关重要：1.技术图谱解析：机器学习（ML）：AI的核心驱动力，使计算机具备从数据中学习的能力深度学习（DL）：基于神经网络的进阶技术，擅长处理图像、语音等
常用的高性能计算工具有哪些这题有点难度人工智能学习
在当今数字化时代，高性能计算（HPC）已成为推动科学、工程、技术以及商业创新的核心力量。无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。一、高性能计算：定义与意义高性能计算（HPC）是一种利用超级计算机或大规模集群来处理复杂计算任务的技术。它通过并行计算和优化算法，
合作伙伴中心Partner Center中添加了Copilot预览版 xueyunshengling 微软合作伙伴计划合作伙伴中心 copilot Copilot预览版
目录一、引言二、Copilot功能概述2.1Copilot简介2.2Copilot的核心功能2.3Copilot的访问和使用三、Copilot的使用方法3.1Copilot功能区域3.2Copilot使用示例3.2.1编写有效提示3.2.2使用反馈循环四、负责任的人工智能4.1Copilot结果的可靠性4.2意外或冒犯性内容的处理4.3Copilot数据收集五、总结一、引言合作伙伴中心（预览版）中
探索并应用Copilot背后的技术：自主代理架构花生糖@ AIGC学习资料库 copilot AIGC 人工智能
引言Copilot技术，作为现代软件开发中的一个创新工具，正在改变编程的协作方式。它通过集成到开发环境中，为开发者提供实时的代码建议和自动化的代码补全功能。本篇文章将深入探讨Copilot背后的技术——自主代理架构，并探讨其在软件开发中的应用潜力。Copilot技术概述Copilot是由GitHub和OpenAI合作开发的一项技术，它利用机器学习模型来理解代码上下文，并提供智能的代码补全建议。这项
《DeepSeek模型压缩：在高效与性能间寻平衡》人工智能深度学习
在人工智能飞速发展的当下，大语言模型不断迭代升级，规模与性能同步攀升。DeepSeek作为其中的佼佼者，在模型压缩技术上不断探索，力求在减小模型体积的同时，最大程度保留模型性能，为更广泛的应用场景提供支持。量化：用低精度表达，换存储空间与计算效率量化技术是DeepSeek模型压缩的关键手段之一，它将模型中的高精度浮点数参数转换为低比特数的整数或定点数，从而实现存储空间的大幅缩减与计算速度的提升。从
马斯克发布新一代大模型Grok 3：算力支撑下的 AI 跃进人工智能算法大模型gpu硬件
北京时间2025年2月18日，特斯拉创始人埃隆・马斯克旗下的人工智能公司xAI正式发布了最新一代大模型——Grok3，在全球AI竞争白热化阶段，这无疑给全球AI市场带来了新的变局和挑战。马斯克称Grok3的能力较前代产品提升了“一个数量级”，并将其誉为“地球上最聪明的人工智能”。那么，马斯克为何要发布这新一代大模型，其背后又与算力有着怎样千丝万缕的联系呢？一、AI赛道的竞争需求从行业发展的大背景来
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：YaoWang,EddieYan本文介绍如何为x86CPU调优卷积神经网络。注意，本教程不会在Windows或最新版本的macOS上运行。如需运行，请将本教程的主体放在if__name__=="__main__":代码块中。impor
AI技术在音乐产品中有哪些应用场景？大数据人工智能音乐大数据
自动标注、平滑过渡、音乐鉴权、AI创作，当AI技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时，也是一件让人激动不已的事情。随着深度学习算法的出现、大数据和5G技术的成熟，AI人工智能已逐渐融入我们的生产生活中，在教育、医疗、政务办公、城市管理等多个方面发挥作用。随着AI技术在音乐行业研究及应用的深入，音乐人工智能已经不新鲜，很多新的应用和产品已经惊艳亮相。基于对于音乐技术及产品的
PyTorch与TensorFlow的对比：哪个框架更适合你的项目？木觞清 pytorch tensorflow 人工智能
在机器学习和深度学习领域，PyTorch和TensorFlow是最流行的两个框架。它们各有特点，适用于不同的开发需求和场景。本文将详细对比这两个框架，帮助你根据项目需求选择最合适的工具。一、概述PyTorch和TensorFlow都是深度学习框架，它们为构建、训练和部署神经网络提供了强大的工具。尽管它们的最终目标相同，但其设计哲学和实现方式有所不同。PyTorch：由Facebook的人工智能研究
使用AI自动写代码，DeepSeek+CLine+VSCode实战教程，主打一个便宜实惠用得起！ AI程序猿人人工智能 AI编程 vscode DeepSeek AI AI大模型 Dify
0前言最近DeepSeek火了起来，各个媒体都在宣传，那DeekSeek到底是个啥？从程序员角度来看：DeepSeek一个人工智能助手，可以帮助我们解决代码知识点疑问，以及某个晦涩难懂的知识点问题，处理生活中的一些文本信息问题等。其实这些能力早在数年前ChatGPT也已经具备了，那么为什么最近DeepSeek这么火呢？一个原因就是因为它是国产的，那必须得支持。还有一个原因就是它实惠呀，便宜！目测目
DeepSeek再传重大突破！新发布原生稀疏注意力（NSA）机制，重新定义AI效率天花板 shelly聊AI 人工智能 deepseek 注意力机制深度学习
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）2025年2月18日，中国AI领域迎来一枚“技术
智慧园区安全调度的重要性 Guheyunyi 安全网络 python 大数据人工智能信息可视化数据分析
随着科技的飞速发展，智慧园区作为现代城市的重要组成部分，正逐渐成为企业、政府和居民生活的重要载体。智慧园区通过物联网、大数据、人工智能等先进技术，实现了资源的高效配置和管理的智能化。然而，随着园区规模的扩大和复杂性的增加，安全问题也日益凸显。因此，智慧园区的安全调度显得尤为重要。智慧园区安全调度的定义智慧园区安全调度是指通过先进的技术手段和管理方法，对园区内的各类安全风险进行实时监控、预警和应急处
（一）大数据---Hadoop整体介绍（架构层）----（组件(3) 2401_84166965 程序员大数据 hadoop 架构
复杂性:体现在数据的管理和操作上。如何抽取，转换，加载，连接，关联以把握数据内蕴的有用信息已经变得越来越有挑战性二、大数据技术有哪些（重点）===================================================================================基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计
chatgpt赋能Python-python_dag yakuchrisfor ChatGpt python chatgpt matplotlib
PythonDAG学习指南在数据处理和机器学习领域，处理复杂问题通常需要执行多个任务，并按特定顺序执行这些任务。DAG（有向无环图）被用于逻辑顺序的表示，这是标准的处理方式，以及一些技术，如Airflow。这篇文章将为你介绍PythonDAG，并为你提供一个学习指南。什么是PythonDAG？PythonDAG是用Python编程语言创建和处理DAG的框架。由于Python的灵活性、易于学习和使用
DeepSeek 横空出世：程序员的机遇与挑战程序员WANG 工具 deepseek AI 深度求索 python 人工智能百度
摘要本文聚焦于DeepSeek横空出世后对程序员群体产生的多方面影响。通过深入分析技术工具民主化、行业需求变迁、能力评价体系重构等方面，揭示DeepSeek带来的冲击与变革，同时为程序员在这一新时代背景下的职业发展提供策略建议，旨在帮助程序员更好地适应技术变革，实现职业价值的升级。一、引言在科技飞速发展的当下，人工智能领域不断涌现新的突破。DeepSeek作为国产大模型的代表，其爆火引发了广泛关注
聚焦银行业数智化转型，火山引擎数据飞轮系列白皮书重磅发布大数据
随着金融科技的快速发展，银行业也在不断提升数字化水平。通过大数据、人工智能等技术的应用，银行可以更加精准地了解客户需求，提供个性化的金融产品和服务，还能降低运营成本，提升风险管理能力，创造更多业务价值。《金融科技发展规划（2022~2025年）》也明确指出，以加强金融数据要素应用为基础，以深化金融供给侧结构性改革为目标，以加快金融机构数字化转型、强化金融科技审慎监管为主线，将数字元素注入金融服务全
携手鲲鹏昇腾 HashData展现云原生数仓创新力量数据库
5月9日-11日，鲲鹏昇腾开发者大会2024在北京中关村国际创新中心举行，众多行业领袖、专家学者及优秀开发们齐聚一堂，分享产业趋势、技术创新和应用实践。酷克数据作为华为鲲鹏生态重要合作伙伴，受邀出席本次大会，展示其与鲲鹏昇腾生态联合开发的云数仓解决方案及应用案例，与全球开发者共同探讨云原生数仓前沿技术。今年两会政府工作报告明确提出：“深化大数据、人工智能等研发应用，开展人工智能+行动，打造具有国际
遥感影像目标检测：从CNN（Faster-RCNN）到Transformer（DETR）岁月如歌，青春不败生态遥感目标检测 cnn transformer 遥感遥感影像
我国高分辨率对地观测系统重大专项已全面启动，高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成，将成为保障国家安全的基础性和战略性资源。未来10年全球每天获取的观测数据将超过10PB，遥感大数据时代已然来临。一：深度卷积网络知识1.深度学习在遥感图像识别中的范式和问题2.深度学习的历史发展历程3.机器学习，深度学习等任务的基本处理流程4.卷积神经网络的基本原理5
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S