01.朴素贝叶斯介绍

【数学基础】

1. 概率

条件概率：
事件A在事件B发生的前提下发生的概率，表示为：P(A|B)，读作A在B发生的条件下发生的概率。
联合概率：
两个事件共同发生的概率，比如事件A和B的联合概率表示为：P(AB)或者P(A,B)。
边缘概率：
是对某个事件发生的概率，而与其他事件无关，比如事件A的边缘概率表示为P(A)，同样事件B的边缘概率表示为P(B)。
条件概率的链式法则：
P(A,B) = P(A) * P(B|A)
如果A事件和B事件是互相独立，那么P(B|A)=P(B)，其对应联合概率：
P(A,B) = P(A) * P(B)

2. 贝叶斯公式

朴素贝叶斯有一个很重要的假设：条件独立性，即特征之间是独立的，这也是贝叶斯“朴素”的原因，它将问题简化了。实际生活中很多特征之间大多都是有关系的。

3. 先验概率与后验概率

先验概率：标签的概率，比如上面西瓜分类中，好瓜标签的概率。
后验概率：在特征已知的情况下发生的概率，比如特征为圆且平滑的西瓜，它是好瓜的概率。

【贝叶斯分类器基本原理】

贝叶斯决策论通过相关概率已知的情况下，利用误判损失来选择最优的类别分类。
假设有N种可能的分类标记，记为Y = {c1, c2, c3, …, cN}，那对于样本x，它属于哪一类呢？计算步骤如下：
step1：算出样本x属于第i个类别的概率，即P(ci|x)；
step2：通过比较所有的P(ci|x)，得到样本x所属的最佳类别；
step3：将类别ci和样本x代入贝叶斯公式中，得到：
P(ci|x) = P(x|ci) * P(ci) / P(x)
其中，P(ci)为先验概率，P(x|ci)为条件概率，我们需要求的就是P(x|ci)条件概率。
假设样本x包含d个属性，即x = {x1, x2, x3, …, xd}，那么：
P(x|ci) = P(x1, x2, x3, …, xd|ci)
这个联合概率难以从有限训练样本中直接计算得到。朴素贝叶斯采用“属性条件独立性假设”，即假设所有的属性是相互独立的，那么：
P(x|ci) = P(x1, x2, x3, …, xd|ci) = P(xj|ci)的乘积
最终只需要对条件概率P(xj|ci)求解，即对各自特征属性的条件概率求解，按照条件概率公式，采用统计的方式求解：
P(xj|ci) = P(xj, ci) / P(ci) = num(xj, ci) / num(ci)
其中，num(xj, ci)表示训练样本中xj, ci同时出现的次数。

【实战案例】

西瓜训练集数据：https://download.csdn.net/download/LWY_Xing/13209988

对下面的测试数据进行分类：

计算过程：

计算标签的先验概率P(ci)：
P(好瓜=是) = 8 / 17 = 0.471
P(好瓜=否) = 9 / 17 = 0.529
计算每个特征属性的条件概率：
青绿|是 = （色泽=青绿|好瓜=是）= 3/8 = 0.375
青绿|否 = （色泽=青绿|好瓜=否）= 3/9 ≈ 0.333
蜷缩|是 = （根蒂=蜷缩|好瓜=是）= 5/8 = 0.625
蜷缩|否 = （根蒂=蜷缩|好瓜=否）= 3/9 = 0.333
浊响|是 = （敲声=浊响|好瓜=是）= 6/8 = 0.750
浊响|否 = （敲声=浊响|好瓜=否）= 4/9 ≈ 0.444
清晰|是 = （纹理=清晰|好瓜=是）= 7/8 = 0.875
清晰|否 = （纹理=清晰|好瓜=否）= 2/9 ≈ 0.222
凹陷|是 = （脐部=凹陷|好瓜=是）= 6/8 = 0.750
凹陷|否 = （脐部=凹陷|好瓜=否）= 2/9 ≈ 0.222
硬滑|是 = （触感=硬滑|好瓜=是）= 6/8 = 0.750
硬滑|否 = （触感=硬滑|好瓜=否）= 6/9 ≈ 0.667
对于特征是连续的数据，假设他们服从正态分布，根据密度概率函数公式计算：
根据以上计算结果可以看出，P(好瓜=是)=0.063 > P(好瓜=否)=6.8*10^(-5)，因此，朴素贝叶斯分类器预测的测试样本数据为“好瓜”。

【代码实现】

import math
import pandas as pd

watermelon_frame = pd.read_csv('./xigua.csv', sep=' ')
print(watermelon_frame.shape)

good_melon_num = watermelon_frame.loc[watermelon_frame['好瓜'] == '是'].shape[0]
bad_melon_num = watermelon_frame.loc[watermelon_frame['好瓜'] == '否'].shape[0]
total_num = watermelon_frame.shape[0]

prob_good_melon = round(good_melon_num / total_num, 3)
prob_bad_melon = round(bad_melon_num / total_num, 3)
print('P(好瓜 = 是) = %.3f' %(prob_good_melon))
print('P(好瓜 = 否) = %.3f' %(prob_bad_melon))

green_yes_num = watermelon_frame.loc[(watermelon_frame['色泽'] == '青绿') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_green_yes = round(green_yes_num / good_melon_num, 3)
print('P(青绿|是) = %.3f' %(prob_green_yes))
green_no_num = watermelon_frame.loc[(watermelon_frame['色泽'] == '青绿') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_green_no = round(green_no_num / bad_melon_num, 3)
print('P(青绿|否) = %.3f' %(prob_green_no))

rollup_yes_num = watermelon_frame.loc[(watermelon_frame['根蒂'] == '蜷缩') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_rollup_yes = round(rollup_yes_num / good_melon_num, 3)
print('P(蜷缩|是) = %.3f' %(prob_rollup_yes))
rollup_no_num = watermelon_frame.loc[(watermelon_frame['根蒂'] == '蜷缩') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_rollup_no = round(rollup_no_num / bad_melon_num, 3)
print('P(蜷缩|否) = %.3f' %(prob_rollup_no))

voicedsound_yes_num = watermelon_frame.loc[(watermelon_frame['敲声'] == '浊响') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_voicedsound_yes = round(voicedsound_yes_num / good_melon_num, 3)
print('P(浊响|是) = %.3f' %(prob_voicedsound_yes))
voicedsound_no_num = watermelon_frame.loc[(watermelon_frame['敲声'] == '浊响') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_voicedsound_no = round(voicedsound_no_num / bad_melon_num, 3)
print('P(浊响|否) = %.3f' %(prob_voicedsound_no))

clear_yes_num = watermelon_frame.loc[(watermelon_frame['纹理'] == '清晰') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_clear_yes = round(clear_yes_num / good_melon_num, 3)
print('P(清晰|是) = %.3f' %(prob_clear_yes))
clear_no_num = watermelon_frame.loc[(watermelon_frame['纹理'] == '清晰') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_clear_no = round(clear_no_num / bad_melon_num, 3)
print('P(清晰|否) = %.3f' %(prob_clear_no))

sunken_yes_num = watermelon_frame.loc[(watermelon_frame['脐部'] == '凹陷') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_sunken_yes = round(sunken_yes_num / good_melon_num, 3)
print('P(凹陷|是) = %.3f' %(prob_sunken_yes))
sunken_no_num = watermelon_frame.loc[(watermelon_frame['脐部'] == '凹陷') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_sunken_no = round(sunken_no_num / bad_melon_num, 3)
print('P(凹陷|否) = %.3f' %(prob_sunken_no))

hardslippery_yes_num = watermelon_frame.loc[(watermelon_frame['触感'] == '硬滑') & (watermelon_frame['好瓜'] == '是')].shape[0]
prob_hardslippery_yes = round(hardslippery_yes_num / good_melon_num, 3)
print('P(硬滑|是) = %.3f' %(prob_hardslippery_yes))
hardslippery_no_num = watermelon_frame.loc[(watermelon_frame['触感'] == '硬滑') & (watermelon_frame['好瓜'] == '否')].shape[0]
prob_hardslippery_no = round(hardslippery_no_num / bad_melon_num, 3)
print('P(硬滑|否) = %.3f' %(prob_hardslippery_no))


def prop_density_fun(x, mean, var):
    return round(math.e**(-(x - mean)**2 / (2 * var)) / math.sqrt(2 * math.pi * var), 3)

density_yes_frame = watermelon_frame.loc[watermelon_frame['好瓜'] == '是']
print(density_yes_frame)
density_yes_frame = density_yes_frame.loc[:, '密度']
density_yes_mean = round(density_yes_frame.mean(), 3)
density_yes_var = round(density_yes_frame.var(), 3)
print('density and good melon mean = %0.3f' %(density_yes_mean))
print('density and good melon var = %0.3f' %(density_yes_var))
prop_density_yes = prop_density_fun(0.697, density_yes_mean, density_yes_var)
print('P(密度=0.697|是) = %0.3f' %(prop_density_yes))

density_no_frame = watermelon_frame.loc[watermelon_frame['好瓜'] == '否']
print(density_no_frame)
density_no_frame = density_no_frame.loc[:, '密度']
density_no_mean = round(density_no_frame.mean(), 3)
density_no_var = round(density_no_frame.var(), 3)
print('density and bad melon mean = %0.3f' %(density_no_mean))
print('density and bad melon var = %0.3f' %(density_no_var))
prop_density_no = prop_density_fun(0.697, density_no_mean, density_no_var)
print('P(密度=0.697|否) = %0.3f' %(prop_density_no))

sugary_yes_frame = watermelon_frame.loc[watermelon_frame['好瓜'] == '是']
print(sugary_yes_frame)
sugary_yes_frame = sugary_yes_frame.loc[:, '含糖率']
sugary_yes_mean = round(sugary_yes_frame.mean(), 3)
sugary_yes_var = round(sugary_yes_frame.var(), 3)
print('sugary and good melon mean = %0.3f' %(sugary_yes_mean))
print('sugary and good melon var = %0.3f' %(sugary_yes_var))
prop_sugary_yes = prop_density_fun(0.460, sugary_yes_mean, sugary_yes_var)
print('P(含糖率=0.460|是) = %0.3f' %(prop_sugary_yes))

sugary_no_frame = watermelon_frame.loc[watermelon_frame['好瓜'] == '否']
print(sugary_no_frame)
sugary_no_frame = sugary_no_frame.loc[:, '含糖率']
sugary_no_mean = round(sugary_no_frame.mean(), 3)
sugary_no_var = round(sugary_no_frame.var(), 3)
print('sugary and bad melon mean = %0.3f' %(sugary_no_mean))
print('sugary and bad melon var = %0.3f' %(sugary_no_var))
prop_sugary_no = prop_density_fun(0.460, sugary_no_mean, sugary_no_var)
print('P(含糖率=0.460|否) = %0.3f' %(prop_sugary_no))


prop_good_melon_test = round(prob_green_yes * prob_rollup_yes * prob_voicedsound_yes * prob_clear_yes * prob_sunken_yes * prob_hardslippery_yes * prop_density_yes * prop_sugary_yes, 6)
prop_bad_melon_test = round(prob_green_no * prob_rollup_no * prob_voicedsound_no * prob_clear_no * prob_sunken_no * prob_hardslippery_no * prop_density_no * prop_sugary_no, 6)
print('prop good melon test = %0.6f' %(prop_good_melon_test))
print('prop bad melon test = %0.6f' %(prop_bad_melon_test))
if prop_good_melon_test > prop_bad_melon_test:
    print('test data is good melon!')
else:
    print('test data is bad melon!')

(base) k8s-master@k8s-master:~/Desktop/python/nlp_learning/class1$ python xigua_classification_by_Naive_Bayes.py
(17, 10)
P(好瓜 = 是) = 0.471
P(好瓜 = 否) = 0.529
P(青绿|是) = 0.375
P(青绿|否) = 0.333
P(蜷缩|是) = 0.625
P(蜷缩|否) = 0.333
P(浊响|是) = 0.750
P(浊响|否) = 0.444
P(清晰|是) = 0.875
P(清晰|否) = 0.222
P(凹陷|是) = 0.625
P(凹陷|否) = 0.222
P(硬滑|是) = 0.750
P(硬滑|否) = 0.667
density and good melon mean = 0.574
density and good melon var = 0.017
P(密度=0.697|是) = 1.961
density and bad melon mean = 0.496
density and bad melon var = 0.038
P(密度=0.697|否) = 1.203
sugary and good melon mean = 0.279
sugary and good melon var = 0.010
P(含糖率=0.460|是) = 0.775
sugary and bad melon mean = 0.154
sugary and bad melon var = 0.012
P(含糖率=0.460|否) = 0.074
prop good melon test = 0.109572
prop bad melon test = 0.000144
test data is good melon!

【朴素贝叶斯优缺点】

优点：

时空开销都非常小；
训练预测的时间开销都小；

缺点：

简化的假设；

对样本的适配性质：

大样本更好；

【总结】后验概率最大化

比较P(label=1|特征)和P(label=0|特征)，谁大选择谁；
使用朴素贝叶斯公式，反求：
P(特征|label=1) * P(label=1) / P(特征)
P(特征|label=0) * P(label=0) / P(特征)
根据条件独立性假设，拆分特征的联合概率计算方式：
假设有3个特征，根据联合概率公式：
P(特征) = P(特征1) * P(特征2|特征1) * P(特征3|特征1, 特征2)
根据条件独立性假设化简：
P(特征) = P(特征1) * P(特征2) * P(特征3)
训练预测阶段做什么?
训练：生成统计概率值
预测：直接带入公式计算

【相关面试问题】

训练和预测阶段都做了什么？
训练：生成统计概率值；
预测：直接带入公式计算；
朴素贝叶斯中“朴素”的含义是什么？
条件独立性的假设。
针对朴素贝叶斯公式，为什么不需要计算分母P(特征)？
因为分母是一个常量。
如果特征是连续值，还能用吗？如果可以使用什么方式？
a. 采用分桶离散化：等距分桶，等频分桶，至于怎么选择需要看实验结果；
b. 采用正态分布-高斯分布估计，比如上面计算西瓜含糖率的概率：

概率密度函数的输入是连续型的随机变量，输出是对应的概率。
概率的拉普拉斯平滑
防止0概率的连乘法效应。
朴素贝叶斯有哪些模型？
a. GaussianNB：先验为高斯分布的朴素贝叶斯；
b. MultinomialNB：先验为多项式分布的朴素贝叶斯；
c. BernoulliNB：先验为伯努利分布的朴素贝叶斯；
这三个类适用的分类场景各不相同：
a. 一般来说，如果样本特征的分布大部分是连续值，使用GaussianNB会比较好；
b. 如果如果样本特征的分大部分是多元离散值，使用MultinomialNB比较合适；
c. 如果样本特征是二元离散值或者很稀疏的多元离散值，应该使用BernoulliNB；

python工资条教程_python学习笔记--工资条发放软件 weixin_39873191 python工资条教程
1#!/usr/bin/envpython2#-*-coding:UTF-8-*-3importsmtplib4fromemail.mime.textimportMIMEText5mailto_list=['[email protected]']#收件人(列表)6mail_host="smtp.163.com"#使用的邮箱的smtp服务器地址，这里是163的smtp地址7mail_user="[email protected]
Django 学习笔记（一）—— 快速建站 rollingstarky
Django是一个基于MVC（Model-View-Controller）模式的服务器端的Web框架，由Python语言编写。其创建之初主要是用来与关系型数据库进行交互，随着技术的不断革新，Django也逐渐融合了众多更现代的Web开发趋势。作为一个成熟的Web开发框架，Django有着众多企业级的应用，如Instagram、Pinterest、NationalGeographic等。Django
JSON数据的解析与生成：深入Python的实践与应用傻啦嘿哟 python办公自动化 json python 开发语言
目录一、JSON基础1.1JSON简介1.2Python中的JSON处理二、解析JSON字符串到Python字典2.1使用json.loads()函数2.2异常处理三、将Python字典转换为JSON字符串3.1使用json.dumps()函数3.2格式化输出3.3将Python对象写入文件四、将Python对象写入JSON文件4.1使用json.dump()函数4.2读取JSON文件五、进阶应用
pythontcp服务器框架_Python Tornado框架（TCP层） weixin_39724441 pythontcp服务器框架
Tornado在TCP层里的工作机制上一节是关于应用层的协议HTTP，它依赖于传输层协议TCP，例如服务器是如何绑定端口的？HTTP服务器的handle_stream是在什么时候被调用的呢？本节聚焦在TCP层次的实现，以便和上节的程序流程衔接起来。首先是关于TCP协议。这是一个面向连接的可靠交付的协议。由于是面向连接，所以在服务器端需要分配内存来记忆客户端连接，同样客户端也需要记录服务器。由于保证
在 ESP-IDF 环境下，使用标准 C 扩展 Micropython 模块 Mars.CN c语言开发语言 micropython ESP IDF
在ESP-IDF环境下，使用标准C扩展Micropython模块源码地址：https://gitee.com/Mars.CN/micropython_extend_example一、安装ESP-IDF环境在其他课程中讲过，这里不再赘述，有机会再出教程吧，但需要注意的是，截止到2024年1月初，最稳定的micropython开发环境是ESP-IDF_4.4.6，最新的5.x对ESP32-S3不是很友
python把dbc转换成excel 汽车软件工程师001 Python 01_DBC excel python 开发语言 pip
要将DBC文件转换为Excel，你可以使用pandas库来读取DBC文件，然后使用openpyxl库来创建和写入Excel文件。以下是一个简单的例子：首先，安装必要的库（如果尚未安装）：(提示：canmatrix库在1.0版本没有load函数)pipinstallpandascanmatrixopenpyxl然后，使用以下Python代码进行转换：importpandasaspdfromcanma
通过pip安装的第三方库怎样查看使用说明汽车软件工程师001 Python pip python 前端
要查看通过pip安装的第三方库的使用说明，可以使用以下方法：使用pip自带的功能查看库的详细信息：pipshow这将列出库的详细信息，包括其安装位置和文档的URL。2.访问库的官方文档或GitHub页面：大多数库都会在其官方文档或GitHub页面上提供详细的使用说明。3.使用浏览器查找库的官方文档：pipdoc这会自动打开浏览器并导航到库的Python官方文档页面。4.直接在Python中查看库的
单例模式（singleton）- python实现懂一点的陈老师设计模式单例模式 python 开发语言
通俗示例想象一下，一个国家只有一个国王。不管你在哪里，提到这个国家的国王，大家都能知道是指同一个人。在程序设计中，单例模式就像是这样的国王，一个类只有一个实例，无论你多少次请求这个类的实例，它总是返回同一个对象。通俗解释单例模式是一种创建型设计模式，它确保一个类只有一个实例，并提供一个全局访问点来获取这个实例。这个模式通常用于管理共享资源，如数据库连接或文件系统的操作，其中重复的实例化可能会导致问
Python2——Number 伊森要飞飞 python
整型长整型---加L浮点型复数型--a+bj，a、b都是浮点型int(x[,base])将x转换为一个整数long(x[,base])将x转换为一个长整数float(x)将x转换到一个浮点数complex(real[,imag])创建一个复数str(x)将对象x转换为字符串repr(x)将对象x转换为表达式字符串eval(str)用来计算在字符串中的有效Python表达式,并返回一个对象tuple
深度学习：探索人工智能的无限可能木小梦(๑• . •๑) 人工智能深度学习
引言：在当今这个数字化时代，人工智能（AI）已经成为了一个热门话题。从自动驾驶汽车到智能助手，AI正在逐渐改变我们的生活方式。而在AI领域，深度学习是近年来发展最为迅速的一个分支。本文将深入探讨深度学习及其相关领域，包括计算机视觉、自然语言处理、神经网络和强化学习。1.深度学习深度学习是一种基于人工神经网络的机器学习方法，它试图模拟人脑的工作方式，通过训练大量数据来自动学习数据的内在规律和表示层次
【numpy1】ipython模块、jupyter模块、Anaconda主要功能、notebook详细功能、数据分析三剑客、numpy实现BMI指数林光虚霁晓数据分析 ipython jupyter 数据分析
1ipython模块2jupyter模块3Anaconda软件3.1Anaconda主要功能3.2notebook详细功能3.3快捷键使用4数据分析三剑客5numpy模块5.1numpy下载5.2numpy实现BMI指数1ipython模块传统的cmd窗口下进入python解释器编写代码的缺点1.代码不会自动缩进2.代码不会自动提示3.代码颜色过于单调并且也没有行数提示ipython模块下载pip
计算机视觉概念科普极客代码玩转AI 人工智能图像处理计算机视觉深度学习
计算机视觉（ComputerVision,CV）是一门多学科交叉的科学，旨在让计算机具备“看”的能力，即通过图像或视频数据来理解世界。它结合了信号处理、图像处理、模式识别、机器学习等多个领域的技术，让计算机能够执行诸如识别、分类、追踪等复杂的视觉任务。本文将深入探讨计算机视觉的核心概念和技术。一、计算机视觉概述计算机视觉是一门研究如何让计算机“看”世界并从中获取信息的科学。它主要关注如何处理、分析
python的图像阈值化处理及算法对比 yava_free 计算机视觉人工智能 python
一.阈值化（注：该部分参考作者的论文《基于苗族服饰的图像锐化和边缘提取技术研究》）图像的二值化或阈值化（Binarization）旨在提取图像中的目标物体，将背景以及噪声区分开来。通常会设定一个阈值T，通过T将图像的像素划分为两类：大于T的像素群和小于T的像素群。灰度转换处理后的图像中，每个像素都只有一个灰度值，其大小表示明暗程度。二值化处理可以将图像中的像素划分为两类颜色，常用的二值化算法如公式
计算机毕业设计之基于Python的旅游景点评论内容分析与研究微信bishe58 课程设计 spring boot python 信息可视化
旅游景点评论内容分析与研究是一个涉及文本挖掘、情感分析和数据可视化等多领域技术的复杂过程。本研究以Python编程语言为基础，首先收集了来自不同旅游平台的用户评论数据。通过运用自然语言处理（NLP）技术，清洗并预处理了这些数据，以便于后续分析。随后，采用情感分析方法来识别和量化评论中的主观态度和情绪倾向，从而判断游客的整体满意度。此外，还运用词云、主题建模等手段来探索游客评论中的关键词汇和讨论主题
1.X Python基础-常用函数 iJaa Python
目录一、内置函数1.1类型比较-isinstance()二、其他函数2.1随机整数-random.randint()一、内置函数1.1类型比较-isinstance()描述用来判断一个对象是否是某个类型语法isinstance(object,classinfo)object：一个实例的对象classinfo：类型名（直接或间接的类名、以及基本类型，或者由类型名组成的元组）返回值：Bool类型（Tr
python爬虫521 PUTAOAO python 爬虫开发语言
爬虫521记录记录最近想学爬虫，尝试爬取自己账号下的文章标题做个词云csdn有反爬机制原理我就不说啦大家都写了看到大家结果是加cookie但是我加了还是521报错尝试再加了referer就成功了(╹▽╹)importmatplotlibimportrequestsfromwordcloudimportWordCloudimportmatplotlib.pyplotaspltimportjieba#
基于yolov8的绝缘子缺陷检测系统python源码+onnx模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO
【算法介绍】基于YOLOv8的绝缘子缺陷检测系统是一种利用先进深度学习技术的高效解决方案，旨在提升电力行业中输电线路的维护和监控水平。YOLOv8作为YOLO系列算法的最新版本，具备更高的检测速度和精度，特别适用于实时物体检测任务。该系统通过深入分析并标注绝缘子数据集，训练YOLOv8模型以精确识别输电线上的绝缘子及其缺陷状态。利用多尺度检测、FPN结构以及CSPDarknet网络等技术，YOLO
使用 Pandas 进行数据可视化：全面指南（六）小高要坚强 pandas 信息可视化 python 数据分析数据挖掘开发语言
在数据分析的过程中，数据的可视化是一个至关重要的环节。通过图形展示数据，不仅能够帮助我们直观地理解数据，还能够揭示数据背后的规律和趋势。Pandas作为Python生态系统中强大的数据分析库，不仅提供了数据处理和分析的功能，还内置了方便易用的可视化方法。本文将详细介绍Pandas中的数据可视化功能，帮助您充分利用Pandas的图形展示能力。一、数据的图形展示概述在Pandas中，DataFrame
深入解析Pandas的Series与DataFrame索引和切片操作（三）小高要坚强 pandas python 开发语言矩阵 numpy
Pandas库是Python中用于数据处理和分析的强大工具，它的核心数据结构包括Series和DataFrame。掌握Pandas的索引与切片操作是数据分析的基础，因为它们允许我们高效地访问、筛选和操作数据。本文将详细介绍Pandas中的Series和DataFrame的索引与切片方法，帮助你更好地理解和应用这些技巧。一、Series的索引与切片操作Series是一种一维数据结构，它类似于一列数据
机器学习和深度学习中常见损失函数，包括损失函数的数学公式、推导及其在不同场景中的应用早起星人机器学习深度学习人工智能
目录引言什么是损失函数？常见损失函数介绍3.1均方误差（MeanSquaredError,MSE）3.2交叉熵损失（Cross-EntropyLoss）3.3平滑L1损失（SmoothL1Loss）3.4HingeLoss（合页损失）3.5二进制交叉熵损失（BinaryCross-EntropyLoss）3.6KL散度（KLDivergence）3.7Huber损失（HuberLoss）3.8对比
Python学习笔记二(布尔值及类型检查) StaticKing Python入门 Python
字符串赋值与布尔值及类型检查布尔值(bool)假：False真：Truea1='a'a2='a'print(a1==a2)print(a1!=a2)TrueFalse布尔值也属于整型，True相当于1False相当于0print(True+
Python分布式任务处理库之dramatiq使用详解 Rocky006 python 开发语言
概要在现代Web应用和数据处理任务中，异步任务处理是一个至关重要的部分。Dramatiq是一个用于分布式任务处理的Python库，旨在提供简单、可靠的任务队列解决方案。与其他任务队列库相比，Dramatiq更加轻量级，且易于上手。它的设计目标是帮助开发者轻松地将耗时的任务放到后台处理，从而提升应用程序的响应速度。本文将详细介绍Dramatiq库，包括其安装方法、主要特性、基本和高级功能，以及实际应
Python数据分析利器之groupby和pivot_table使用详解 Rocky006 python 数据分析开发语言
概要在数据分析的过程中，数据聚合与数据透视是两项非常重要的操作。Python的Pandas库提供了强大的工具——groupby和pivot_table，帮助我们高效地进行数据聚合和透视分析。本文将详细介绍如何使用这两个功能，并结合示例代码展示它们的实际应用，帮助更好地掌握数据分析的技巧。数据聚合groupbygroupby是Pandas中用于对数据进行分组并进行聚合操作的工具。通过groupby，
AI学习记录 - 对抗性神经网络 victor-AI最好的学习方式是画图人工智能学习神经网络
有用点赞哦学习机器学习到一定程度之后，一般会先看他的损失函数是什么，看他的训练集是什么，训练集是什么，代表我使用模型的时候，输入是什么类型的数据。对抗神经网络其实可以这样子理解，网上一直说生成器和判别器的概念，没有触及到本质。我有一种看法：假如当前场景是输入模糊图片，然后输出高质量图片。当判别器和生成器本来就是一个模型，在不把判别器生成器拆开的时候，我输入一张图片，这个模型输出的是0和1，那这个整
Pandas库性能优化指南：从基础到进阶（终）小高要坚强 pandas 性能优化 python 数据分析开发语言
Pandas是Python中广泛使用的数据处理库，凭借其强大的功能和易用性，深受数据科学家和开发者的青睐。然而，Pandas在处理大规模数据时可能会遇到性能瓶颈，导致执行效率低下。本文将深入探讨如何通过一系列优化技巧，提升Pandas的性能表现，确保代码既高效又保持可读性。一、需要关注的问题在数据处理的过程中，性能往往是一个不可忽视的因素。虽然Pandas提供了丰富的函数和方法以简化数据操作，但在
Python在神经网络中优化激活函数选择使用详解 Rocky006 python 开发语言
概要在神经网络中，激活函数扮演着至关重要的角色。它的主要作用是引入非线性因素，使得神经网络能够处理复杂的非线性问题。如果没有激活函数，神经网络仅仅是线性模型的堆叠，无法胜任深度学习中的各种任务。本文将深入探讨几种常用的激活函数，包括Sigmoid、Tanh、ReLU及其变种，并通过具体的代码示例展示它们在Python中的实现和应用。激活函数的重要性激活函数将输入信号进行非线性转换，从而增强神经网络
解决关于使用Selenium WebDriver 在Python打开浏览器时出错全洛 Python python selenium chrome pip
错误1：Traceback(mostrecentcalllast):File"E:/codes/python/script.py",line5,indriver.get("http://www.python.org")TypeError:get()missing1requiredpositionalargument:'url'错误2：SessionNotCreatedException:Messa
【ShuQiHere】《机器学习的进化史『上』：从数学模型到智能算法的百年征程》 ShuQiHere 机器学习人工智能
【ShuQiHere】引言：概述机器学习的演进机器学习的发展史是一段从数学基础到智能算法的演进历程。从19世纪的数学探索，到20世纪的计算革命，再到21世纪的智能算法应用，机器学习模型的演化贯穿了科学进步的每个重要阶段。这篇博客将系统回顾这些模型的历史演进，展示它们之间的联系，并探讨其在现代应用中的重要性。线性回归：机器学习的起点背景故事：1805年的法国，年轻的数学家Adrien-MarieLe
深入了解 Python 面向对象编程（最终篇）稿子不爱 python python 开发语言
大家好！今天我们将继续探讨Python中的类及其在面向对象编程（OOP）中的应用。面向对象编程是一种编程范式，它使用“对象”来模拟现实世界的事务，使代码更加结构化和易于维护。在上一篇文章中，我们详细了解了类和实例的概念、'self'关键字的作用、魔法函数的定义、构造函数和析构函数以及面向对象编程的三大特性、抽象类、动态添加内容。而今天，我们将会在原有的基础上学习：数据的三种类型、属性封装以及单例类
第八篇：Python集合: 高效的无序集数据结构稿子不爱 python python 数据结构开发语言算法
1.集合的定义Python中的集合(set)是一种高度优化的无序且不重复的数据结构。它在概念上类似于数学中的集合,能够存储多个不同的元素。集合的这种特性使其成为处理唯一性和成员资格检查的理想选择。在Python中,我们可以通过两种主要方式定义集合:a)使用花括号{}:set1={1,2,3,4,5}这种方法直观简洁,但要注意空花括号{}会创建一个字典而不是集合。b)使用set()函数:set2=
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不