Doris_H_n_q

朴素贝叶斯分类算法[sklearn.naive_bayes/GaussianNB/MultinomialNB/BernoulliNB]

朴素贝叶斯

举栗子1

'''另一个例子，现分别有 A、B 两个容器，在容器 A 里分别有 7 个红球和 3 个白球，
在容器 B 里有 1 个红球和 9 个白球，现已知从这两个容器里任意抽出了一个球，
且是红球，问这个红球是来自容器 A 的概率是多少?



假设已经抽出红球为事件 B，选中容器 A 为事件 A，则有：P(B) = 8/20，P(A) = 1/2，P(B|A) = 7/10，按照公式，
则有：P(A|B) = P(A)*P(B|A)/P(B) = (7/10)*(1/2) / (8/20) = 0.875
'''
# 概率是7/8

# p(B) = 8/20 #选中红球
# p(A) =1/2 #选中A容器的概率

# # A容器中选中红球的概率
# p(B|A) = 7/10

# ???p(A|B)

p = 7/10 * 1/2/(8/20)
p
Out：
0.8749999999999999

举栗子2

'''例如：一座别墅在过去的 20 年里一共发生过 2 次被盗，
别墅的主人有一条狗，狗平均每周晚上叫 3 次，
在盗贼入侵时狗叫的概率被估计为 0.9，问题是：在狗叫的时候发生入侵的概率是多少？'''

# 别墅被盗定义为事件A
p(A) = 2/(20*365)

# 狗叫的概率事件B
p(B) = 3/7

# 在盗贼入侵时狗叫的概率被估计为 0.9
p(B|A) = 0.9

# 在狗叫的时候发生入侵的概率是多少
p(A|B) = p(B|A) * p(A)/p(B)

0.9 * (2/(20*365))/(3/7)
# 0.00058

原理

【关键词】

朴素：独立性假设
贝叶斯公式

优点：

朴素贝叶斯模型发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率；
对小规模的数据表现很好；
能处理多分类任务，适合增量式训练；
对缺失数据不太敏感，算法也比较简单，常用于文本分类

缺点：

只能用于分类问题
需要计算先验概率；
分类决策存在错误率；
对输入数据的表达形式很敏感

一、朴素贝叶斯原理

朴素贝叶斯算法是一个典型的统计学习方法，主要理论基础就是一个贝叶斯公式，贝叶斯公式的基本定义如下：

这个公式虽然看上去简单，但它却能总结历史，预知未来：

公式的右边是总结历史
公式的左边是预知未来

如果把Y看成类别，X看成特征，P(Yk|X)就是在已知特征X的情况下求Yk类别的概率，而对P(Yk|X)的计算又全部转化到类别Yk的特征分布上来。

举个例子，大学的时候，某男生经常去图书室晚自习，发现他喜欢的那个女生也常去那个自习室，心中窃喜，于是每天买点好吃点在那个自习室蹲点等她来，可是人家女生不一定每天都来，眼看天气渐渐炎热，图书馆又不开空调，如果那个女生没有去自修室，该男生也就不去，每次男生鼓足勇气说：“嘿，你明天还来不？”,“啊，不知道，看情况”。

然后该男生每天就把她去自习室与否以及一些其他情况做一下记录，用Y表示该女生是否去自习室，即Y={去，不去}，X是跟去自修室有关联的一系列条件，比如当天上了哪门主课，蹲点统计了一段时间后，该男生打算今天不再蹲点，而是先预测一下她会不会去，现在已经知道了今天上了常微分方法这么主课，于是计算P(Y=去|常微分方程)与P(Y=不去|常微分方程)，看哪个概率大，如果P(Y=去|常微分方程) >P(Y=不去|常微分方程)，那这个男生不管多热都屁颠屁颠去自习室了，否则不就去自习室受罪了。P(Y=去|常微分方程)的计算可以转为计算以前她去的情况下，那天主课是常微分的概率P(常微分方程|Y=去)，注意公式右边的分母对每个类别（去/不去）都是一样的，所以计算的时候忽略掉分母，这样虽然得到的概率值已经不再是0~1之间，但是通过比较大小还是能选择类别。

后来他发现还有一些其他条件可以挖，比如当天星期几、当天的天气，以及上一次与她在自修室的气氛，统计了一段时间后，该男子一计算，发现不好算了，因为总结历史的公式：

这里n=3，x(1)表示主课，x(2)表示天气，x(3)表示星期几，x(4)表示气氛，Y仍然是{去，不去}，现在主课有8门，天气有晴、雨、阴三种、气氛有A+,A,B+,B，C五种，那么总共需要估计的参数有8×3×7×5×2=1680个，每天只能收集到一条数据，那么等凑齐1680条数据，大学都毕业了，男生大呼不妙，于是做了一个独立性假设，假设这些影响她去自习室的原因是独立互不相关的，于是：

有了这个独立假设后，需要估计的参数就变为，(8+3+7+5)×2 = 46个了，而且每天收集的一条数据，可以提供4个参数，这样该男生就预测越来越准了。

P(Y=去|常微分方程) = p(常微分方程|Y=去)*p(Y = 去)/(p(常微分方程))

朴素的概念：独立性假设，假设各个特征之间是独立不相关的。

朴素贝叶斯分类器

讲了上面的小故事，我们来朴素贝叶斯分类器的表示形式：

当特征为为x时，计算所有类别的条件概率，选取条件概率最大的类别作为待分类的类别。由于上公式的分母对每个类别都是一样的，因此计算时可以不考虑分母，即

朴素贝叶斯的朴素体现在其对各个条件的独立性假设上，加上独立假设后，大大减少了参数假设空间。

在文本分类上的应用

文本分类的应用很多，比如垃圾邮件和垃圾短信的过滤就是一个2分类问题，新闻分类、文本情感分析等都可以看成是文本分类问题，分类问题由两步组成：训练和预测，要建立一个分类模型，至少需要有一个训练数据集。贝叶斯模型可以很自然地应用到文本分类上：现在有一篇文档d（Document），判断它属于哪个类别ck，只需要计算文档d属于哪一个类别的概率最大：

在分类问题中，我们并不是把所有的特征都用上，对一篇文档d，我们只用其中的部分特征词项t1,t2,...,tnd（nd表示d中的总词条数目），因为很多词项对分类是没有价值的，比如一些停用词“的,是,在”在每个类别中都会出现，这个词项还会模糊分类的决策面，关于特征词的选取，我的这篇文章有介绍。用特征词项表示文档后，计算文档d的类别转化为：

注意P(Ck|d)只是正比于后面那部分公式，完整的计算还有一个分母，但我们前面讨论了，对每个类别而已分母都是一样的，于是在我们只需要计算分子就能够进行分类了。实际的计算过程中，多个概率值P(tj|ck)的连乘很容易下溢出为0，因此转化为对数计算，连乘就变成了累加：

我们只需要从训练数据集中，计算每一个类别的出现概率P(ck)和每一个类别中各个特征词项的概率P(tj|ck)，而这些概率值的计算都采用最大似然估计，说到底就是统计每个词在各个类别中出现的次数和各个类别的文档的数目：

二、3种贝叶斯模型

1、高斯分布朴素贝叶斯

高斯分布就是正态分布

【用途】用于一般分类问题

使用自带的鸢尾花数据

导包：

from sklearn.naive_bayes import GaussianNB
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

定义特征数据和目标数据：

iris = load_iris()

X = iris['data']
y = iris['target']
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.3)

运用高斯朴素贝叶斯：

gNB = GaussianNB()

gNB.fit(X_train,y_train)

gNB.score(X_test,y_test)
Out：0.9111111111111111

2、多项式分布朴素贝叶斯

多项式分布：

【用途】适用于文本数据（特征表示的是次数，例如某个词语的出现次数）

例：继续使用鸢尾花数据集

导包

from sklearn.naive_bayes import MultinomialNB

mNB = MultinomialNB()

mNB.fit(X_train,y_train)

mNB.score(X_test,y_test)
Out：0.8888888888888888

3、伯努利分布朴素贝叶斯

伯努利分布：

【用途】适用于伯努利分布，也适用于文本数据（此时特征表示的是是否出现，例如某个词语的出现为1，不出现为0）

绝大多数情况下表现不如多项式分布，但有的时候伯努利分布表现得要比多项式分布要好，尤其是对于小数量级的文本数据

例：继续使用鸢尾花数据集

导包：

from sklearn.naive_bayes import BernoulliNB

bNB = BernoulliNB()

bNB.fit(X_train,y_train)

bNB.score(X_test,y_test)
Out：0.24444444444444444

# 有时候比自身概率还低则无需使用该算法。
'''鸢尾花分三类，1/3 = 0.3333'''

三、文本分类实战¶

对短信进行二分类，数据为SMSSpamCollection，两种邮件分别在ham和spam目录下

导包：

import pandas as pd

导入数据集：


sms = pd.read_csv('../data/SMSSpamCollection',sep='\t',header=None)
sms.columns = ['target','message']
# ham普通短信；spam 垃圾短信
sms

导入sklearn.feature_extraction.text.TfidfVectorizer用于转换字符串
读取短信数据

# Vectorizer 向量化
from sklearn.feature_extraction.text import TfidfVectorizer

定义词向量对象：

tf = TfidfVectorizer()

tf.fit(X['message'])
Out：
TfidfVectorizer(analyzer='word', binary=False, decode_error='strict',
        dtype=, encoding='utf-8', input='content',
        lowercase=True, max_df=1.0, max_features=None, min_df=1,
        ngram_range=(1, 1), norm='l2', preprocessor=None, smooth_idf=True,
        stop_words=None, strip_accents=None, sublinear_tf=False,
        token_pattern='(?u)\\b\\w\\w+\\b', tokenizer=None, use_idf=True,
        vocabulary=None)

'''转成词向量：tf.transform
TFidVectorize参数确定：Series
5572条短信抽取了8713个英语单词
'''
X_train = tf.transform(X['message'])
X_train
''' sparse matrix ---->稀松矩阵，即大部分数据都是0 '''
Out：
<5572x8713 sparse matrix of type ''
	with 74169 stored elements in Compressed Sparse Row format>

X_train.toarray().shape
Out：(5572, 8713)

cond = X_train.toarray()[0] !=0
X_train.toarray()[0][cond]
Out:
array([0.32647199, 0.2441904 , 0.3116528 , 0.27580486, 0.27580486,
       0.25283008, 0.14787418, 0.15305131, 0.18034331, 0.10699316,
       0.32647199, 0.27580486, 0.15602977, 0.25535168, 0.1555162 ,
       0.23001811, 0.18241265, 0.22083292])

tf.fit_transform()

参数必须是字符串的一维数组（比如列表或者Series）
返回的是一个稀疏矩阵类型的对象，行数为样本数，列数为所有出现的单词统计个数。

这里输入data[1]是Series类型，返回的是一个5572x8713 sparse matrix 其中5572是data[1]

伯努利分布

训练数据

bNB = BernoulliNB()

# 机器学习数据可以是稀松矩阵
bNB.fit(X_train,y_train)
Out：
BernoulliNB(alpha=1.0, binarize=0.0, class_prior=None, fit_prior=True)

预测数据，使用tf.transform(['xx'])进行转换生成测试数据

# 普通短信+普通短信
X_test = ['''Even my brother is not like to speak with me Is that seriously how you spell his name?''']

X_test = tf.transform(X_test)

bNB.predict(X_test)
Out：
array(['ham'], dtype='

 
  多项式分布 
  # 小数据 使用多项式，效果往往比伯努利效果差
mNB = MultinomialNB()

mNB.fit(X_train,y_train)
Out：MultinomialNB(alpha=1.0, class_prior=None, fit_prior=True)

# 普通短信+普通短信
X_test = ['''Even my brother is not like to speak with me Is that seriously how you spell his name?''']

X_test = tf.transform(X_test)

mNB.predict(X_test)
Out：array(['ham'], dtype='
 
  高斯分布 
  gNB = GaussianNB()

# X_train 稀松矩阵
'''TypeError: A sparse matrix was passed, but dense data is required.
Use X.toarray() to convert to a dense numpy array.'''
gNB.fit(X_train.toarray(),y_train)
Out：GaussianNB(priors=None)

# 普通短信+普通短信
X_test = ['''Even my brother is not like to speak with me Is that seriously how you spell his name?''']

X_test = tf.transform(X_test)

gNB.predict(X_test.toarray())
Out：array(['ham'], dtype='


    
        你可能感兴趣的:(算法实例)
        
            
                
                    遗传算法Matlab代码实现及算法函数封装
                        

                        文章目录前言一、遗传算法介绍二、遗传算法算子1.种群初始化1.1二进制数编码1.2浮点数编码1.3小结2.选择算子3.交叉算子4.变异算子5.小结三、算法实例1.例一2.例二3.例三4.小结四、算法函数封装1.示例一2.示例二3.示例三五、参考文献前言遗传算法（GA）作为求解单目标优化问题的有效算法，自提出以来，便被广泛采用。该算法主要是模仿达尔文进化论，通过种群不断的进行自然选择、繁衍交叉变异，
                    
                    前端通过js实现通过SM2 解密数据js怎么写
                        薄辉
javascript前端vue.jshtml开发语言
                        答：要实现通过SM2解密数据，可以使用JavaScript库crypto-js，具体实现步骤如下：1)引入crypto-js库；2)使用SM2算法实例化一个密钥对；3)使用sm2.decrypt()方法对密文进行解密；4)使用sm2.decryptToText()方法对密文进行解密，获得明文。
                    
                    优化算法：遗传算法
                        垂杨有暮鸦⊙_⊙
算法高等工程数学算法数学建模笔记学习
                        注：可先看实例《优化算法：遗传算法实例》对照理解目录1.前言2.遗传算法的基本原理2.1基本思想2.2遗传算法中的生物遗传学概念3.遗传算法的步骤1.前言遗传算法(GeneticAlgorithm，GA)是一种解优化问题的导向随机搜索方法，它模拟生物在自然进化中的选择和遗传（即适者生存）规律而提出来的全局优化搜索算法。遗传算法的思想和基本概念最早由美国Michigan大学的J.Holland教授于
                    
                    KNN算法实例_手写识别系统
                        V文宝
机器学习算法
                        创建一个简单的书写识别系统，使用KNN算法来识别手写数字。分别使用手写KNN算法和调用scikit-learn库来实现。在数据处理过程中，将使用一个常见的手写数字数据集，如MNIST数据集。数据集我们将使用MNIST数据集，它包含60000个训练样本和10000个测试样本。每个样本是一个28x28像素的灰度图像，表示0-9之间的手写数字。手写KNN算法我们首先手写一个KNN算法来实现书写识别系统。
                    
                    python实现冒泡排序完整算法_利用python实现冒泡排序算法实例代码
                        weixin_39610759

                        利用python实现冒泡排序算法实例代码冒泡排序冒泡排序（英语：BubbleSort）是一种简单的排序算法。它重复地遍历要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。冒泡排序算法的运作如下：1、比较相邻的元素。如果第一个比第二个大（升序
                    
                    梯度下降法
                        小丹丹的梦想后花园

                        梯度下降法，最通俗易懂的解释。数据分析挖掘与算法1月7日作者：六尺帐篷链接：https://www.jianshu.com/p/c7e642877b0e本文从一个下山场景开始，提出梯度下降算法的基本思想，接着从数学上解释梯度下降算法原理，最后实现一个简单的梯度下降算法实例！梯度下降的场景假设梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景：一个人被困在山上，需要从山上下来(i.e.找
                    
                    退火模拟算法c语言程序,模拟退火算法实例（c++ 与 c# 实现）
                        weixin_39799825
退火模拟算法c语言程序
                        此片文章主要参考CSDN博主里头的一篇文章，将自己的理解写下来，以方便后期的查阅。一、C++实现1.已知平面上若干点坐标(xi,yi),求平面上一点p(x,y),到这些点的总距离最小。思路：取所有点的均值为目标点。计算全部点与目标点求差值的和，将目标点以一定系数朝着总和的方向移动，得到新的目标点。//求最小距离//限制条件：10.02)//0.02为温度的下限，若温度为temp达到下限，则停止搜索
                    
                    贪心算法之找零钱
                        奋进的大脑袋
贪心算法算法
                        贪心算法是一种在每一步选择中都采取在当前状态下最优的选择，从而希望能够得到全局最优解的算法策略。下面是一个经典的贪心算法实例：找零钱问题。找零钱问题假设你是一个收银员，需要找零给客户。你有以下面额的硬币：1元、5元、10元、25元。现在需要找零n元钱，问如何用最少的硬币数量找零？#include#includestd::vectormakeChange(intamount){std::vector
                    
                    分治算法之归并排序
                        奋进的大脑袋
算法排序算法数据结构
                        分治算法是一种将问题分解成更小子问题，然后合并子问题的解以获得原问题解的算法策略。分治算法通常包括三个步骤：分解、解决、合并。下面是一个经典的分治算法实例：归并排序。归并排序归并排序是一种经典的分治排序算法，它将一个数组分成两个子数组，分别对这两个子数组进行排序，然后合并这两个有序子数组，从而得到整个数组的有序序列。#include#includevoidmerge(std::vector&arr
                    
                    Python3算法实例 1.1：动态规划 之 上台阶
                        AiFany

                        step.jpg问题：50级台阶的楼梯，从下往上走，每跨一步只能向上1级或者2级台阶，共有多少种走法。动态规划思想解析：假设T(50)表示所有走法的种数。当在50级台阶的时候，要么是从49级台阶一步走了1阶上来的，要么是从48级台阶一步走了2阶上来的。因此T(50)=T(49)+T(48)。同理可得  T(49)=T(48)+T(47)  T(49)=T(48)+T(47)  ……  T(3)=T
                    
                    位运算的算法实例
                        2bd02fb60c5b

                        问题：10亿个数，有两个数只出现了1次，其他的数有出现了两次，请找出这两个数分析：10亿个数，每个int数据占4个byte，10亿个数需要4G的内存，代码示例：下面的示例，使用了Integer，这将会占用更大的空间！！Listlist=Arrays.asList(1,1,3,3,4,4,7,9);intresult=list.stream().reduce(0,(o1,o2)->o1^o2);Sy
                    
                    [笔记]机器学习之机器学习理论及案例分析《二》 聚类
                        二进制怪兽
人工智障聚类机器学习算法
                        #21天学习挑战赛—机器学习#活动地址：CSDN21天学习挑战赛文章目录前言聚类聚类定义什么是簇聚类分类离群点聚类算法实例K-Means算法(k-均值算法)寻找质心最佳位置关于均值关于距离函数维度灾难定义产生的问题解决办法总结前言聚类聚类是在无标记样本的条件下将数据进行分组，从而发现天然的结构。聚类是无监督学习的主要任务，分类是监督学习的主要任务。聚类主要应用在：发现数据的潜在结构对数据进行自然分
                    
                    【JS逆向学习】国家加密系列-SM算法实例
                        诗雅颂
javascript逆向nodenpmsm国家加密加密
                        SM系列1、国家加密算法介绍事实上从2010年开始，我国国家密码管理局就已经开始陆续发布了一系列国产加密算法，其中SM1、SM4、SM7、祖冲之密码（ZUC）是对称算法；SM2、SM9是非对称算法；SM3是哈希算法。目前，这些算法已广泛应用于各个领域中。其中SM2、SM3、SM4三种加密算法是比较常见的2、算法分类算法名称算法类别应用领域特点SM1对称（分组）加密算法芯片分组长度、密钥长度均为12
                    
                    凝聚层次聚类及DBscan算法详解与Python实例
                        OverlordDuke
聚类算法python算法聚类
                        凝聚层次聚类及DBscan算法详解与Python实例凝聚层次聚类DBscan算法实例演示在本篇博客中，我们将深入探讨凝聚层次聚类（AgglomerativeHierarchicalClustering）和DBscan算法，并通过Python实例演示它们的应用。这两种算法都属于聚类算法的范畴，用于将数据点划分为不同的簇。凝聚层次聚类凝聚层次聚类是一种层次化的聚类方法，其主要思想是将每个数据点视为一个
                    
                    银行家算法c++
                        ly@눈_눈
算法c++开发语言
                        银行家算法1.银行家算法1.1银行算法家的目的1.2银行算法家的作用2.设计原理2.1银行家算法的数据结构2.2银行家算法介绍2.3安全性算法3.实验要求4.银行家算法实例5.完整代码和运行测试5.1测试结果5.2完整代码1.银行家算法1.1银行算法家的目的银行家算法是避免死锁的一种重要方法，能够有效的在资源分配的过程中，对系统的安全性进行检测。通过银行家算法设计与实现，可以加深对死锁的理解，掌握
                    
                    php n个猴子围坐成,PHP_php实现猴子选大王问题算法实例，本文实例讲述了php实现猴子选 - phpStudy...
                        CelioHsu
phpn个猴子围坐成
                        php实现猴子选大王问题算法实例本文实例讲述了php实现猴子选大王问题算法。分享给大家供大家参考。具体分析如下：一、问题：n只猴子围坐成一个圈，按顺时针方向从1到n编号。然后从1号猴子开始沿顺时针方向从1开始报数，报到m的猴子出局，再从刚出局猴子的下一个位置重新开始报数，如此重复，直至剩下一个猴子，它就是大王。设计并编写程序，实现如下功能：(1)要求由用户输入开始时的猴子数$n、报数的最后一个数$
                    
                    聚类分析实例
                        llovew.
机器学习算法机器学习人工智能聚类python数据挖掘
                        目录层次聚类概述自底向上的合并算法相似度计算实例分别计算欧式距离值（矩阵）两个组合数据点间的距离层次聚类实例K-MEANS算法基本概念工作流程K-Means算法实例K值对结果的影响DBSCAN算法算法步骤基本步骤工作流程参数选择层次聚类概述层次聚类（HierarchicalClustering）是一种无监督学习的聚类分析方法，用于将数据集中的样本或观测值划分为不同的群集或簇。它通过计算样本之间的相
                    
                    HTTP接口签名校验
                        月犹依依
Java后端技术栈Springhttpjava
                        文章目录为什么要签名校验常用签名校验算法实例为什么要签名校验一般对外的http接口加签的目的是防止数据被篡改。举个例子，A正在某银行网站给B转账，转入卡号和金额输入完成后生成请求报文，然后加密报文传送给银行后台。银行收到请求后，解密得到明文，然后解析得到B的卡号和转账金额等信息，继续走后续转账流程。如果传输使用对称加密算法（最常用的），客户端和服务端都是用同一个对称密钥，那么这个对称密钥就存在泄露
                    
                    python进化算法工具箱_基于DEAP库的Python进化算法从入门到入土—(二)简单遗传算法实现...
                        weixin_39738380
python进化算法工具箱
                        前言在上一篇中，我们已经介绍了如何在DEAP中实现进化算法的基本操作，在这一篇中我们试图将各个操作组装起来，用进化算法解决一个简单的一元函数寻优问题。进化算法实例-一元函数寻优问题描述与分析给定一个函数，求解该函数的最大值。该函数图像如下：function_visuallization该函数的最大值应该出现在处，值为。可以看到该函数有很多局部极值作为干扰项，如果进化算法过早收敛，很容易陷入某个局部
                    
                    神经网络参数优化算法,神经网络算法实例说明
                        快乐的小蓝猫
算法神经网络机器学习
                        lms算法是什么？LMS（Leastmeansquare）算法，即最小均方误差算法。lms算法由美国斯坦福大学的BWidrow和MEHoff于1960年在研究自适应理论时提出，由于其容易实现而很快得到了广泛应用，成为自适应滤波的标准算法。在滤波器优化设计中，采用某种最小代价函数或者某个性能指标来衡量滤波器的好坏，而最常用的指标就是均方误差，也把这种衡量滤波器好坏的方法叫做均方误差准则。lms算法的
                    
                    智能优化算法——模拟退火算法
                        学不明白属于是
智能优化算法算法模拟退火算法pythonmatlab
                        目录算法简介模拟退火算法的思想模拟退火算法的流程说点“人话”算法实例求解一元函数求解二元函数求解TSP问题模拟退火求TSP时，产生新解的方法参考资料本文内容均以求最小化问题为背景进行阐述（代码实例除外）算法简介模拟退火算法是一种通用的全局优化算法，为具有NP复杂性的问题提供有效的近似解，其克服了其他优化过程容易陷入局部最小的缺陷和对初值的依赖，目前被广泛的应用于生产调度、控制工程、机器学习、神经网
                    
                    RSA算法基础
                        云楼主
算法密码学
                        算法笔记：RSA算法基础RSA算法基础简介算法基础算法详解大整数表示素数产生Euclid算法模幂算法Montgomery算法RSA算法实例RSA-CRTRSA算法基础简介RSA算法由RonRivest、AdiShamir和LeonardAdleman于1977年提出，算法名字由三人名字开头字母组成。该算法是当前公钥密码体系中的算法基础。RSA算法的安全性依赖于“大整数因字分解问题是NP-hard的
                    
                    EM算法实例
                        Zero or One
MATLABmatlab算法数据挖掘
                        EM算法详解NatureBiotech在他的一篇EMtutorial文章《Do,C.B.,&Batzoglou,S.(2008).Whatistheexpectationmaximizationalgorithm?.Naturebiotechnology,26(8),897.》中，用了一个投硬币的例子来讲EM算法的思想。比如两枚硬币A和B，如果知道每次抛的是A还是B，那可以直接估计（见下图a）。如
                    
                    em算法python代码_Python实现EM算法实例代码
                        weixin_39572316
em算法python代码
                        EM算法实例通过实例可以快速了解EM算法的基本思想，具体推导请点文末链接。图a是让我们预热的，图b是EM算法的实例。这是一个抛硬币的例子，H表示正面向上，T表示反面向上，参数θ表示正面朝上的概率。硬币有两个，A和B，硬币是有偏的。本次实验总共做了5组，每组随机选一个硬币，连续抛10次。如果知道每次抛的是哪个硬币，那么计算参数θ就非常简单了，如下图所示：如果不知道每次抛的是哪个硬币呢？那么，我们就需
                    
                    【数据结构】算法的时间复杂度和空间复杂度
                        宁清_
数据结构算法数据结构排序算法c语言深度优先遍历
                        Abstract一、时间复杂度1.1时间复杂度的定义1.2大O渐进法1.3最坏情况时间复杂度二、空间复杂度2.1空间复杂度的定义三、常见复杂度类型及其实例3.1经典实例3.2排序算法实例快速排序归并排序插入排序直接插入排序使用二分法优化的入排序希尔排序堆排序四、经典例题（待补充）五、重新审视学习数据结构和算法的旅程引言在算法的代码运行前，衡量一个算法的好坏，一般从时间和空间两个维度衡量，即时间复杂
                    
                    KNN算法实例——鸢尾花种类预测
                        学徒SJA
算法python
                        线性回归的scikit-learn实现scikit-learn中提供了一个KNeighborClassifier类来实现k近邻法分类模型方法：fit(X,y)：训练模型predict：使用模型来预测，返回待预测样本的标记。score(X,y)：返回在（X，y）上预测的准确率。predict_proba(X)：返回样本为每种标记的概率。kneighbors([X,n_neighbors,return
                    
                    神经网络模型的实际案例,神经网络模型应用实例
                        快乐的小荣荣
神经网络算法机器学习
                        神经网络算法实例说明有哪些？在网络模型与算法研究的基础上，利用人工神经网络组成实际的应用系统，例如，完成某种信号处理或模式识别的功能、构作专家系统、制成机器人、复杂系统控制等等。纵观当代新兴科学技术的发展历史，人类在征服宇宙空间、基本粒子，生命起源等科学技术领域的进程中历经了崎岖不平的道路。我们也会看到，探索人脑功能和神经网络的研究将伴随着重重困难的克服而日新月异。谷歌人工智能写作项目：爱发猫神经
                    
                    贝叶斯分类算法实例 --根据姓名推测男女
                        大数据_zzzzMing

                        一.从贝叶斯公式开始贝叶斯分类其实是利用用贝叶斯公式，算出每种情况下发生的概率，再取概率较大的一个分类作为结果。我们先来看看贝叶斯公式：P(A|B)=P(B|A)P(A)/P(B)其中P(A|B)是指在事件B发生的情况下事件A发生的概率。在贝叶斯定理中，每个名词都有约定俗成的名称：P(A|B)是已知B发生后A的条件概率，也由于得自B的取值而被称作A的后验概率。P(A)是A的先验概率（或边缘概率）。
                    
                    用java语言写一个AES算法，使用AES(CBC模式)对数据进行加密或解密。加解密用到的密钥(Key)和密钥偏移量(IV)，代码实例类编写。
                        gb4215287
springbootjavajava
                        以下是一个使用Java编写的AES算法实例，使用AES（CBC模式）对数据进行加密和解密。代码中包括了生成随机密钥和密钥偏移量的方法。javaCopycodeimportjavax.crypto.*;importjavax.crypto.spec.IvParameterSpec;importjavax.crypto.spec.SecretKeySpec;importjava.security.In
                    
                    2.算法-Python模拟退火算法实例
                        南宫遐迩
算法模拟退火算法算法机器学习python后端数据结构推荐算法
                        题记下面是python编写的模拟退火算法实例，包括全过程和解析。编写main.py文件main.py文件如下：importmathimportrandom#初始解：算法从问题的解空间中随机选择一个初始解作为当前解。#目标函数：算法需要优化的目标函数定义了解的质量。算法的目标是最小化或最大化这个函数。#温度：模拟退火算法引入了一个控制搜索过程的温度参数。温度高时，算法更容易接受比当前解质量差的解；温
                    
                                jsonp 常用util方法
                                    hw1287789687
jsonpjsonp常用方法jsonp callback
                                    jsonp 常用java方法 
(1)以jsonp的形式返回:函数名(json字符串) 
/***
	 * 用于jsonp调用
	 * @param map : 用于构造json数据
	 * @param callback : 回调的javascript方法名
	 * @param filters : <code>SimpleBeanPropertyFilter theFilt
                                
                                多线程场景
                                    alafqq
多线程
                                    0 
能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 
对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ 
Java多线程 
2012年11月23日 15:41 Young9007 Young9007 
4 
0 0 4 
 
Comment添加评论关注(2) 
3个答案 按时间排序 按投票排序 
 
0 
0 
最典型的如： 
1、
                                
                                Maven学习——修改Maven的本地仓库路径
                                    Kai_Ge
maven
                                          安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。 
  
 
                                
                                placeholder的浏览器兼容
                                    120153216
placeholder
                                    【前言】 
自从html5引入placeholder后，问题就来了， 
不支持html5的浏览器也先有这样的效果， 
各种兼容，之前考虑，今天测试人员逮住不放， 
想了个解决办法，看样子还行，记录一下。 
  
【原理】 
不使用placeholder，而是模拟placeholder的效果， 
大概就是用focus和focusout效果。 
  
【代码】 
<scrip
                                
                                debian_用iso文件创建本地apt源
                                    2002wmj
Debian
                                    1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下

2.创建N个挂载点目录  
如下： 
debian:~#mkdir –r /media/dvd1 
debian:~#mkdir –r /media/dvd2 
debian:~#mkdir –r /media/dvd3 
…. 
debian:~#mkdir –r /media
                                
                                SQLSERVER耗时最长的SQL
                                    357029540
SQL Server
                                    对于DBA来说，经常要知道存储过程的某些信息： 
 
1.   执行了多少次 
 
2.   执行的执行计划如何 
 
3.   执行的平均读写如何 
 
4.   执行平均需要多少时间 
 
列名          &
                                
                                com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil
                                    7454103
eclipse
                                    今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下： 
 
错误提示信息： 
 
An error has occurred.See error log for more details. 
Reason: 
com/genuitec/
                                
                                用正则删除文本中的html标签
                                    adminjun
javahtml正则表达式去掉html标签
                                    使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。 
如下： 
public static String Html2Text(String inputString) {  
String htmlStr = inputString; // 含html标签的字符串
  String textSt
                                
                                嵌入式系统设计中常用总线和接口
                                    aijuans
linux 基础
                                                   嵌入式系统设计中常用总线和接口 
  
        任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
                                
                                Java函数调用方式——按值传递
                                    ayaoxinchao
java按值传递对象基础数据类型
                                    Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。 
  
首先，让我们看一看基础数据类型是如何按值传递的。 
  
public static void main(String[] args) {
		
	int a = 2;

                                
                                ios音量线性下降
                                    bewithme
ios音量
                                    直接上代码吧 
  
//second 几秒内下降为0
- (void)reduceVolume:(int)second {
    KGVoicePlayer *player = [KGVoicePlayer defaultPlayer];
    
    if (!_flag) {
        _tempVolume = player.volume;
       
                                
                                与其怨它不如爱它
                                    bijian1013
选择理想职业规划
                                            抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。 
        一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。 
  
                                
                                一边时间不够用一边浪费时间
                                    bingyingao
工作时间浪费
                                    一方面感觉时间严重不够用，另一方面又在不停的浪费时间。 
 
每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。 
精神还是很差，下午像一直野鬼在城市里晃荡。 
 
 
为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。 
控制让自己周末早睡早起，你就成功了一半。 
 
有多少个工作
                                
                                【Scala八】Scala核心二：隐式转换
                                    bit1129
scala
                                    Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
                                
                                sudoku slover in Haskell (2)
                                    bookjovi
haskellsudoku
                                    继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 
  
board = [0,3,4,1,7,0,5,0,0,
         0,6,0,0,0,8,3,0,1,
         7,0,0,3,0,0,0,0,6,
         5,0,0,6,4,0,8,0,7,

                                
                                Java-Collections Framework学习与总结-HashSet和LinkedHashSet
                                    BrokenDreams
linkedhashset
                                            本篇总结一下两个常用的集合类HashSet和LinkedHashSet。 
        它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
                                
                                读《研磨设计模式》-代码笔记-备忘录模式-Memento
                                    bylijinnan
java设计模式
                                    声明： 本文只为方便我个人查阅和理解，详细的分析以及源代码请移步 原作者的博客http://chjavach.iteye.com/ 
 
 

import java.util.ArrayList;
import java.util.List;



/*
 * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”

                                
                                《RAW格式照片处理专业技法》笔记
                                    cherishLC
PS
                                    注意，这不是教程！仅记录楼主之前不太了解的 
 
 一、色彩（空间）管理 
作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼） 
注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
                                
                                使用 Git 下载 Spring 源码 编译 for Eclipse
                                    crabdave
eclipse
                                    使用 Git 下载 Spring 源码 编译 for Eclipse 
  
1、安装gradle，下载 http://www.gradle.org/downloads 
配置环境变量GRADLE_HOME，配置PATH  %GRADLE_HOME%/bin，cmd，gradle -v 
  
2、spring4 用jdk8 下载 https://jdk8.java.
                                
                                mysql连接拒绝问题
                                    daizj
mysql登录权限
                                    mysql中在其它机器连接mysql服务器时报错问题汇总 
 
一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p   //带-p参数，在下一步进行密码输入 
Enter password:    //无字符串输入 
ERROR 1045 (28000): Access 
                                
                                Google Chrome 为何打压 H.264
                                    dsjt
applehtml5chromeGoogle
                                    Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 
 
Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
                                
                                yii 获取控制器名 和方法名
                                    dcj3sjt126com
yiiframework
                                    1. 获取控制器名 
在控制器中获取控制器名:  $name = $this->getId(); 
在视图中获取控制器名:    $name = Yii::app()->controller->id;  
  
2. 获取动作名  
在控制器beforeAction()回调函数中获取动作名:  $name = 
                                
                                Android知识总结（二）
                                    come_for_dream
android
                                    明天要考试了，速速总结如下 
  
1、Activity的启动模式 
       standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） 
       singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
                                
                                高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元
                                    gcq511120594
工作项目管理
                                    高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！ 
首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
                                
                                linux expect
                                    heipark
expect
                                    1. 创建、编辑文件go.sh 
  
#!/usr/bin/expect

spawn sudo su admin

expect  "*password*" { send "13456\r\n" }

interact  
   2. 设置权限 
   chmod u+x go.sh   3.
                                
                                Spring4.1新特性——静态资源处理增强
                                    jinnianshilongnian
spring 4.1
                                    目录 
Spring4.1新特性——综述 
Spring4.1新特性——Spring核心部分及其他 
Spring4.1新特性——Spring缓存框架增强 
Spring4.1新特性——异步调用和事件机制的异常处理 
Spring4.1新特性——数据库集成测试脚本初始化 
Spring4.1新特性——Spring MVC增强 
Spring4.1新特性——页面自动化测试框架Spring MVC T
                                
                                idea ubuntuxia 乱码
                                    liyonghui160com

                                        
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个 字体文件。 
2.在ubuntu 下可以执行下面操作安装该字体： 
sudo mkdir /usr/share/fonts/truetype/simsun
sudo cp simsun.ttf  /usr/share/fonts/truetype/simsun
fc-cache -f -v 

                                
                                改良程序的11技巧
                                    pda158
技巧
                                    有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码 时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。 
  
让我们看一些基本的编程技巧： 
  
 
 尽量保持方法简短 
 永远永远不要把同一个变量用于多个不同的
                                
                                300个涵盖IT各方面的免费资源（下）——工作与学习篇
                                    shoothao
创业免费资源学习课程远程工作
                                    工作与生产效率: 
  
 
 A. 背景声音 
 
 
  Noisli:背景噪音与颜色生成器。 
  Noizio:环境声均衡器。 
  Defonic:世界上任何的声响都可混合成美丽的旋律。 
  Designers.mx:设计者为设计者所准备的播放列表。 
  Coffitivity:这里的声音就像咖啡馆里放的一样。 
 
 
 B. 避免注意力分散 
 
 
  Self Co
                                
                                深入浅出RPC
                                    uule
rpc
                                    深入浅出RPC-浅出篇 
深入浅出RPC-深入篇 
  
RPC 
Remote Procedure Call Protocol 
远程过程调用协议 
  
它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.