壮壮不太胖^QwQ

机器学习-P5 朴素贝叶斯算法（书P53）

文章目录

- 一，概述
- - 1，条件概率（Condittional probability）
  - 2，全概率公式
  - 3，贝叶斯推断
- 二，举个“栗子”（手动星标）
- 三，朴素贝叶斯的种类
- - 如何选择
  - 1，高斯分布的朴素贝叶斯算法
  - - GaussianNB在sklearn中的实现
  - 2，多项式分布的朴素贝叶斯算法
  - - MultinomialNB在sklearn中的实现
  - 3，伯努利分布的朴素贝叶斯
  - - BernoulliNB在sklearn中的实现
- 四，朴素贝叶斯之鸢尾花数据实验
- - 1，导入数据集
  - 2，切分出训练集和测试集
  - 3，分类器的代码实现
- 五，使用朴素贝叶斯进行文档分类
- - 1，构建词向量
  - 2，朴素贝叶斯分类器训练函数
  - 3，测试朴素贝叶斯分类器
  - - 手动星标（一定要看）
- 六，朴素贝叶斯改进之拉普拉斯平滑

一，概述

1，条件概率（Condittional probability）

条件概率，就是指在事件B发生的情况下，事件A发生的概率，用 P(A|B) 来表示

根据文氏图可知：在事件B发生的情况下，事件A发生的概率如下：↓

同理可得：P(A∩B) = P(B|A)*P(A)
所以：（将上述两个式子联立）

2，全概率公式

如果事件A1,A2,A3, … ,An构成一个完备事件且都有正改率，那么对于任何一个B事件满足以下公式：

3，贝叶斯推断

根据条件概率和全概率公式，可以得到贝叶斯概率：

P(A)称为“先验概率”（Prior prob），即在B发生之前，我们队A事件概率的一个判断。
P(A|B)称为“后验概率”（Posterior prob），即在B事件发生之后，我们对A事件概率的重新评估。
P(A|B)/P(B)称为“可能性函数”（Likely hood），这是一个调整因子，使得预估概率更加接近真实概率。

所以条件概率可以理解为：
后验概率 = 先验概率 * 调整因子

如果“可能性函数” > 1，意味着“先验概率”被增强，事件A的可能性变大；
如果“可能性函数” = 1，意味着B事件无助于判断A事件的可能性；
如果“可能性函数” < 1，意味着“先验概率”被削弱，事件A的可能性变小。

二，举个“栗子”（手动星标）

问：某男（帅，性格不好，不上进）向女生求婚，该女生嫁还是不嫁？

这个栗子，按照朴素贝叶斯的求解可转化为一下两个式子：

最后根据表格和公式算出数据就好啦~

先来算分母



所以该女生应该是选择不嫁。

三，朴素贝叶斯的种类

在sklearn中，一共有3个朴素贝叶斯的分类算法。
分别是GaussianNB，MultinomialNB和BernoulliNB。

如何选择

一般来说，如果样本特征的分布大部分是连续值，使用GaussianNB会比较好。
如果样本特征的分布大部分是多元离散值，使用MultinomialNB较为合适。
而样本特征是二元离散值或者稀疏的多元离散值，则应该使用BernoulliNB。

1，高斯分布的朴素贝叶斯算法

GaussianNB就是先验为高斯分布（正态分布）的朴素贝叶斯，假设每个标签的数据都服从简单的正态分布。

其中Ck为Y的第k类类别。mean(k) 和 Var(k) 为需要从训练集估计的值。

GaussianNB在sklearn中的实现

1，会使用到的包

import pandas as pd  # 数据预览
from sklearn.model_selection import train_test_split  #数据切分
from sklearn.naive_bayes import GaussianNB  # GaussianNB方法
from sklearn.metrics import accuracy_score  # 计算准确的

2，导入sklearn中的鸢尾花数据

from sklearn import datasets
iris = datasets.load_iris()

3，使用pandas预览
传送门：Pandas的数据前处理

pf = pd.DataFrame(iris.data, columns=iris.feature_names)
pf['类别']=(iris.target)
pf.head()

5，切分数据集（训练 + 测试）

from sklearn.model_selection import train_test_split  
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=12)

6，建立算法模型

clf = GaussianNB()
clf.fit(x_train, y_train)
>>>GaussianNB(priors=None, var_smoothing=1e-09)

7，在测试集上进行预测

直接返回得出标签（分类结果）

clf.predict(x_test)
>>>array([0, 2, 0, 1, 2, 2, 2, 0, 2, 0, 1, 0, 0, 0, 1, 2, 2, 1, 0, 1, 0, 1,
       2, 1, 0, 2, 2, 1, 0, 0, 0, 1, 2, 0, 2, 0, 1, 1])

返回每一个测试数据所对应的每一个标签的可能性（概率）,概率最高的标签就会返回到上边的那个方法中

clf.predict_proba(x_test)
>>>array([[1.00000000e+000, 2.32926069e-017, 1.81656357e-023],
       [4.28952299e-154, 2.48576754e-002, 9.75142325e-001],
       [1.00000000e+000, 7.45528845e-018, 3.79800436e-024],
       [3.59748710e-076, 9.99751806e-001, 2.48194200e-004],
       [2.20411871e-239, 4.45798016e-009, 9.99999996e-001],
       [1.23795145e-173, 1.95814902e-003, 9.98041851e-001],
       [2.45866589e-206, 2.34481513e-007, 9.99999766e-001],
       [1.00000000e+000, 2.61810906e-017, 2.67446831e-023],
       ......]

结果是一一对应的

len(clf.predict(x_test)) == len(clf.predict_proba(x_test))
>>>True

8，模型准确率（跑分啦）

accuracy_score(y_test, clf.predict(x_test))
>>>0.9736842105263158

2，多项式分布的朴素贝叶斯算法

MultinomialNB就是先验为多项式分布的朴素贝叶斯算法。
他假设特征是由一个简单地多项式分布生成的。多项式分布可以描述各种类型样本出现次数的概率，因此多项式朴素贝叶斯非常适合用于描述出现次数或者出现次数比例的特征。该模型常用于文本分类，特征表示是次数，例如某个词语的出现次数。

多项式分布公式如下：

其中，P(Xj = xjl | Y = Ck) 是第k个类别的第j维特征的第l个取值的条件概率。mk是训练集中输出位第k类的样本个数。入为一个大于 0 的常数，常常取 1，即拉普拉斯平滑。也可以取其他值。

MultinomialNB在sklearn中的实现

from sklearn.naive_bayes import MultinomialNB

mlf = MultinomialNB()
mlf.fit(x_train, y_train)
>>>MultinomialNB(alpha=1.0, class_prior=None, fit_prior=True)

（其他的和高斯分布贝叶斯都一样，嘎嘎）

3，伯努利分布的朴素贝叶斯

BernoulliNB就是先验为伯努利分布的朴素贝叶斯。
假设特征的先验概率为二元伯努利分布，即如下式：

此时 l 只有两种取值。xjl 只能取值 0或1。
在伯努利模型中，每个特征的取值是布尔值，即True和False（或者1和0）。在文本分类中，就是一个特征有没有在一个文档中出现。

BernoulliNB在sklearn中的实现

from sklearn.naive_bayes import BernoulliNB

mlf = BernoulliNB()
mlf.fit(x_train, y_train)
>>>BernoulliNB(alpha=1.0, binarize=0.0, class_prior=None, fit_prior=True)

（其他的和高斯分布贝叶斯都一样，嘎嘎）

四，朴素贝叶斯之鸢尾花数据实验

应用GaussianNB对鸢尾花数据进行分类

1，导入数据集

import pandas as pd

dataSet = pd.read_csv('D:\Python\pycharm\机器学习\朴素贝叶斯算法\iris.txt',header=None)
dataSet.head()

2，切分出训练集和测试集

函数
在这里明没有将整个数据进行乱序，而只是对索引进行了乱序，然后再由乱序的索引随机提取样本，好处在于切分后不会改变数据原本的排列方式

import random

def randSplit(dataSet, rate):
    """
    数据集切分函数
    :param dataSet:原始数据集
    :param rate: 训练集所占原始数据集比例[0, 1]
    :return: 训练集，测试集
    """
    index = list(dataSet.index)    # 取出索引
    random.shuffle(index)   # 打乱索引
    dataSet.index = index   # 将打乱后的索引重新赋给原数据集
    n = dataSet.shape[0]    # 最大行数（共有几组数据）
    m = int(n * rate)       # 训练集所占的行数（训练集样本个数）
    # 依照比例提取训练集和测试集
    train = dataSet.loc[range(m), :]
    test = dataSet.loc[range(m, n), :]
    # 恢复原始数据集索引
    dataSet.index = range(dataSet.shape[0])
    # 恢复测试集索引
    test.index = range(test.shape[0])
    return train, test

使用

train, test = randSplit(dataSet, 0.8)

3，分类器的代码实现

以下为高斯朴素贝叶斯分类器
（注意：会对test进行格式上的更改，所以不能反复对text进行预测）

def gnd_classify(train, test):
    """
    高斯朴素贝叶斯分类器
    :param train: 训练集
    :param test: 测试集（包括属性与分类）
    :return: 测试集（追加一列为预测结果）
    """
    labels = train.iloc[:, -1].value_counts().index  # 提取训练集的标签样本种类（无重复）
    mean = []       # 存放每个类别的均值
    std = []        # 存放每个类别的方差
    result = []     # 存放测试集预测结果

    for i in labels:
        item = train.loc[train.iloc[:, -1] == i, :]                 # 取出每一种类别
        m = item.iloc[:, :-1].mean()                                # 当前类别的平均值
        mean.append(m)
        s = np.sum((item.iloc[:, :-1] - m) ** 2) / (item.shape[0])  # 当前类别的方差
        std.append(s)

    # 转换为DataFrame格式，索引为类标签
    means = pd.DataFrame(mean, index=labels)
    stds = pd.DataFrame(std, index=labels)

    for j in range(test.shape[0]):
        iset = test.iloc[j, :-1].tolist()  # 取出当前测试样本，并将其转换为list格式
        iprod = np.exp(-1 * (iset - means) ** 2 / (stds ** 2)) / (np.sqrt(2 * np.pi * stds))  # 正态分布公式
        prob = 1
        # 遍历每一个特征
        for k in range(test.shape[1] - 1):
            prob *= iprod[k]                          # 特征概率之积即为当前实例概率
            cla = prob.index[np.argmax(prob.values)]  # 返回最大概率类别
        result.append(cla)
        
    test['预测结果'] = result                                # 将预测结果加入测试集
    acc = (test.iloc[:, -1] == test.iloc[:, -2]).mean()    # 计算准确率
    print(f'模型预测准确率为：{acc}')
    return test

代码测试
（因为之前对数据集的切分是随机的所以这边的准确率可能会不大一样）

gnd_classify(train, test)
>>>模型预测准确率为：0.9333333333333333

五，使用朴素贝叶斯进行文档分类

此案例所有函数：

loadDataSet()：创建实验数据集合
createVocabList(dataSet)：生成不重复词汇表
setofWords2Vec(vocabList, inputSet)：生成词向量（输入的是一个词条）-- 辅助函数
get_trainMat(dataSet)：生成所有词条的向量
trainNB(trainMat, classVec)：朴素贝斯分类器训练函数（以标题六代码为准）
classifyNB(vec2Classify, p0V, p1V, pAb)：朴素贝叶斯分类器分类函数（以标题六代码为准）
testingNB(testVec)：朴素贝叶斯测试函数

1，构建词向量

留言文本已经被切分好，并且认为标注好类别，用于训练模型。
类别有两类：侮辱性（1）；非侮辱性（2）。

创建数据集

def loadDataSet():
    """
    创建实验数据集合
    :return: 切分好的样本词条，类标签向量
    """
    # 切分好的样本词条
    dataSet = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],
               ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],
               ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
               ['stop', 'posting', 'stupid', 'worthless', 'garbage'],
               ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],
               ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]
    # 类标签向量
    classVec = [0, 1, 0, 1, 0, 1]   # 1代表侮辱性词汇；0代表非侮辱性词汇
    return dataSet, classVec

dataSet, classVec

dataSet, classVec = loadDataSet()

生成不重复词汇表（set类型中会去除掉相同元素）

def createVocabList(dataSet):
    """
    将切分好的样本词条整理成词汇表（不重复）
    :param dataSet: 切分好的样本词条
    :return: 不重复词汇表
    """
    vocabSet = set()                    # 创建一个空集合
    for doc in dataSet:                 # 遍历每一条言论
        vocabSet = vocabSet | set(doc)  # 取并集
        vocabList = list(vocabSet)
    return vocabList

vocabList

vocabList = createVocabList(dataSet)
>>>['flea', 'has', 'cute', 'licks', 'posting', 'please', 'ate', 'maybe', 'dog',
    'quit', 'I', 'him', 'buying', 'problems', 'steak', 'to', 'food', 'take', 
    'not', 'how', 'help', 'mr', 'stupid', 'so', 'stop', 'dalmation', 'love',
    'park', 'worthless', 'garbage', 'my', 'is']

生成词向量（输入的是一个词条）-- 辅助函数

def setofWords2Vec(vocabList, inputSet):
    """
    生成词向量
    :param vocabList: 词汇表
    :param inputSet: 切分好的词条列表中的一条
    :return: 文档向量，词集模型
    """
    returnVec = [0]*len(vocabList)                # 创建一个与词汇表等长的0向量
    for word in inputSet:                         # 遍历每一个词条
        if word in vocabList:                     # 如果词条存在于词汇表中，则变为1
            returnVec[vocabList.index(word)] = 1  # 更改在该词在词汇表中对应的位置！
        else:
            print(f'{word} is not in my Vocabulary!')
    return returnVec

生成所有词条的向量

def get_trainMat(dataSet):
    """
    所有词条向量列表
    :param dataSet:切分好的样本词条 
    :return: 所有词条向量组成的列表
    """
    trainMat = []                                         # 初始化向量列表
    vocabList = createVocabList(dataSet)                  # 生成词汇列表              
    for inputList in dataSet:                             # 遍历样本词条中的每一条
        returnVec = setofWords2Vec(vocabList, inputList)  # 将当前词条向量化
        trainMat.append(returnVec)                        # 追加到向量列表中
    return trainMat

trainMat

trainMat = get_trainMat(dataSet)
>>>[[1, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0], 
    [0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0], 
    [0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1], 
    [0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0],
    [0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0], 
    [0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0]]

2，朴素贝叶斯分类器训练函数

词向量构建好之后，我们就可以来构建分类器的训练函数了。
（下边代码有问题，经过平滑后的正确代码在“标题六”）

def trainNB(trainMat, classVec):
    """
    朴素贝斯分类器训练函数
    :param trainMat: 训练文档矩阵
    :param classVec: 训练类别标签向量
    :return: p0V：非侮辱类条件概率数组
             p1V：侮辱类条件概率数组
             pAb：文档属于侮辱类的概率
    """
    n = len(trainMat)  # 计算训练函数的文档数目
    m = len(trainMat[0])  # 计算每篇文档的词条数目
    pAb = sum(classVec) / n  # 文档属于侮辱类的概率
    p0Num = np.zeros(m)  # 非侮辱类词条出现数初始化为0
    p1Num = np.zeros(m)  # 侮辱类词条出现数初始化为0
    p0Denom = 0  # 非侮辱类分母初始化为0
    p1Denom = 0  # 侮辱类分母初始化为0

    # 遍历每一个文档
    for i in range(n):
        # 统计侮辱类的条件概率所需要的数据
        if classVec[i] == 1:
            p1Num += trainMat[i]
            p1Denom += sum(trainMat[i])
        # 统计非侮辱类的条件概率所需要的数据
        else:
            p0Num += trainMat[i]
            p0Denom += sum(trainMat[i])

    p1V = p1Num / p1Denom
    p0V = p0Num / p0Denom
    return p0V, p1V, pAb

p0V, p1V, pAb = trainNB(trainMat, classVec)

下边来看一下，这些参数都表达了什么
我们以词汇表中的第一个词‘flea’（蚤）为例

vocabList = createVocabList(dataSet)
>>>['flea', 'has', 'cute', 'licks', 'posting', 'please', 'ate', 'maybe', 'dog',
    'quit', 'I', 'him', 'buying', 'problems', 'steak', 'to', 'food', 'take', 
    'not', 'how', 'help', 'mr', 'stupid', 'so', 'stop', 'dalmation', 'love',
    'park', 'worthless', 'garbage', 'my', 'is']

对应他是非侮辱性词汇的条件概率为 0.04166667

p0V
>>>array([0.04166667, 0.04166667, 0.04166667, 0.04166667, 0.        ,
          0.04166667, 0.04166667, 0.        , 0.04166667, 0.        ,
          0.04166667, 0.08333333, 0.        , 0.04166667, 0.04166667,
          0.04166667, 0.        , 0.        , 0.        , 0.04166667,
          0.04166667, 0.04166667, 0.        , 0.04166667, 0.04166667,
          0.04166667, 0.04166667, 0.        , 0.        , 0.        ,
          0.125     , 0.04166667])

对应他是侮辱性词汇的条件概率为 0.

p1V
>>>array([0.        , 0.        , 0.        , 0.        , 0.05263158,
          0.        , 0.        , 0.05263158, 0.10526316, 0.05263158,
          0.        , 0.05263158, 0.05263158, 0.        , 0.        ,
          0.05263158, 0.05263158, 0.05263158, 0.05263158, 0.        ,
          0.        , 0.        , 0.15789474, 0.        , 0.05263158,
          0.        , 0.        , 0.05263158, 0.10526316, 0.05263158,
          0.        , 0.        ])

可以说 vocabList – p0V – p1V 中的元素一一对应
最后看一下该文档属于侮辱类的概率

pAb
>>>0.5

3，测试朴素贝叶斯分类器

传送门：有关lambda讲解
关于functools中的reduce函数，我把源码放在下边了 ↓
（这里不想看可以直接跳过）

def reduce(function, sequence, initial=None): # real signature unknown; restored from __doc__
    """
    reduce(function, sequence[, initial]) -> value
    
    将两个参数的函数累加应用于序列的项，
	从左到右，以便将序列减少到单个值。
    For example, 
    reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])
    表示((((1+2)+3)+4)+5).  
	如果有首字母，则将其放在项目之前计算中的序列，
	并在序列为空。
    """
    pass

朴素贝叶斯分类器分类函数
（下边代码有问题，经过平滑后的正确代码在“标题六”）

from functools import reduce


def classifyNB(vec2Classify, p0V, p1V, pAb):
    """
    朴素贝叶斯分类器分类函数
    :param vec2Classify:待分类词条数组
    :param p0V: 非侮辱类条件概率数组
    :param p1V: 侮辱类条件概率数组
    :param pAb: 文档属于侮辱类的概率
    :return: 0（非侮辱类），1（侮辱类）
    """
    # 对应元素相乘
    p1 = reduce(lambda x, y: x * y, vec2Classify * p1V) * pAb
    p0 = reduce(lambda x, y: x * y, vec2Classify * p0V) * (1 - pAb)
    print('p0:', p0)
    print('p1:', p1)
    if p1 > p0:
        return 1
    else:
        return 0

朴素贝叶斯测试函数

def testingNB(testVec):
    """
    朴素贝叶斯测试函数
    :param testVec:测试样本 （词条）
    :return: 测试样本的类别
    """
    dataSet, classVec = loadDataSet()  # 创建实验样本
    vocabList = createVocabList(dataSet)  # 创建词汇表
    trainMat = get_trainMat(dataSet)  # 将实验样本向量化
    p0V, p1V, pAb = trainNB(trainMat, classVec)  # 训练分类器
    thisone = setofWords2Vec(vocabList, testVec)  # 测试样本向量化

    # 执行分类，并打印结果
    if classifyNB(thisone, p0V, p1V, pAb):
        print(testVec, '属于侮辱类')
    else:
        print(testVec, '属于非侮辱类')

手动星标（一定要看）

测试样本1

testVec1 = ['love','my','bed']
testingNB(testVec1)
>>>p0: 0.0
   p1: 0.0
['love', 'my', 'bed'] 属于非侮辱类

测试样本2

testVec2 = ['stupid','garbage']
testingNB(testVec2)
>>>p0: 0.0
   p1: 0.0
['stupid', 'garbage'] 属于非侮辱类

这里会发现，这样写的算法无法进行分类，p0和p1的计算结果都为0，显示结果错误。这是为什么呢？
（还记p0V和p1V中的那些0吗，就是他们在搞事情）

六，朴素贝叶斯改进之拉普拉斯平滑

利用贝叶斯分类器对文档进行分类时，要计算多个概率乘积以获得文档属于某个类别的概率，即计算P(w1|1)P(w2|1)P(w3|1)。如果其中一个值为0，那么最后的乘积也为0。显然这样是不合理的，为了降低这种影响可以将所有词的出现数初始化为1，并将分母初始化为2。这种做法就叫做拉普拉斯平滑（Laplace Smoothing）又被称为加1平滑，是比较常用的平滑方法，他就是为了解决0概率问题。

另外一个遇到的问题就是下溢出，这是由于太多很小的数相乘造成的。我们在计算乘积时，由于大部分因子都很小，所以程序会下溢或者得不到正确答案。为了解决这个问题，对乘积的结果取自然对数。通过求对数可以避免下溢出或者浮点数舍入导致的错误。同时，采用自然对数进行处理不会有任何损失。

下图给出函数 f(x) 与 ln(f(x)) 的曲线：

检查这两条曲线就会发现他们在相同区域内同时增加或者减少（x相同时，导数的正负相同），并且在相同点上取到极值。他们的取值虽然不同，但不影响最终结果。因此可以将代码修改如下：

def trainNB(trainMat, classVec):
    """
    朴素贝斯分类器训练函数
    :param trainMat: 训练文档矩阵
    :param classVec: 训练类别标签向量
    :return: p0V：非侮辱类条件概率数组
             p1V：侮辱类条件概率数组
             pAb：文档属于侮辱类的概率
    """
    n = len(trainMat)  # 计算训练函数的文档数目
    m = len(trainMat[0])  # 计算每篇文档的词条数目
    pAb = sum(classVec) / n  # 训练文档属于侮辱类的概率
    p0Num = np.ones(m)  # 非侮辱类词条出现数初始化为1
    p1Num = np.ones(m)  # 侮辱类词条出现数初始化为1
    p0Denom = 2  # 非侮辱类分母初始化为2
    p1Denom = 2  # 侮辱类分母初始化为2

    # 遍历每一个文档
    for i in range(n):
        # 统计侮辱类的条件概率所需要的数据
        if classVec[i] == 1:
            p1Num += trainMat[i]
            p1Denom += sum(trainMat[i])
        # 统计非侮辱类的条件概率所需要的数据
        else:
            p0Num += trainMat[i]
            p0Denom += sum(trainMat[i])

    p1V = np.log(p1Num / p1Denom)
    p0V = np.log(p0Num / p0Denom)
    return p0V, p1V, pAb

（修改：分子初始化改为1，分母初始化改为2，对概率取log）

def classifyNB(vec2Classify, p0V, p1V, pAb):
    """
    朴素贝叶斯分类器分类函数
    :param vec2Classify:待分类词条数组
    :param p0V: 非侮辱类条件概率数组
    :param p1V: 侮辱类条件概率数组
    :param pAb: 文档属于侮辱类的概率
    :return: 0（非侮辱类），1（侮辱类）
    """
    # 对应元素相乘
    p1 = sum(vec2Classify * p1V) + np.log(pAb)
    p0 = sum(vec2Classify * p0V) + np.log(1 - pAb)
    
    if p1 > p0:
        return 1
    else:
        return 0

（因为loga*logb = log(a+b)，所以改成sum就ok）

然后再重新测试一下代码

testVec1 = ['love','my','bed']
testingNB(testVec1)
>>>bed is not in my Vocabulary!
['love', 'my', 'bed'] 属于非侮辱类

testVec2 = ['stupid','dog']
testingNB(testVec2)
>>>['stupid', 'dog'] 属于侮辱类

（这会就可以啦~）

（2020年3月28日21:20:47）

你可能感兴趣的:(机器学习实战（书）,机器学习,机器学习,python,人工智能)

2024年Python最新下载安装教程，附详细图文，持续更新 Java徐师兄 Python 教程 python 开发语言 Python 下载安装 Python 安装 Python3 下载安装教程
大家好，我是Java徐师兄，今天为大家带来的是Python3的下载安装教程，适用于所有Python3版本，感兴趣的可以看一下文章目录简介一、Python的下载1网盘下载地址(下载速度比较快，推荐）2官网下载地址二、Python的安装三推荐阅读简介Python是一种高级、解释型、面向对象的编程语言，由GuidovanRossum于20世纪90年代初开发。Python语法简洁、易读、功能强大，被广泛应
python图像差分法目标检测_OpenCV实现帧差法检测运动目标 weixin_39708854 python图像差分法目标检测
今天的目标是用OpenCV实现对运动目标的检测，这里选用三帧帧差法。代码如下：#include#include#include#include#includedoubleThreshold_index=0;constintCONTOUR_MAX_AERA=200;voidtrackbar(intpos){Threshold_index=(double)pos;}intmain(intargc,ch
深入探索Llama.cpp：在LangChain中使用llama-cpp-python dfvcbipanjr python llama langchain
深入探索Llama.cpp：在LangChain中使用llama-cpp-python随着大语言模型（LLMs）的普及，开发者需要更有效的方法来部署和使用这些模型。本文将介绍如何使用Llama.cpp的Python绑定——llama-cpp-python，并展示如何在LangChain中实现此功能。1.引言llama-cpp-python是Llama.cpp的Python绑定，使开发者能够在本地运
【人工智能时代】-Deepseek用到的技术架构 xiaoli8748_软件开发人工智能
以下是DeepSeek技术架构的详细介绍：1.混合专家架构（MoE）DeepSeek-V3采用了混合专家（Mixture-of-Experts,MoE）架构，这种架构通过将模型分解为多个“专家”网络来处理不同的输入特征。具体配置如下：层数：61层，其中58层为MoE层。专家数量：每层有257个专家（1个共享专家+256个路由专家），整个模型共有14,906个专家。激活机制：每个Token激活9个专
Matplotlib绘图-CSD演示辰往易 python 开发语言
目录前言一、CSD是什么？二、使用步骤1.引入库2.图形处理总结前言Matplotlib是Python的绘图库。它可与NumPy一起使用，提供了一种有效的MatLab开源替代方案。它也可以和图形工具包一起使用，如PyQt和wxPython。本文通过绘制简单的两个信号互谱密度（CSD）的演示，来学习绘制简单的图形。非专业人员，知识比较浅显，内容主要偏向编程，简单介绍在python中matplotli
Chrome浏览器删除网站cookies的解决方案爱编程的喵喵 Windows实用技巧 chrome cookie cookies
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Chrome浏览器删除网站cooki
电脑安装python3.7说缺少-centos7：python3.7 缺少_ssl模块问题 weixin_37988176
在centos7上安装python3.7，很多时候提示缺少安装_ssl模块，这导致很多依赖于ssl的模块无法正常安装，如ulib3，requests。百度网上也提供很多方法，诸如安装liber.ssl来解决。经过一番探索后，个人总结如下：（1）、python3.7的_ssl模块依赖openssl1.0.2或者1.1以上版本，如果openssl版本低于以上版本，将无法正常安装python3.7的ss
centos7 安装python3.8运行导入ssl报错，亲测验证有效版一只勤奋爱思考的猪 ssl 网络协议网络
centos安装python3.7时遇到如下问题，查阅知需要的openssl版本最低为1.0.2，但是centos默认的为1.0.1，所以需要重新更新opensslimport_ssl#ifwecan'timportit,lettheerrorpropagateImportError:Nomodulenamed_ssl1、安装依赖库：yuminstall-yzlibzlib-devopenssl-
当区块链遇见AI：智能合约如何驱动下一代 DApps 威哥说编程人工智能区块链 ai
随着区块链技术和人工智能（AI）在各自领域的迅速发展，二者的结合逐渐成为了推动未来技术创新的重要力量。特别是在去中心化应用（DApps）领域，区块链与AI的结合有可能彻底改变我们对智能合约、数据处理、决策制定等方面的理解。智能合约（SmartContracts）作为区块链的核心组成部分，能够在无信任环境下自动执行合同条款。而AI则能赋予智能合约“自主学习”和“智能决策”的能力，使得DApps的功能
如何在本地电脑上安装和使用 DeepSeek R-1 知识大胖 NVIDIA GPU和大语言模型开发教程电脑
简介似乎每个人都在谈论DeepSeekR-1是中国人工智能公司DeepSeek开发的全新开源人工智能语言模型。一些用户声称，其推理能力与OpenAI的o1相当，甚至更好。目前，DeepSeek是免费使用的，这对用户来说是个好消息，但也带来了一些疑问。随着用户量的激增，他们如何管理服务器成本？硬件运行成本不可能便宜吧？这里最合乎逻辑的一点是——数据。数据是人工智能模型的命脉。他们可能以某种方式收集用
机器学习-期末复习题泡椒鸡jo 期末复习机器学习 python
给人脸打上标签再让模型进行学习训练的方法，属于()强化学习B.半监督学习C.监督学习D.无监督学习在机器学习中，用计算机处理一副图像，维度是：上万维B.二维C.三维D.一维‎以下关于降维的说法不正确的是？A.降维是将训练样本从高维空间转换到低维空间B.降维不会对数据产生损伤C.通过降维可以更有效地发掘有意义的数据结构D.降维将有助于实现数据可视化‍将原始数据进行集成、变换、维度规约、数值规约是在以
linux(CentOS 7)系统源码安装python3.6（ setuptools 和 pip ）牛奶可乐anmmm python setuptools pip linux
环境:linux(CentOS7)安装必备软件包：yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgdbm-develdb4-devellibpcap-develxz-develgccpython3.6安装源：下载地址：https://www.python.or
解决安装python3.7.4报错Can''t connect to HTTPS URL because the SSL module is not available 酷大有
升级openssl1.下载最新版opensslhttps://www.openssl.org/source/openssl-1.1.1d.tar.gz2.编译安装cdopenssl-1.1.1d./config--prefix=/usr/local/opensslno-zlib#不需要zlibmakemakeinstall3.备份原配置mv/usr/bin/openssl/usr/bin/open
【阿里云 centos7安装python3.12遇到的坑，openssl】Could not build the ssl module! Python requires a OpenSSL 1.1.1 sky-开发阿里云 ssl python
Couldnotbuildthesslmodule!基于源码安装python3.12，执行`make`出现如下错误openssl官网版本推荐安装openssl安装python基于源码安装python3.12，执行make出现如下错误_hashlib_ssl_tkinterTofindthenecessarybits,lookinconfigure.acandconfig.log.Couldnotb
python渗透开发之 sql注入SqlmapApi自动化扫描方式讲解单方法编写代码 SRC漏洞挖掘逻辑分析浩浩测试一下渗透测试开发 python pygame virtualenv plotly scikit-learn pyqt scipy
目录介绍安装和配置Sqlmap启动SqlmapAPI服务：使用API进行扫描(Python代码部分)SQLMAPAPI开发整体过程获取任务ID设置任务ID扫描信息开始扫描对应ID任务读取扫描状态判断结果扫描结果查看扫描结束删除ID并获取结果最后：介绍SQL注入的自动化扫描方式，可以通过使用Sqlmap提供的API来实现。SQLMAP是一个强大的开源自动化SQL注入工具，可以用于发现和利用SQL注入
智能化Kubernetes管理：AI与ChatGPT提升运维效率的创新实践大大宝的博客 k8s kubernetes 人工智能 chatgpt
摘要随着云计算技术的飞速发展，Kubernetes（K8s）已成为企业进行容器化应用管理的标准平台。然而，Kubernetes集群的管理在复杂度、规模和资源优化等方面仍然面临巨大挑战。传统的Kubernetes运维方式往往依赖手动操作，导致效率低下，且容易产生人为错误。随着人工智能（AI）技术的成熟，特别是基于自然语言处理（NLP）的智能体如ChatGPT的出现，AI智能体能够在Kubernete
解决Python Debug没有反应的问题小芋头的初码农 Python的Debug python 开发语言
应该有伙伴和我一样，用的2024版本的VScode，但是用到的python解释器是3.6.x，或者是更旧版本的Python.想要进行Debug就会在扩展里面安装一般安装就会安装最新版本，但是debug时又没有反应，其主要原因是Python的版本与PythonDebugger的版本不匹配（1）如果你的Python版本是3.7以上，则可以直接修改debug的版本先找到这个扩展：PythonDebugg
JavaScript中的隐式类型转换阿珊和她的猫 javascript 开发语言 ecmascript
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章
python兼容性问题_uibot中使用python扩展之兼容性问题 weixin_39654903 python兼容性问题
总结了一下，需要注意的两个点。关于python扩展文件语法以及其导入的第三方包版本问题在ub代码中引用python扩展时，需要确保引用的.py文件语法能够被ub内置的python识别，比如creator5.1.1版本内置的是python3.7，如果你是用python2的语法就会出现兼容问题同样的，当你使用的python扩展中导入了自行安装的第三方python包时，你需要确保该第三方扩展包对应的py
03-1.python爬虫-爬虫简介执着的小火车 python入门到项目实践爬虫 python http
03-1.python爬虫-爬虫简介简介Python爬虫是一种使用Python编程语言编写的程序，用于自动从互联网上获取网页数据。它可以模拟人类浏览器的行为，发送HTTP请求到目标网站，获取网页的HTML内容，然后通过解析HTML提取所需的数据，如文本、图片链接、表格数据等。爬虫的应用广泛，比如在数据挖掘领域，可收集大量数据用于分析趋势和模式；在信息聚合方面，能将不同网站的特定信息汇总到一处；还可
03-2.python爬虫-Python爬虫基础(一) 执着的小火车 python入门到项目实践爬虫 python 开发语言
HTTP基本原理HTTP（HyperTextTransferProtocol），即超文本传输协议，是互联网通信的关键所在。它作为应用层协议，构建于可靠的TCP协议之上，保障了数据传输的稳定与可靠，犹如网络世界的“交通规则”，规范着客户端与服务器之间的数据往来。HTTP的请求响应过程是其核心机制。当用户在浏览器中输入一个URL并按下回车键，浏览器就会作为客户端向服务器发送HTTP请求。请求由请求行、
python异常捕获字节全栈_PVK python java 数据库
④try…except…else…finally逻辑ʚʕ̯•͡˔•̯᷅ʔɞ个人简介欢迎各路大佬来到小啾主页指点☀️✨博客主页：云雀编程小窝꧔ꦿ꧔ꦿ点赞+关注+收藏✨☀️**感谢大家的支持：一起加油！共同进步！**①捕捉一个异常捕捉一个异常以用0作为除数会得到ZeroDivisionError异常为例，print(1/0)为例程序的持续执行，不因该异常而中止，遂对该异常进行处理，使异常时输出该异常内
【大模型应用开发动手做AI Agent】Plan and Solve策略的提出杭州大厂Java程序媛计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
【大模型应用开发动手做AIAgent】Plan-and-Solve策略的提出关键词：大模型，AIAgent，Plan-and-Solve，智能体，策略学习，强化学习，自然语言处理1.背景介绍随着人工智能技术的飞速发展，大模型（LargeLanguageModel，LLM）在自然语言处理（NaturalLanguageProcessing，NLP）领域取得了显著的突破。大模型能够理解和生成自然语言，
【机器学习】自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测加德霍克机器学习 paddlepaddle 逻辑回归 python 作业
一、使用paddlepaddle框架实现逻辑回归1.数据部分：首先自定义了一个简单的数据集，特征X是100个随机样本，每个样本一个特征，目标值y基于线性关系并添加了噪声。将numpy数转换为Paddlepaddle张量，方便后续在模型中使用。2.模型定义部分：方案1：使用nn.Sequential组网代码解释①数据生成与转换：生成自定义的特征矩阵X和目标值向量y，并添加高斯噪声模拟真实数据。使用p
L1-043 阅览室小何超会摆天梯赛练习集 c++团体程序设计天梯赛
天梯图书阅览室请你编写一个简单的图书借阅统计程序。当读者借书时，管理员输入书号并按下S键，程序开始计时；当读者还书时，管理员输入书号并按下E键，程序结束计时。书号为不超过1000的正整数。当管理员将0作为书号输入时，表示一天工作结束，你的程序应输出当天的读者借书次数和平均阅读时间。注意：由于线路偶尔会有故障，可能出现不完整的纪录，即只有S没有E，或者只有E没有S的纪录，系统应能自动忽略这种无效纪录
【python】【PyTorch】详细中文解释unsqueeze，代码和代码解读资源存储库笔记算法 python 开发语言
目录【python】【PyTorch】详细中文解释unsqueeze，代码和代码解读unsqueeze()函数的作用：语法：unsqueeze()操作示例：示例1：将一个一维张量转换为二维张量示例2：在最后一维插入一个新维度示例3：负索引插入维度示例4：将二维张量转为三维张量总结：【python】【PyTorch】详细中文解释unsqueeze，代码和代码解读在PyTorch中，unsqueeze
报错：python扩展中的调试器不再支持小于3.7的python版本（debugpy）宇宙计算机 python 开发语言
报错：python扩展中的调试器不再支持小于3.7的python版本原因1：debugpy的版本问题原因2原因1：debugpy的版本问题是debugpy和你vscode安装的python解释器不匹配，根据你使用的python解释器的版本重新安装一个debugpy。原因2你vscode安装的python解释器版本太低或太高。需要重新安装一下vscode的python解释器。可以参考下述帖子【VSC
集合的奇妙世界：Python集合的经典、避坑与实战李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程技巧案例学习干货满满
集合的奇妙世界：Python集合的经典、避坑与实战内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案
非线性动力学笔记C3.4叉型分岔阿北Ben 笔记数学建模
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言C3bifurcation3.3叉型分岔(pitchforkbifurcation)1.超临界叉型分岔标准型为：例3.4.1例3.4.22.次临界叉型分岔前言提示：这里可以添加本文要记录的大概内容：参考书《Nonlineardynamicsandchaos》StevenH.Strogatz本节重点Note第三章3.4叉型分
基于Micropython利用ESP32-C3墨水屏电子时钟方法嵌入式开发星球单片机项目实战操作之优秀驱动开发
本篇笔记介绍一下我们设计制作的墨水屏时钟。1、所需硬件1）合宙的ESP32-C3：2）电子价签拆出来的2.9寸墨水屏：——电子价签型号为：Stellar-L，墨水屏型号为：E029A01。3）自己设计的一块墨水屏驱动板：——这块PCB比较复杂了，贴片电容、电阻、二极管有20多个，再加上贴片AHT20和24P的FPC，焊接难度有点大࿰
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修