呆子不呆L

机器学习 —— 朴素贝叶斯

朴素贝叶斯

贝叶斯公式： P(A|B) = P(A) * P(B|A) / P(B)

一个例子，现分别有 A、B 两个容器，在容器 A 里分别有 7 个红球和 3 个白球，

在容器 B 里有 1 个红球和 9 个白球，现已知从这两个容器里任意抽出了一个球，

且是红球，问这个红球是来自容器 A 的概率是多少?

假设已经抽出红球为事件 B，选中容器 A 为事件 A，则有：

P(B) = 8/20，P(A) = 1/2，P(B|A) = 7/10，

按照公式，则有：

P(A|B) = (7/10)*(1/2) / (8/20) = 0.875

例如：一座别墅在过去的 20 年里一共发生过 2 次被盗，别墅的主人有一条狗，狗平均每周晚上叫 3 次

，在盗贼入侵时狗叫的概率被估计为 0.9，问题是：在狗叫的时候发生入侵的概率是多少？

我们假设 A 事件为狗在晚上叫，B 为盗贼入侵，则以天为单位统计，

P(A) = 3/7，P(B) = 2/(20*365) = 2/7300，P(A|B) = 0.9，

按照公式很容易得出结果：

P(B|A) = 0.9*(2/7300) / (3/7) = 0.00058

优点：

朴素贝叶斯模型发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率；
对小规模的数据表现很好；
对缺失数据不太敏感，算法也比较简单，常用于文本分类

缺点：

只能用于分类问题
需要计算先验概率;

一、朴素贝叶斯原理

朴素贝叶斯算法是一个典型的统计学习方法，主要理论基础就是一个贝叶斯公式，贝叶斯公式的基本定义如下：

这个公式虽然看上去简单，但它却能总结历史，预知未来：

公式的右边是总结历史
公式的左边是预知未来

如果把Y看成类别，X看成特征，P(Yk|X)就是在已知特征X的情况下求Yk类别的概率，而对P(Yk|X)的计算又全部转化到类别Yk的特征分布上来。

举个例子，大学的时候，某男生经常去图书室晚自习，发现他喜欢的那个女生也常去那个自习室，心中窃喜，于是每天买点好吃的在那个自习室蹲点等她来，可是人家女生不一定每天都来，眼看天气渐渐炎热，图书馆又不开空调，如果那个女生没有去自修室，该男生也就不去，每次男生鼓足勇气说：“嘿，你明天还来不？”,“啊，不知道，看情况”。

然后该男生每天就把她去自习室与否以及一些其他情况做一下记录，用Y表示该女生是否去自习室，即Y={去，不去}，X是跟去自修室有关联的一系列条件，比如当天上了哪门主课，蹲点统计了一段时间后，该男生打算今天不再蹲点，而是先预测一下她会不会去，现在已经知道了今天上了常微分方程(Y=去|常微分方程)与P(Y=不去|常微分方程)，看哪个概率大，如果P(Y=去|常微分方程) >P(Y=不去|常微分方程)，那这个男生不管多热都屁颠屁颠去自习室了，否则不就去自习室受罪了。P(Y=去|常微分方程)的计算可以转为计算以前她去的情况下，那天主课是常微分的概率P(常微分方程|Y=去)，注意公式右边的分母对每个类别（去/不去）都是一样的，所以计算的时候忽略掉分母，这样虽然得到的概率值已经不再是0~1之间，但是通过比较大小还是能选择类别。

后来他发现还有一些其他条件可以挖，比如当天星期几、当天的天气，以及上一次与她在自修室的气氛，统计了一段时间后，该男子一计算，发现不好算了，因为总结历史的公式：

这里n=4，x(1)表示主课，x(2)表示天气，x(3)表示星期几，x(4)表示气氛，Y仍然是{去，不去}，现在主课有8门，天气有晴、雨、阴三种、气氛有A+,A,B+,B，C五种，那么总共需要估计的参数有8×3×7×5×2=1680个，每天只能收集到一条数据，那么等凑齐1680条数据，大学都毕业了，男生大呼不妙，于是做了一个独立性假设，假设这些影响她去自习室的原因是独立互不相关的，于是：

有了这个独立假设后，需要估计的参数就变为，(8+3+7+5)×2 = 46个了，而且每天收集的一条数据，可以提供4个参数，这样该男生就预测越来越准了。

朴素的概念：独立性假设，假设各个特征之间是独立不相关的。

import numpy as np
import pandas as pd


from sklearn.datasets import load_iris


data,target = load_iris(return_X_y=True)
pd.DataFrame(data).head()

朴素贝叶斯分类器

讲了上面的小故事，我们来朴素贝叶斯分类器的表示形式：

当特征为为x时，计算所有类别的条件概率，选取条件概率最大的类别作为待分类的类别。由于上公式的分母对每个类别都是一样的，因此计算时可以不考虑分母，即

朴素贝叶斯的朴素体现在其对各个条件的独立性假设上，加上独立假设后，大大减少了参数假设空间。

在文本分类上的应用

文本分类的应用很多，比如垃圾邮件和垃圾短信的过滤就是一个2分类问题，新闻分类、文本情感分析等都可以看成是文本分类问题，分类问题由两步组成：训练和预测，要建立一个分类模型，至少需要有一个训练数据集。贝叶斯模型可以很自然地应用到文本分类上：现在有一篇文档d（Document），判断它属于哪个类别ck，只需要计算文档d属于哪一个类别的概率最大：

在分类问题中，我们并不是把所有的特征都用上，对一篇文档d，我们只用其中的部分特征词项t1,t2,...,tnd（nd表示d中的总词条数目），因为很多词项对分类是没有价值的，比如一些停用词“的,是,在”在每个类别中都会出现，这个词项还会模糊分类的决策面，关于特征词的选取，我的这篇文章有介绍。用特征词项表示文档后，计算文档d的类别转化为：

注意P(Ck|d)只是正比于后面那部分公式，完整的计算还有一个分母，但我们前面讨论了，对每个类别而已分母都是一样的，于是在我们只需要计算分子就能够进行分类了。实际的计算过程中，多个概率值P(tj|ck)的连乘很容易下溢出为0，因此转化为对数计算，连乘就变成了累加：

我们只需要从训练数据集中，计算 每一个类别的出现概率P(ck) 和 **每一个类别中各个特征词项的概率P(tj|ck)**，而这些概率值的计算都采用最大似然估计，

说到底就是统计每个词在各个类别中出现的次数和各个类别的文档的数目：

# 每一个类别的出现概率P(ck) 和 每一个类别中各个特征词项的概率P(tj|ck)

# 每一个类别的出现概率P(ck) 
#   Nck : 在训练集中，每个类别的数量
#   N； 类别的总数量

# 每一个类别中各个特征词项的概率P(tj|ck)
#   Tjk : 每个特征词项数量
#   ETjk: 所有特征词项的总数

二、3种贝叶斯模型

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline


# naive_bayes: 朴素贝叶斯
from sklearn.naive_bayes import GaussianNB, MultinomialNB, BernoulliNB

1、高斯分布朴素贝叶斯

高斯分布就是正态分布
【用途】用于一般分类问题
一般处理连续的特征值，会对每个特征都做高斯分布的假设

使用自带的鸢尾花数据

data,target = load_iris(return_X_y=True)

target
'''
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
'''


# 去两列数据，方便画图
data2 = data[:,2:].copy()

使用高斯分布贝叶斯模型

gs_nb = GaussianNB()
gs_nb.fit(data2,target)


gs_nb.score(data2,target)
# 0.96

画边界图

def get_XY(data):
    x = np.linspace(data[:,0].min(),data[:,0].max(),1000)
    y = np.linspace(data[:,1].min(),data[:,1].max(),1000)
    X, Y = np.meshgrid(x,y)
    XY = np.c_[X.ravel(),Y.ravel()]
    return X,Y,XY


X,Y,XY = get_XY(data2)


# 预测
y_pred = gs_nb.predict(XY)


plt.pcolormesh(X,Y,y_pred.reshape(1000,1000))

plt.scatter(data2[:,0],data2[:,1],c=target,cmap='rainbow')

2、多项式分布朴素贝叶斯

【用途】适用于文本数据（特征表示的是次数，例如某个词语的出现次数）
当特征值是离散时，可以使用多项式分布

例：延续上面，使用鸢尾花数据

mu_nb = MultinomialNB()
mu_nb.fit(data2,target)


mu_nb.score(data2,target)
# 0.7933333333333333


# 预测
y_pred = mu_nb.predict(XY)


plt.pcolormesh(X,Y,y_pred.reshape(1000,1000))

plt.scatter(data2[:,0],data2[:,1],c=target,cmap='rainbow')

3、伯努利分布朴素贝叶斯

当特征值是离散时，可以使用多项式分布
【用途】适用于伯努利分布，也适用于文本数据（此时特征表示的是是否出现，例如某个词语的出现为1，不出现为0）
绝大多数情况下表现不如多项式分布，但有的时候伯努利分布表现得要比多项式分布要好，尤其是对于小数量级的文本数据
和多项式分布差不多的，主要区别是伯努利是二分类
主要处理离散型数据。

例：继续使用鸢尾花数据集

be_nb = BernoulliNB()
be_nb.fit(data2,target)


be_nb.score(data2,target)
# 0.3333333333333333


y_pred = be_nb.predict(XY)


plt.pcolormesh(X,Y,y_pred.reshape(1000,1000))

plt.scatter(data2[:,0],data2[:,1],c=target,cmap='rainbow')

三、文本分类实战

对短信进行二分类，数据为SMSSpamCollection

# 判断短信是否为垃圾短信
# ham：正常短信
# spam：垃圾短信

sms = pd.read_table('../data/SMSSpamCollection',header=None)
sms.head()

sms.shape
# (5572, 2)

# target
target = sms[0].copy()

target.unique()
# array(['ham', 'spam'], dtype=object)

# data
data = sms[1].copy()
data[0]
# 'Go until jurong point, crazy.. Available only in bugis n great world la e buffet... Cine there got amore wat...'

提取特征

导入 sklearn.feature_extraction.text.TfidfVectorizer 用于转换字符串

# feature_extraction ：特征提取
# TfidfVectorizer : 特征词向量化
from sklearn.feature_extraction.text import TfidfVectorizer


tf = TfidfVectorizer()
tf.fit(data)

tf.fit(data) ：训练

tf.transform(data)

参数必须是字符串的一维数组（比如列表或者Series）
返回的是一个稀疏矩阵类型的对象，行数为样本数，列数为所有出现的单词统计个数。

toarray()

得到数组

# transform : 转换  稀疏矩阵  sparse matrix
# tf.transform(data)
'''
<5572x8713 sparse matrix of type ''
	with 74169 stored elements in Compressed Sparse Row format>
'''

tf_data = tf.transform(data).toarray()
tf_data
'''
array([[0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.]])
'''


tf_data.sum()
# 18225.670694974182


tf_data.shape
# (5572, 8713)

高斯分布贝叶斯

gs_nb = GaussianNB()
gs_nb.fit(tf_data,target)


gs_nb.score(tf_data,target)
# 0.9414931801866475

多项式分布贝叶斯

mu_nb = MultinomialNB()
mu_nb.fit(tf_data,target)


mu_nb.score(tf_data,target)
# 0.9761306532663316

伯努利分布贝叶斯

be_nb = BernoulliNB()
be_nb.fit(tf_data,target)


be_nb.score(tf_data,target)
# 0.9881550610193827

预测数据，使用tf.transform(['xx'])进行转换生成测试数据

# 提供几条短信
msg = [
    "hello world how are you",
    "Free lunch, pleace call 08002986030 £5 9am-11pm as a £1000 or £5000 prize",
    "qianfeng encoding utf8",
    "Please call our on  0808 145 4742  9am-11pm as a £1000 or £5000 prize!"
]


# 不能重新训练
# tf2 = TfidfVectorizer()
# tf2.fit(msg)
# tf2.transform(msg)
'''
<4x26 sparse matrix of type ''
	with 34 stored elements in Compressed Sparse Row format>
'''

# 要使用之前训练好的 tf 对象
tf_data2 = tf.transform(msg).toarray()
tf_data2
'''
array([[0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.]])
'''


# 高斯分布贝叶斯
gs_nb.predict(tf_data2)
# array(['spam', 'spam', 'spam', 'spam'], dtype='


    
        你可能感兴趣的:(机器学习,人工智能)
        
            
                
                    机器学习与深度学习间关系与区别
                        ℒℴѵℯ心·动ꦿ໊ོ꫞
人工智能学习深度学习python
                        一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
                    
                    探索OpenAI和LangChain的适配器集成：轻松切换模型提供商
                        nseejrukjhad
langchaineasyui前端python
                        #探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
                    
                    深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具
                        nseejrukjhad
数据库python
                        深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
                    
                    人工智能时代，程序员如何保持核心竞争力？
                        jmoych
人工智能
                        随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
                    
                    数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首
                        张三叨

                        你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
                    
                    nosql数据库技术与应用知识点
                        皆过客，揽星河
NoSQLnosql数据库大数据数据分析数据结构非关系型数据库
                        Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
                    
                    Python开发常用的三方模块如下：
                        换个网名有点难
python开发语言
                        Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
                    
                    Python实现简单的机器学习算法
                        master_chenchengg
pythonpython办公效率python开发IT
                        Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
                    
                    遥感影像的切片处理
                        sand&wich
计算机视觉python图像处理
                        在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
                    
                    人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么
                        kkai人工智能
chatgpt人工智能
                        一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
                    
                    AI大模型的架构演进与最新发展
                        季风泯灭的季节
AI大模型应用技术二人工智能架构
                        随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
                    
                    如何利用大数据与AI技术革新相亲交友体验
                        h17711347205
回归算法安全系统架构交友小程序
                        在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
                    
                    ai绘画工具midjourney怎么下载？附作品管理教程
                        设计师早上好

                        Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
                    
                    [实践应用] 深度学习之模型性能评估指标
                        YuanDaima2048
深度学习工具使用深度学习人工智能损失函数性能评估pytorchpython机器学习
                        文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
                    
                    机器学习-聚类算法
                        不良人龍木木
机器学习机器学习算法聚类
                        机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
                    
                    生成式地图制图
                        Bwywb_3
深度学习机器学习深度学习生成对抗网络
                        生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
                    
                    【大模型应用开发 动手做AI Agent】第一轮行动：工具执行搜索
                        AI大模型应用之禅
计算科学神经计算深度学习神经网络大数据人工智能大型语言模型AIAGILLMJavaPython架构设计AgentRPA
                        【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
                    
                    未来软件市场是怎么样的？做开发的生存空间如何？
                        cesske
软件需求
                        目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
                    
                    个人学习笔记7-6：动手学深度学习pytorch版-李沐
                        浪子L
深度学习深度学习笔记计算机视觉python人工智能神经网络pytorch
                        #人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
                    
                    Rust 所有权 简介
                        东离与糖宝
rust后端rust开发语言
                        文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
                    
                    python中zeros用法_Python中的numpy.zeros()用法
                        江平舟
python中zeros用法
                        numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
                    
                    【NumPy】深入解析numpy.zeros()函数
                        二七830
numpy
                        欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
                    
                    【中国国际航空-注册_登录安全分析报告】
                        风控牛
验证码接口安全评测系列安全行为验证极验网易易盾智能手机
                        前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
                    
                    机器学习 流形数据降维：UMAP 降维算法
                        小嗷犬
Python机器学习#数据分析及可视化机器学习算法人工智能
                        ✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
                    
                    七.正则化
                        愿风去了

                        吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
                    
                    机器学习-------数据标准化
                        罔闻_spider
数据分析算法机器学习人工智能
                        什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
                    
                    分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT)
                        计算机源码社
Python项目大数据大数据pythonhadoop计算机毕业设计选题计算机毕业设计源码数据分析spark毕设
                        作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
                    
                    如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案
                        伽马有话说

                        赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
                    
                    软件测试/测试开发/全日制 |利用Django REST framework构建微服务
                        霍格沃兹-慕漓
django微服务sqlite
                        霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
                    
                    cmd泛滥_与您的后泛滥同事见面：人工智能机器人
                        weixin_26644585
人工智能leetcode
                        cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
                    
                                ztree异步加载
                                    3213213333332132
JavaScriptAjaxjsonWebztree
                                    相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。 
我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。 
 
设置setting，这里只关注async属性的配置 
 

            var setting = {
            	//异步加载配置	
      
                                
                                thirft rpc 具体调用流程
                                    BlueSkator
中间件rpcthrift
                                    Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作： 
        （1）     将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
                                
                                异或运算推导, 交换数据
                                    dcj3sjt126com
PHP异或^
                                    /*
 * 5 0101
 * 9 1010
 *
 * 5 ^ 5
 * 0101
 * 0101
 * -----
 * 0000
 * 得出第一个规律: 相同的数进行异或, 结果是0
 *
 * 9 ^ 5 ^ 6
 * 1010
 * 0101
 * ----
 * 1111
 *
 * 1111
 * 0110
 * ----
 * 1001
 
                                
                                事件源对象
                                    周华华
JavaScript
                                    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml&q
                                
                                MySql配置及相关命令
                                    g21121
mysql
                                            MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。 
  
        一 修改MySQL密码及用户 
     
                                
                                [简单]poi删除excel 2007超链接
                                    53873039oycg
Excel
                                          采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: 
     
public void removeExcel2007AllHyperLink(String filePath) throws Exception {
		OPCPackage ocPkg = OPCPac
                                
                                Struts2添加 open flash chart
                                    云端月影

                                    准备以下开源项目： 
1. Struts 2.1.6 
2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 
3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 
4. log4j 
 
用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
                                
                                spring包详解
                                    aijuans
spring
                                      
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
                                
                                网站推广之seo概念
                                    antonyup_2006
算法Web应用服务器搜索引擎Google
                                       持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。 
    所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。 
    网站推广策略有很多，seo，email，adv
                                
                                单例模式,sql注入,序列
                                    百合不是茶
单例模式序列sql注入预编译
                                      
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时 需要使用序列创建一个自增长的字段  居然不会了,所以将序列写在本篇的前面 
  
 1,序列是一个保存数据连续的增长的一种方式; 
序列的创建; 
 CREATE SEQUENCE seq_pro
  2  INCREMENT BY 1 -- 每次加几个
  3 
                                
                                Mockito单元测试实例
                                    bijian1013
单元测试mockito
                                    Mockito单元测试实例： 
public class SettingServiceTest {
    
    private List<PersonDTO> personList = new ArrayList<PersonDTO>();
    
    @InjectMocks
    private SettingPojoService settin
                                
                                精通Oracle10编程SQL(9)使用游标
                                    bijian1013
oracle数据库plsql
                                    /*
 *使用游标
 */
--显示游标
--在显式游标中使用FETCH...INTO语句
DECLARE
   CURSOR emp_cursor is 
      select ename,sal from emp where deptno=1;
   v_ename emp.ename%TYPE;
   v_sal emp.sal%TYPE;
begin
   ope
                                
                                【Java语言】动态代理
                                    bit1129
java语言
                                      JDK接口动态代理 
JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 
  
package com.tom;

import com.tom.model.User;
import com.tom.service.IUserService;

                                
                                Java通信之URL通信基础
                                    白糖_
javajdkwebservice网络协议ITeye
                                    java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。 
在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。 
学习准备：建议首先学习java的IO基础知识 
  
URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
                                
                                博弈Java讲义 - Java线程同步 (1)
                                    boyitech
java多线程同步锁
                                      
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。 
   同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
                                
                                java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。
                                    bylijinnan
java
                                    

public class DeleteExtraSpace {

	/**
	 * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。
	 * 方法1.用已有的String类的trim和replaceAll方法
	 * 方法2.全部用正则表达式，这个我不熟
	 * 方法3.“重新发明轮子”，从头遍历一次
	 */
	public static v
                                
                                An error has occurred.See the log file错误解决！
                                    Kai_Ge
MyEclipse
                                    今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！ 
很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！ 
打开日志文件！找到当日错误文件内容： 
--------------------------------------------------------------------------
                                
                                [矿业与工业]修建一个空间矿床开采站要多少钱?
                                    comsci

                                     
       地球上的钛金属矿藏已经接近枯竭........... 
 
       我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 
 
       那么,现在要编制一个预算,提交给财政部门..
                                
                                解析Google Map Routes
                                    dai_lm
google api
                                    为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 
[url] 
http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false 
[/url] 
从返回的结果上，大致可以了解应该怎么走，但
                                
                                SQL还有多少“理所应当”？
                                    datamachine
sql
                                    转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ 
 
------------------------------------华丽的分割线-------------------------------- 

                                
                                Yii使用Ajax验证时，如何设置某些字段不需要验证
                                    dcj3sjt126com
Ajaxyii
                                    经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: 
$form=$this->beginWidget('CActiveForm', array(        'id'=>'usuario-form',&
                                
                                使用git同步网站代码
                                    dcj3sjt126com
crontabgit
                                    转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 
  
管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
                                
                                sql基本操作
                                    蕃薯耀
sqlsql基本操作sql常用操作
                                    sql基本操作 
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 
蕃薯耀 2015年6月1日 17:30:33 星期一 
  
  
&
                                
                                Spring4+Hibernate4+Atomikos3.3多数据源事务管理
                                    hanqunfeng
Hibernate4
                                    Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/   一.pom.xml 
<dependency>
			<
                                
                                jquery中两个值得注意的方法one()和trigger()方法
                                    jackyrong
trigger
                                      在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 
 
 
1） one方法 
    one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 
   one(type,${data},fn) 
&nb
                                
                                拿工资不仅仅是让你写代码的
                                    lampcy
工作面试咨询
                                    这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。 
这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。 
话粗理不粗。 
付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
                                
                                架构师之对象操作----------对象的效率复制和判断是否全为空
                                    nannan408
架构师
                                    1.前言。 
  如题。 
2.代码。 
 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier 
 

Src src=new Src();
BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
      
                                
                                ajax 被缓存的解决方案
                                    Rainbow702
JavaScriptjqueryAjaxcache缓存
                                    使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。 
今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。 
解决方法如下： 
① 直接使用 JQuery提供的 “cache”参数，
                                
                                修改date.toLocaleString()的警告
                                    tntxia
String
                                      
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时 的API，代替的方法如下： 
  
package com.tntxia.htmlmaker.util;

import java.text.SimpleDateFormat;
import java.util.
                                
                                项目完成后的小总结
                                    xiaomiya
js总结项目
                                    项目完成了，突然想做个总结但是有点无从下手了。 
做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。 
先说说项目主要实现的功能吧 
1，按键精灵 
2，获取行情数据 
3，各种input输入条件判断 
4，发送数据（有json格式和string格式） 
5，获取预警条件列表和预警结果列表， 
6，排序， 
7，预警结果分页获取 
8，导出文件（excel，text等） 
9，修
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.