oldmao_2000

李宏毅学习笔记4.分类Classification: Probabilistic Generative Model

文章目录

分类的概念与应用
教学案例
- 问题描述
- - 宝可梦的数字化
  - 问题的重要性
  - 如何解决这个问题？
  - - 插曲：能否使用回归的问题来解决分类问题？
    - - 二分类的讨论
      - 多分类的情况
- 问题的新描述
Probabilistic Generative Model
- 概率与分类的关系
- 第一步
- 第二步
- - 补充知识：高斯分布
  - 从79个样本推算出他们的高斯分布
  - - 推算新样本点来自高斯分布的概率
    - 如何找到均值和协方差矩阵（最大似然 maximum likelihood）
    - 最大似然的数学表示及解法
  - 第二步的计算结果
- 开始分类
- 分类结果
Probabilistic Generative Model的改进
- 模型改进
- 改进结果
Probabilistic Generative Model的回顾
- 为什么选高斯分布
Posterior Probalility（后验概率）
- z的推导
坑

课程标题：Classification: Probabilistic Generative Model
主要内容是分类，概率生成模型，下一课还有逻辑回归分类模型

分类的概念与应用

注意这里的类别可以为n种，老师先给出一些分类问题在实际生活中的应用：

信用贷款判定：找一个function，它的input是某一个人的收入，存款，工作（是否公务员），年纪，过去有没有欠债等等。output就是要不要贷款给他。这是个binary classification的问题。

医疗诊断： input是症状，年龄，性别，过去就医历史等。output是他生的哪种病。这是一个多分类问题。

手写输入识别：输入和输出见图例，老师特别提到中文识别比英文识别要复杂。

教学案例

再次祭出杀手锏：宝可梦

宝可梦的属性包括：水、火、电、草、毒等等18种属性（没玩过宝可梦，可以参照上面的英文）。

问题描述

现在要做一个分类的问题。这个分类的问题就是要找一个function，
input就是某一只宝可梦，
output就是告诉你这只宝可梦是属于哪一种type的。
比如，input一只皮卡丘，他的output就是雷。input一只杰尼龟，output就是水。input一个妙蛙草，他的output就是草。所以是一个classification的问题。

宝可梦的数字化

现在第一个问题就是怎么把一个宝可梦当做一个function的input。要当做input得数值化。要用数字来表示一个宝可梦，才能把它放到一个function里面。那怎么把一只宝可梦用数字来表示呢？一只宝可梦其实有很多的特性。这些特性是可以数字化的，比如他整体的强度。

当然还有很多其他特性：

例如：一只皮卡丘，他的总体强度是320，HP为35，攻击力为55，防御力为40，特殊攻击力为50，特殊防御力为50，速度为90。也就是一只皮卡丘可以用一个7维的向量来表示。

问题的重要性

以上是18×18的属性相克表（因为宝可梦有18种属性），竖下来右边红色表示攻击方，横着上方蓝色代表防御方，例如：左边第二行格斗系对上第一列一般系，会有2X倍的攻击加成。
本问题的重要性在于，当游戏过程中对方给出图鉴中没有见过的宝可梦，此时我们可以用本function预测对方宝可梦的属性，并派出相克属性的宝可梦迎战！！！

如何解决这个问题？

1、收集数据（宝可梦的属性）

数据就是带标记的数据对，输入皮卡丘，输出就是电。。。
2、

插曲：能否使用回归的问题来解决分类问题？

二分类的讨论

在train的过程中，target就是 $\hat y$

绿色的线就是 $b+w_1x_1+w_2x_2=0$ ，以上是理想状态的分布，此时回归方法可以很好的解决分类问题，但是如果class 1的分布如下图所示：

以绿色线为界，左上角的值是小于0，右下的值是大于0，而且离得越远值越大，在regression算法中，会倾向于使得class1的输出值越接近1越好，因此，用regression算法来对上图进行train的话，得到结果会不会是绿色，而是紫色线，因为对于紫色线而言，右下角的样本输出值没有这么大。

因此结论是：regression会惩罚那些太正确的值，反而得到结论不是很好。

多分类的情况

做法：

这样定义的时候默认class 1与class 2有某种关系（数字1和2，差为1），class 2与class 3有某种关系（数字2和3，差为1），如果他们之间不存在这些关系，那么在train的时候就会出问题。

问题的新描述

损失函数是输出和标记（label）不同的次数之和，这个函数是无法微分的。学过的梯度下降无法解决这个问题，解决方案有：感知机、支持向量机，但今天会用概率的方式解决这个问题。

Probabilistic Generative Model

概率与分类的关系

老师用盒子中抽球的例子与分类问题进行类比

从box1抽球的几率是2/3，从box2抽球的几率是1/3.每个盒子里面蓝色和绿色球抽取的概念如↑图所示。则抽取蓝色球，该蓝色球是从box1抽取的概率是多少？
把盒子换成分类问题：
图中x可以看成某个宝可梦，最后的 $P(C_1|x)$ 表示这只宝可梦属于Class1类别的几率。

要计算 $P(C_1|x)$ ，则需要从训练数据集总找到上图中红色框中的四个东西。这套思路称为：Generative Model（有关生成模型概念看这里，当然还有判别模型）

也就是最终得到x的分布。

第一步

先算 $P(C_1)$ （这里是指水系宝可梦）和 $P(C_2)$ （这里是指一般系的宝可梦）
PS：老师解释水系和一般系的宝可梦数量较多，所以选这两种进行分类

训练集数据取前400只宝可梦，在训练集中，水系和一般系宝可梦数量如上图， $P(C_1)$ 和 $P(C_2)$ 就可以算出来了

第二步

如何知道一个宝可梦（例如一只海龟）属于水系的概率是多少？实际上是要根据这个宝可梦的数据（向量也就是它的特征）来判断。

这里只列出两个特征（特殊防御和防御值），需要预测的是橙色点，即海龟来自水系宝贝的概率是多少。
**错误思想：**由于海龟从未在水系宝可梦数据集中出现，所以海龟来自水系宝贝的概率为0！
正确思想：所有水系宝贝的特殊防御和防御值都来自一个高斯分布（Gaussian distribution），上面那些蓝色的点只不过是从这个高斯分布中取样（sample）出来的，取样了79个点之后，变成下面这个样子

则从高斯分布中取样到橙色点的概率不会是0~！

补充知识：高斯分布

整个高斯分布可以想象成一个函数
输入x是某一个宝可梦的特征，输出是从分布中sample到这个宝可梦的几率（准确的说法应该是概率密度probability density）
高斯分布由均值 $\mu$ 和协方差矩阵 $\Sigma$ 决定


以上是相同的方差，不同的均值，以及相同均值，不同的方差高斯分布的不同形态。

从79个样本推算出他们的高斯分布

就是用79个样本计算均值和协方差矩阵

计算出的结果可以得到一个高斯分布的方程：

推算新样本点来自高斯分布的概率

定性来看，新样本点距离高斯分布中心越远，概率越小，反之概率越大

如何找到均值和协方差矩阵（最大似然 maximum likelihood）

79个样本可以从不同均值和协方差矩阵的高斯分布（任意）中sample出来，例如：

但是从不同高斯分布sample出这些点的似然性不一样，上图中明显从圆形高斯分布sample出79个样本的likelihood要比右上角的椭圆高斯分布大！
思想：因此我们可以计算不同高斯分布对79个样本的likelihood，然后取最大值，就找到了最大似然高斯分布。
说明：下式中的L表示的是likelihood，不是损失函数的那个Loss。

某高斯分布sample出第一个点的几率 * sample出第二个点的几率。。。。*sample出第79个点的几率
最后找到的最大似然高斯分布，我们把它的两个参数记为

最大似然的数学表示及解法

数学表示如下：

求最小值就是求导后取0值处就是极值的位置，推导过程可以参考别的资料，例如李航的《统计学习方法》
下面直接给结果：

第二步的计算结果

开始分类

至此，四个红色框的参数已算出来，带入公式即可得到分类结果

分类结果

图中坐标轴分别是防御力和特殊防御力，每一个点都代表x属于 $C_1$ 的几率，红色属于一般系的概率大，蓝色属于水系的概率大

上图是training set的结果，把该结果应用到testing set上

准确率为47%，当然这里只考虑了2个特征
如果考虑7个特征：

准确率提高到54%。。。然后老师开始挖坑，说下次改进

Probabilistic Generative Model的改进

思想：不同的分类使用相同的协方差矩阵，这样可以使得模型参数减少，防止过拟合。（参数越多，模型越复杂，越容易过拟合）

模型改进

根据上面的改进思想重新设置下面的参数：

如何计算上图中的三个参数的最大似然呢？

注意公式中的 $Σ$ 没有下标。 $μ^1$ 和 $μ^2$ 的计算公式还是和前面一样，求各自类别的样本的均值。

改进结果

可以看到边界变成线性的了，考虑7个特征后准确率也提高了

Probabilistic Generative Model的回顾

老师在概述的时候就提到过，ML其实就是三个步骤，现在就把这个model对应到这三个步骤中去：

为什么选高斯分布

可以根据喜好来选几率模型，当然几率模型简单，参数比较少，偏差bias大，方差variance就小，复杂的模型反之。
如果特征向量中每一个特征都是独立的话：则每个特征都对应的1维高斯分布，这样训练出来的结果很差

因此：考虑特征之间的相互关系是很有必要的

Posterior Probalility（后验概率）

分子分母同除以分子

然后假设
上面的式子就变成：

z的推导

Warning of Math

其中
$N_1$ 代表class1在train set中出现的次数； $N_2$ 代表class2在train set中出现的次数。所以上面等于：
$N_1/N_2$
下面两项是两个高斯分布：

可以变成

红色部分和分布无关可以消掉，绿色框里面东西提出来，后面exp相除变成相减，且ln和exp可以消掉。

分别取对数后变成下面

展开其中一部分如下：

蓝色部分合并，另外一部分也展开

整理后：

在前面的模型改进部分有说过两个类都是共用一个 $Σ$ ，即：
$Σ^1=Σ^2=Σ$
利用这个条件简化上面的公式：

把里面两项有x的弄到一起，与x无关的放到一起：

注意：x前面的是矩阵，后面b的是向量
这里讲了为什么讲这小节由于设置了 $Σ^1=Σ^2=Σ$ 这个条件，所以z是线性方程，所以分界线是直线。

坑

最后老师给出一个坑

既然搞来搞去，最后变成了线性方程形式，为什么不能直接找线性方程的两个参数 $w, b$ ？这个时候如果直接计算w和b会怎么样？
下节课填这个坑：Logistic Regression

李宏毅机器学习笔记——反向传播算法小陈phd 机器学习机器学习算法神经网络
反向传播算法反向传播（Backpropagation）是一种用于训练人工神经网络的算法，它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数，从而最小化损失函数。反向传播是深度学习中最重要的算法之一，通常与梯度下降等优化算法结合使用。反向传播的基本原理反向传播的核心思想是利用链式法则（ChainRule）来高效地计算损失函数相对于每个参数的梯度。以下是反向传播的基本步骤：前向传播（Forwa
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
2023春季李宏毅机器学习笔记 02 ：机器学习基本概念女王の专属领地机器学习深度学习 #李宏毅2023机器学习机器学习笔记人工智能
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、機器學習基
2023春季李宏毅机器学习笔记 03 ：机器如何生成文句女王の专属领地 #李宏毅2023机器学习机器学习深度学习笔记机器学习人工智能深度学习
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、大语言模型
Chat GPT4来了，它和3.5区别在哪？李宏毅机器学习笔记抱抱小杠杠机器学习人工智能笔记
听说GPT4模型更大、参数更多，功能更强，具体它好在哪里？GPT4真的能看懂图片吗？官方回答：不太能~~下面这张图片是将两个不存在的网址输入进GPT4，问它看到了什么，结果发现GPT真的会胡言乱语，它会根据网址中出现了“man”这个单词，就说他看到了“一个拿着手枪的男人。。。巴拉巴拉”明显就是在胡编乱造！而如果网址中出现了“girl”这个单词，GPT又会说他看到了“一个穿着校服的女孩子。。。巴拉巴
2023春季李宏毅机器学习笔记 05 ：机器如何生成图像女王の专属领地 #李宏毅2023机器学习机器学习笔记人工智能机器学习李宏毅 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、图像生成常
2023春季李宏毅机器学习笔记01 ：正确认识 ChatGPT 女王の专属领地深度学习机器学习机器学习李宏毅人工智能 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、对Chat
【23-24 秋学期】NNDL 作业11 LSTM HBU_David lstm 机器学习人工智能
习题6-4推导LSTM网络中参数的梯度，并分析其避免梯度消失的效果习题6-3P编程实现下图LSTM运行过程李宏毅机器学习笔记：RNN循环神经网络_李宏毅rnn笔记_ZEERO~的博客-CSDN博客https://blog.csdn.net/weixin_43249038/article/details/132650998L5W1作业1手把手实现循环神经网络-CSDN博客https://blog.c
李宏毅老师机器学习课程笔记_ML Lecture 1: ML Lecture 1: Regression - Demo leogoforit
引言：最近开始学习“机器学习”，早就听说祖国宝岛的李宏毅老师的大名，一直没有时间看他的系列课程。今天听了一课，感觉非常棒，通俗易懂，而又能够抓住重点，中间还能加上一些很有趣的例子加深学生的印象。视频链接（bilibili）：李宏毅机器学习(2017)另外已经有有心的同学做了速记并更新在github上：李宏毅机器学习笔记(LeeML-Notes)所以，接下来我的笔记只记录一些我自己的总结和听课当时的
李宏毅机器学习笔记.Flow-based Generative Model(补) oldmao_2000 李宏毅机器学习笔记机器学习笔记人工智能
文章目录引子生成问题回顾：GeneratorMathBackgroundJacobianMatrixDeterminant行列式ChangeofVariableTheorem简单实例一维实例二维实例网络G的限制基于Flow的网络构架G的训练CouplingLayerCouplingLayer反函数计算CouplingLayerJacobian矩阵计算CouplingLayerStacking1×1
李宏毅机器学习笔记-transformer ZEERO~ 深度学习机器学习笔记 transformer 深度学习
transformer是什么呢？是一个seq2seq的model。具体应用如上图所示，输入和输出的序列长度不固定，由model自己决定。语音翻译指的是，直接输入一段语音信号，例如英文，输出的直接是翻译之后的中文。seq2seq如今已经是一个应用非常广泛的模型，可以应用于NLP的各种任务，如语义分析，语义分类，聊天机器人等。另外还有个值得说明的功能是做multilabelclassification
李宏毅机器学习笔记-半监督学习 ZEERO~ 深度学习机器学习笔记学习
半监督学习，一般应用于少量带标签的数据（数量R）和大量未带标签数据的场景（数量U），一般来说，U>>R。半监督学习一般可以分为2种情况，一种是transductivelearning，这种情况下，将unlabeleddata的feature利用进来。另外一种是inductivelearning，这种情况下，在训练的整个过程中，完全不看任何unlabeleddata的信息。为什么要做semi-sup
李宏毅机器学习笔记第7周_局部最小值与鞍点 MoxiMoses 机器学习深度学习
文章目录一、OptimizationFailsbecause……二、TaylerSeriesApproximation三、Example总结一、OptimizationFailsbecause……1．问题：我们在做optimization的时候会发现，随着参数的不断更新，training的loss不会再下降，但是我们对loss并不满意。因此我们会发现，一开始model就train不起来，不管我们怎
李宏毅机器学习笔记：RNN循环神经网络 ZEERO~ 深度学习机器学习机器学习笔记 rnn
RNN一、RNN1、场景引入2、如何将一个单词表示成一个向量3种典型的RNN网络结构二、LSTMLSTM和普通NN、RNN区别三、LSTM的训练一、RNN1、场景引入例如情景补充的情况，根据词汇预测该词汇所属的类别。这个时候的Taipi则属于目的地。但是，在订票系统中，Taipi也可能会属于出发地。到底属于目的地，还是出发地，如果不结合上下文，则很难做出判断。因此，使用传统的深度神经网络解决不了问
李宏毅机器学习笔记：结构学习，HMM，CRF ZEERO~ 机器学习机器学习笔记学习
李宏毅机器学习笔记：结构学习，HMM，CRF1、隐马尔可夫模型HMM1.1Sequence2Sequence1.2HMM1.3Viterbi算法1.3HMM模型的缺点2、CRF2.1CRF模型2.2CRF模型训练1、隐马尔可夫模型HMM1.1Sequence2Sequence什么是Seq2Seq问题呢？简单来说，就是输入是一个序列，输出也是一个序列。输入和输出的序列可以相等，也可以不相等。在本文中
李宏毅机器学习笔记——16. Conditional Generation by RNN&Attention(RNN条件生成与注意力机制) HSR CatcousCherishes 机器学习基础课程知识机器学习人工智能神经网络
摘要：本章内容是讲解了Generation，Attention，TipsforGeneration，一是围绕用RNN实现Generation（生成）的方法与基本原理，先应用生成句子去介绍生成的基本原理，接着举例无条件的生成图片，其不同的是：将图片上的每个像素点看成一个word，并需要考虑各像素之间的几何关系，所以我们需要借助3D-LSTM完善了Generation图片功能。但是在实际应用中，我们的
李宏毅机器学习笔记——生成模型荆棘鸟》深度学习人工智能
介绍了三种方法，pixelRNN，VAE,GAN。笔记以VAE为主。pixelRNN比较容易理解，由已知推未知。这种方法还能应用到语音生成等领域在这里有个tips值得说一下，图的每个像素一般RGB三色，问题出在当RGB三个值相差不大时最终的结果像素点的颜色趋向灰色，于是乎，为了使生成的图像更加鲜亮，就需要拉高三个值的差距。简而言之，原本用三个数表示颜色，现在只用一个。VAE是一个相对复杂的东西，事
李宏毅机器学习笔记——概率模型荆棘鸟》机器学习人工智能神经网络
很有意思的一门课，但关于如何利用P(x)生成x还存在疑惑。在神经网络中y=w*x+b，为什么是这个形式？这门课将在最后归结到这一点上。举一个实际的例子，训练集中A类71个B类69个我们假定A类的71个点遵循gaussiondistribution，上图涉及的函数：输入一个点(代表一个实例的特征vector)，输出sample中该点的概率，在下文中即为P(x|A)与P(x|B)该函数有两个参数，μ与
李宏毅机器学习笔记 learn_for_more 机器学习人工智能深度学习
DataWhale–李宏毅老师机器学习P5-P8《误差来源》和《梯度下降法》学习笔记学习笔记本文是李宏毅老师B站–《机器学习》课程的学习笔记，在此非常感谢DataWhale提供的平台，希望大家加入到这个学习的大家庭中，共同成长。本文主要是关于误差来源及梯度下降法的介绍，是在老师的讲解视频和学习文档的基础上总结而来。一、误差来源在机器学习中，模型估计的误差可以分为两种，偏差（Bias）和方差（Var
【ML入门】李宏毅机器学习笔记02-回归问题（Regression） BG大龍
【ML入门】李宏毅机器学习笔记02-回归问题（Regression）-知乎https://zhuanlan.zhihu.com/p/74684108
李宏毅机器学习笔记第8周_批次与动量 MoxiMoses 机器学习深度学习
文章目录一、Review：OptimizationwithBatch二、SmallBatchv.s.LargeBatch三、Momentum1.SmallGradient2.VanillaGradient3.GradientDescent+Momentum一、Review：OptimizationwithBatch在计算微分的时候，并不是把所有的data对计算出来的L做微分，而是把data分成一个
【ML入门】李宏毅机器学习笔记01-Learning Map BG大龍
【ML入门】李宏毅机器学习笔记01-LearningMap-知乎https://zhuanlan.zhihu.com/p/74377397
李宏毅机器学习—机器学习介绍修_远李宏毅机器学习
李宏毅机器学习笔记github链接：https://github.com/datawhalechina/leeml-notes李宏毅机器学习笔记在线阅读链接：https://datawhalechina.github.io/leeml-notes机器学习介绍这门课，我们预期可以学到什么呢？我想多数同学的心理预期就是你可以学到一个很潮的人工智慧。我们知道，从今年开始，人工智慧这个词突然变得非常非常非
【李宏毅机器学习笔记】9、卷积神经网络（Convolutional Neural Network，CNN） qqqeeevvv 机器学习深度学习机器学习深度学习
【李宏毅机器学习笔记】1、回归问题（Regression）【李宏毅机器学习笔记】2、error产生自哪里？【李宏毅机器学习笔记】3、gradientdescent【李宏毅机器学习笔记】4、Classification【李宏毅机器学习笔记】5、LogisticRegression【李宏毅机器学习笔记】6、简短介绍DeepLearning【李宏毅机器学习笔记】7、反向传播（Backpropagatio
李宏毅机器学习笔记第8周_自动调整学习速率 MoxiMoses 机器学习深度学习
文章目录一、Trainingstuck≠SmallGradient二、Waitaminute三、Trainingcanbedifficultevenwithoutcriticalpoints四、Differentparametersneedsdifferentlearningrate五、Rootmeansquare六、RMSProp七、Adam:RMSProp+Momentum八、Learning
【李宏毅机器学习笔记1】第一节机器学习基本概念简介（上） freezing001 深度学习深度学习机器学习
第一节机器学习基本概念简介（上）1.机器学习第一步：function机器学习MachineLearning≈LookingforFunctionML的三大任务：Regression(回归)+classification（分类）+strcturedlearning(createsomethingwithstructure)即让机器产生有结构的东西机器学习的model：带有未知parameters的f
李宏毅机器学习笔记-Lecture1 不废江河954 笔记深度学习学习机器学习学习人工智能
李宏毅机器学习笔记-Lecture1_续机器学习基本概念（下）PiecewiseLinearCurvesBeyondPiecewiseLinearCurvesSigmoidFunction各参数对Sigmoid的影响用Sigmoid拟合PiecewiseLinearCurvesNewModelwithMoreFeatures最终模型对各个参数的认识MLFramework构造模型构造损失函数找到最优
2021李宏毅机器学习笔记--7.1 backpropagation guoxinxin0605 机器学习神经网络人工智能深度学习
2021李宏毅机器学习笔记--7.1backpropagation1摘要2步骤2.1chainrule链式法则2.2lossfunction2.2.1forwardpass2.2.2backwardpasscase1未知的两项在输出层case2未知的两项并不在输出层3小结及展望1摘要上文讲到可以用Backpropagation的方法对网络中的所有参数（w和b）进行更新，最终使totalloss达到
2021李宏毅机器学习笔记--16 Recursive Network guoxinxin0605 网络神经网络
2021李宏毅机器学习笔记--16RecursiveNetwork递归网络摘要一、Application:SentimentAnalysis(应用：情绪分析)二、RecursiveNetwork三、RecursiveNetworkTensorNetwork四、Matrix-VectorRecursiveNetwork五、TreeLSTM六、MoreApplication(更多应用：句子关联)总结摘
2021李宏毅机器学习笔记--7 deep learning深度学习与 fully connect feedforward network全连接前馈网络 guoxinxin0605 神经网络机器学习深度学习人工智能网络
2021李宏毅机器学习笔记--7deeplearning深度学习与fullyconnectfeedforwardnetwork全连接前馈网络摘要步骤step1NeuralnetworkFullyConnectFeedforwardNetwork全连接前馈网络step2goodnessofafunctionstep3Backpropagation小结与展望摘要近些年来。在各个领域，用到深度学习的地方
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多