oldmao_2001

李宏毅学习笔记18.Explainable ML

文章目录

简介

例子
原因
Myth of Explainable ML
Interpretable v.s.Powerful

Local Explanation: Explain the Decision

Basic ldea
Limitation of Gradient based Approaches
Attack Interpretation?!
Case Study: Pokémon v.s. Digimon
Saliency Map分析

GLOBAL EXPLANATION: EXPLAIN THE WHOLE MODEL

Activation Minimization (review)
用Generator做正则

USING A MODEL TO EXPLAIN ANOTHER

怎么做

Local Interpretable ModelAgnostic Explanations (LIME)

LIME － Image
Decision Tree

简介

这个内容也是新的，EXPLAINABLE MACHINE LEARNING
机器不但要知道，还要告诉我们它为什么会知道。
公式输入请参考：在线Latex公式

例子

之前的作业中有做分类：

关于解释有两种：
Local Explanation: Why do you think this image is a cat?
Global Explanation: What do you think a “cat” looks like?

原因

用机器来协助判断简历
·具体能力？还是性别？
用机器来协助判断犯人是否可以假释
·具体证据？还是肤色？
金融相关的决策常常依法需要提供理由
·为什麽拒绝了某個人的贷款？
模型诊断：到底机器学到了甚麽
·不能只看正确率？想想神马汉斯的故事

一个多世纪前欧洲某个国家的一个农场出了一个非常聪明的名叫汉斯的神马。它不仅可以完成10以内的加减乘除，而且还能和人玩丢手绢游戏，总能找到拿手绢的人。后来一位马戏团的老板听说后很不以为然，决定揭穿这位农场主的戏法。老板带了几个随员，专门盯住农场主四肢的一举一动，老板相信是农场主给了汉斯信号。结果老板失败了。农场主根本没有参与测验，汉斯照样100%得到正确答案。汉斯后来越来越有名，结果惊动了一位科学家。这位科学家去测试汉斯，发现汉斯的确能给出任何计算的答案。汉斯给出答案的方法很简单，就是用前蹄敲地面，敲几下，就是答案。这位科学家眼看无计可施，无法判断汉斯是否真有计算能力时，突然问汉斯从农场到首都有多远？结果汉斯敲了几下蹄子后就开始犹豫不决。科学家突然明白了，汉斯只知道人们已经知道的答案，它不会计算。不过汉斯的确是一个聪明的马，它能根据人的各种表情、眼神乃至身体动作判断一个数的正确性。后来这位科学家决定取代汉斯。他让人心里想一个数，他用敲桌子的方式猜出这个数。他同样也能近乎100%地猜中人心里的数。当代测谎仪也是遵循同样的道理。
最近北京出了一个5个月大的超常婴儿，据说可以做加减乘除开根，认识上千个字，等等。方法同样是父母用一个正确，一个错误的答案让婴儿去猜。其实这和神马汉斯没有大的区别。真要测试婴儿，一个是拿多个，比如4个以上的答案让他猜，或者给他两个错误答案让他猜。家长愿意让孩子过早地记忆抽象的东西是家长的选择和自由，经过训练孩子会比其他没有训练的孩子不一样，属于异常，并非是超常。这种训练很容易让孩子远离同龄人，没有朋友，变成江郎，或者成为出家人。

We can improveML model based on explanation.

Myth of Explainable ML

·Goal of ML Explanation ≠ you completely know how the ML model work（Not necessary）
·Human brain is also a Black Box！
·People don’t trust network because it is Black Box，but you trust the decision of human！
·Goal of ML Explanation is（my point of view）
Make people（your customers，your boss，yourself）comfortable.（让人觉得很爽）
Personalized explanation in the future

Interpretable v.s.Powerful

·Some models are intrinsically interpretable.
·For example，linear model（from weights，you know the importance of features）
·But…not very powerful.
·Deep network is difficult to interpretable.
·Deep network is a black box.
Because deep network is a black box，we don’t use it.（这样做是不对的）
·But it is more powerful than linear model…
Let’s make deep network interpretable.
·Are there some models interpretable and powerful at the same time?
·How about decision tree?

其实树本身也可以很复杂（后面课程有二次元的例子，用树来解析图片）

还可以由很多树组合为森林，因此decision tree的可解释性也不是很好。
因此，本课从两个方面来学习ML的可解释性。

Local Explanation: Explain the Decision

Basic ldea

假设我们的对象x有N个组件，这些组件可以用来判断x。

如果是用pixel，那么x就是一个个的像素
如果是用segment，那么就是把图片分成一块块的。

We want to know the importance of each components for making the decision.
Idea: Removing or modifying the values of the components, observing the change of decision.
如果有Large decision change，那么就可以得到：Important component
例如：找一个图片，然后用一个灰色的方块，这个方块可以在图片中任意一个位置。当灰色图片位于某个位置导致机器判断改变，那么我们就把这个位置的方块区域看为重要的component。

上图中，蓝色区域就是重要区域，把这个区域遮住就会无法判断这是一只国美狗。同理：

Reference: Zeiler, M. D., & Fergus, R. (2014). Visualizing and understanding convolutional networks. In Computer Vision–ECCV 2014 (pp. 818-833)
注意，方块的大小和颜色会影响结果。
另外一种方法：
将 $x_1,...,x_n,...,x_N$ 中的某一项加上一些噪声变成 $x_1,...,x_n+\Delta x,...,x_N$
看这个噪声对输出 $y_k$ 有什么影响： $y_k+\Delta y$
$y_k$ 是模型预测为分类k的概率。如果影响越大那么越重要

影响可以用 $|\cfrac{\Delta y}{\Delta x}|$ 来表示，计算方式就是求偏导： $|\cfrac{\partial{\Delta y}}{\partial{\Delta x}}|$
得到的图称为：Saliency Map
文献：Karen Simonyan, Andrea Vedaldi, Andrew Zisserman, “Deep Inside Convolutional
Networks: Visualising Image Classification Models and Saliency Maps”, ICLR, 2014
To Learn More……
· Grad-CAM(https://arxiv.org/abs/1610.02391)
· SmoothGrad(https://arxiv.org/abs/1706.03825)
· Layer-wise Relevance Propagation
(https://arxiv.org/abs/1604.00825)
· Guided Backpropagation
(https://arxiv.org/abs/1412.6806)

Limitation of Gradient based Approaches

缺点：刚才那种方法基本要依靠Gradient Saturation
例如：大象的鼻子对于判断图片中是否有大象非常关键，但是当鼻子长到一定程度之后，机器就会非常的肯定是一只大象：

也就是说，鼻子的长度超过某个阈值之后，再变长对于判断大象这个事情没有啥帮助了。这个明显是不合理的。
To deal with this problem:（两种方法解决这个问题）
DeepLIFT
(https://arxiv.org/abs/1704.02685)
Integrated gradient
(https://arxiv.org/abs/1611.02639)

Attack Interpretation?!

（https://arxiv.org/abs/1710.10547）
找到重要的component之后就可以对判断进行干扰，例如一个卡车，用两种方法判断出来的重要component如下：
Vanilla Gradient

Deep LIFT

加入扰动噪声后：
Vanilla Gradient

Deep LIFT

可以看到，机器判断的component变成了白云。

Case Study: Pokémon v.s. Digimon

分辨神奇宝贝（现在叫宝可梦）和数码宝贝

各自的数据集：
Pokémon images: https://www.Kaggle.com/kvpratama/pokemonimages-dataset/data
Digimon images:https://github.com/DeathReaper0965/Digimon-Generator-GAN
例如：

Testing Images:

第一只：宝可梦
第二只：数码宝贝
第三只：宝可梦
看机器能否识别，随便叠一个model

结果：
Training Accuracy: 98.9%
Testing Accuracy: 98.4%
准确率很高啊，为什么呢？来分析一下Saliency Map

Saliency Map分析

数码宝贝

宝可梦：

发现机器学习的重点居然都是图片的背景，为什么？因为图片的格式：
All the images of Pokémon are PNG, while most images of Digimon are JPEG.

Machine discriminate Pokémon and Digimon based on Background color
This shows that explainable ML is very critical.

GLOBAL EXPLANATION: EXPLAIN THE WHOLE MODEL

这块内容之前有讲过，就是找到一个图片，让某个隐藏层的输出最大：

Activation Minimization (review)

手写数字识别的模型

$x^*=arg\underset{x}{max}y_i$
找出机器认为理想的数字如下：

加上限制，图片要越像数字越好：

With several regularization terms, and hyperparameter tuning ……

文献：https://arxiv.org/abs/1506.06579

用Generator做正则

上面提到要对图片做一个限制，比较像一个图片，这个事情可以用Generator来做，大概步骤如下：
通过一个低维向量进行输入，经过GAN或者VAE等生成模型，得到图片。

然后再接入上面的模型，image x要使得输出越像y越好，现在加入了生成模型后，就是要找z使得输出越像y越好，最好的那个z记为 $z^*$ ：

用这个方法得到的一些结果：

文献：https://arxiv.org/abs/1612.00005
这里和GAN里面的discriminator不一样，discriminator只会判断generator生成的图片好或者不好，这里是要生成某一个类型的图片。generator不变，我们调整的是低维向量z。

USING A MODEL TO EXPLAIN ANOTHER

Some models are easier to Interpret.
Using interpretable model to mimic uninterpretable model.

怎么做

Using an interpretable model to mimic the behavior of an uninterpretable model.

我们需要训练蓝色具有解释性的模型，使得在相同输入的情况下，两个模型的输出越接近越好。当蓝色模型和黑色模型一样的时候，我们就可以研究在训练蓝色模型的过程中模型学到了什么东西。
Problem: Linear model cannot mimic neural network …
但是：it can mimic a local region.只模拟部分。
下面来看例子：

Local Interpretable ModelAgnostic Explanations (LIME)

假设模型是黑盒子，输入和输出都是一维的。

1.Given a data point you want to explain

2.Sample at the nearby（x轴蓝色的），然后把蓝点代入黑盒子，得到具体的y值。

3. Fit with linear model(or other interpretable models)可以得到在这个区域内x增大，y变小的结论。

4. Interpret the linear model ，取值不一样，得到的结论不一样：

下面看一下用LIME解释如何识别一个图片

LIME － Image

我们知道线性模型不能fit图片，只能对图片做local的解释。

Given a data point you want to explain
Sample at the nearby
• Each image is represented as a set of superpixels(segments).
Randomly delete some segments.

然后用黑盒子计算结果Compute the probability “frog” by black box
Fit with linear (or interpretable) model
但是之前说过，把图片输入到线性模型不好弄，这里要设计一下，先对图片做extraction，提取特征将pixel表示为低维的向量。

这里M是一个超参数。
Interpret the model you learned
$y=w_1x_1+\cdots+w_mx_m+\cdots+w_Mx_M\\ x_m=0,Segment\space m\space is\space deleted\\ x_m=1,Segment\space m\space exists$
If $w_m$ ≈ 0, segment m is not related to “frog”
If $w_m$ is positive, segment m indicates the image is “frog”
If $w_m$ is negative, segment m indicates the image is not “frog”
再看老师手工实例：

结果分析：
和服：0.25

實驗袍：0.05

Decision Tree

下面用Decision Tree来代替上面的线性模型做解释工作。

当Decision Tree足够复杂理论上完全可以模仿黑盒子的结果，但是这样Decision Tree会非常非常复杂，那么Decision Tree本身又变得没法解释了，因此：Problem: We don’t want the tree to be too large.
这里我们用 $O(T_\theta)$ 表示决策树的复杂度。
一般情况下，模型的损失函数为：
$\theta=arg\underset{\theta}{min}L(\theta)$
Train a network that is easy to be interpreted by decision tree.要考虑决策树的复杂度，因此要在损失函数中加一个正则项：
$\theta=arg\underset{\theta}{min}L(\theta)+\lambda O(T_\theta)$
Is the objective function with tree regularization differentiable? No! Check the reference for solution
但是这个正则项没法做偏导，所以没有办法做GD。
解决方法：https://arxiv.org/pdf/1711.06178.pdf
中心思想是用一个随机初始化的结构简单的NN，训练后可以模拟出决策树的参数，然后用NN替换上面的正则项，NN是可以偏导的，然后就可以GD了。

李宏毅机器学习笔记——反向传播算法小陈phd 机器学习机器学习算法神经网络
反向传播算法反向传播（Backpropagation）是一种用于训练人工神经网络的算法，它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数，从而最小化损失函数。反向传播是深度学习中最重要的算法之一，通常与梯度下降等优化算法结合使用。反向传播的基本原理反向传播的核心思想是利用链式法则（ChainRule）来高效地计算损失函数相对于每个参数的梯度。以下是反向传播的基本步骤：前向传播（Forwa
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
2023春季李宏毅机器学习笔记 02 ：机器学习基本概念女王の专属领地机器学习深度学习 #李宏毅2023机器学习机器学习笔记人工智能
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、機器學習基
2023春季李宏毅机器学习笔记 03 ：机器如何生成文句女王の专属领地 #李宏毅2023机器学习机器学习深度学习笔记机器学习人工智能深度学习
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、大语言模型
Chat GPT4来了，它和3.5区别在哪？李宏毅机器学习笔记抱抱小杠杠机器学习人工智能笔记
听说GPT4模型更大、参数更多，功能更强，具体它好在哪里？GPT4真的能看懂图片吗？官方回答：不太能~~下面这张图片是将两个不存在的网址输入进GPT4，问它看到了什么，结果发现GPT真的会胡言乱语，它会根据网址中出现了“man”这个单词，就说他看到了“一个拿着手枪的男人。。。巴拉巴拉”明显就是在胡编乱造！而如果网址中出现了“girl”这个单词，GPT又会说他看到了“一个穿着校服的女孩子。。。巴拉巴
2023春季李宏毅机器学习笔记 05 ：机器如何生成图像女王の专属领地 #李宏毅2023机器学习机器学习笔记人工智能机器学习李宏毅 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、图像生成常
2023春季李宏毅机器学习笔记01 ：正确认识 ChatGPT 女王の专属领地深度学习机器学习机器学习李宏毅人工智能 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、对Chat
【23-24 秋学期】NNDL 作业11 LSTM HBU_David lstm 机器学习人工智能
习题6-4推导LSTM网络中参数的梯度，并分析其避免梯度消失的效果习题6-3P编程实现下图LSTM运行过程李宏毅机器学习笔记：RNN循环神经网络_李宏毅rnn笔记_ZEERO~的博客-CSDN博客https://blog.csdn.net/weixin_43249038/article/details/132650998L5W1作业1手把手实现循环神经网络-CSDN博客https://blog.c
李宏毅老师机器学习课程笔记_ML Lecture 1: ML Lecture 1: Regression - Demo leogoforit
引言：最近开始学习“机器学习”，早就听说祖国宝岛的李宏毅老师的大名，一直没有时间看他的系列课程。今天听了一课，感觉非常棒，通俗易懂，而又能够抓住重点，中间还能加上一些很有趣的例子加深学生的印象。视频链接（bilibili）：李宏毅机器学习(2017)另外已经有有心的同学做了速记并更新在github上：李宏毅机器学习笔记(LeeML-Notes)所以，接下来我的笔记只记录一些我自己的总结和听课当时的
李宏毅机器学习笔记.Flow-based Generative Model(补) oldmao_2000 李宏毅机器学习笔记机器学习笔记人工智能
文章目录引子生成问题回顾：GeneratorMathBackgroundJacobianMatrixDeterminant行列式ChangeofVariableTheorem简单实例一维实例二维实例网络G的限制基于Flow的网络构架G的训练CouplingLayerCouplingLayer反函数计算CouplingLayerJacobian矩阵计算CouplingLayerStacking1×1
李宏毅机器学习笔记-transformer ZEERO~ 深度学习机器学习笔记 transformer 深度学习
transformer是什么呢？是一个seq2seq的model。具体应用如上图所示，输入和输出的序列长度不固定，由model自己决定。语音翻译指的是，直接输入一段语音信号，例如英文，输出的直接是翻译之后的中文。seq2seq如今已经是一个应用非常广泛的模型，可以应用于NLP的各种任务，如语义分析，语义分类，聊天机器人等。另外还有个值得说明的功能是做multilabelclassification
李宏毅机器学习笔记-半监督学习 ZEERO~ 深度学习机器学习笔记学习
半监督学习，一般应用于少量带标签的数据（数量R）和大量未带标签数据的场景（数量U），一般来说，U>>R。半监督学习一般可以分为2种情况，一种是transductivelearning，这种情况下，将unlabeleddata的feature利用进来。另外一种是inductivelearning，这种情况下，在训练的整个过程中，完全不看任何unlabeleddata的信息。为什么要做semi-sup
李宏毅机器学习笔记第7周_局部最小值与鞍点 MoxiMoses 机器学习深度学习
文章目录一、OptimizationFailsbecause……二、TaylerSeriesApproximation三、Example总结一、OptimizationFailsbecause……1．问题：我们在做optimization的时候会发现，随着参数的不断更新，training的loss不会再下降，但是我们对loss并不满意。因此我们会发现，一开始model就train不起来，不管我们怎
李宏毅机器学习笔记：RNN循环神经网络 ZEERO~ 深度学习机器学习机器学习笔记 rnn
RNN一、RNN1、场景引入2、如何将一个单词表示成一个向量3种典型的RNN网络结构二、LSTMLSTM和普通NN、RNN区别三、LSTM的训练一、RNN1、场景引入例如情景补充的情况，根据词汇预测该词汇所属的类别。这个时候的Taipi则属于目的地。但是，在订票系统中，Taipi也可能会属于出发地。到底属于目的地，还是出发地，如果不结合上下文，则很难做出判断。因此，使用传统的深度神经网络解决不了问
李宏毅机器学习笔记：结构学习，HMM，CRF ZEERO~ 机器学习机器学习笔记学习
李宏毅机器学习笔记：结构学习，HMM，CRF1、隐马尔可夫模型HMM1.1Sequence2Sequence1.2HMM1.3Viterbi算法1.3HMM模型的缺点2、CRF2.1CRF模型2.2CRF模型训练1、隐马尔可夫模型HMM1.1Sequence2Sequence什么是Seq2Seq问题呢？简单来说，就是输入是一个序列，输出也是一个序列。输入和输出的序列可以相等，也可以不相等。在本文中
李宏毅机器学习笔记——16. Conditional Generation by RNN&Attention(RNN条件生成与注意力机制) HSR CatcousCherishes 机器学习基础课程知识机器学习人工智能神经网络
摘要：本章内容是讲解了Generation，Attention，TipsforGeneration，一是围绕用RNN实现Generation（生成）的方法与基本原理，先应用生成句子去介绍生成的基本原理，接着举例无条件的生成图片，其不同的是：将图片上的每个像素点看成一个word，并需要考虑各像素之间的几何关系，所以我们需要借助3D-LSTM完善了Generation图片功能。但是在实际应用中，我们的
李宏毅机器学习笔记——生成模型荆棘鸟》深度学习人工智能
介绍了三种方法，pixelRNN，VAE,GAN。笔记以VAE为主。pixelRNN比较容易理解，由已知推未知。这种方法还能应用到语音生成等领域在这里有个tips值得说一下，图的每个像素一般RGB三色，问题出在当RGB三个值相差不大时最终的结果像素点的颜色趋向灰色，于是乎，为了使生成的图像更加鲜亮，就需要拉高三个值的差距。简而言之，原本用三个数表示颜色，现在只用一个。VAE是一个相对复杂的东西，事
李宏毅机器学习笔记——概率模型荆棘鸟》机器学习人工智能神经网络
很有意思的一门课，但关于如何利用P(x)生成x还存在疑惑。在神经网络中y=w*x+b，为什么是这个形式？这门课将在最后归结到这一点上。举一个实际的例子，训练集中A类71个B类69个我们假定A类的71个点遵循gaussiondistribution，上图涉及的函数：输入一个点(代表一个实例的特征vector)，输出sample中该点的概率，在下文中即为P(x|A)与P(x|B)该函数有两个参数，μ与
李宏毅机器学习笔记 learn_for_more 机器学习人工智能深度学习
DataWhale–李宏毅老师机器学习P5-P8《误差来源》和《梯度下降法》学习笔记学习笔记本文是李宏毅老师B站–《机器学习》课程的学习笔记，在此非常感谢DataWhale提供的平台，希望大家加入到这个学习的大家庭中，共同成长。本文主要是关于误差来源及梯度下降法的介绍，是在老师的讲解视频和学习文档的基础上总结而来。一、误差来源在机器学习中，模型估计的误差可以分为两种，偏差（Bias）和方差（Var
【ML入门】李宏毅机器学习笔记02-回归问题（Regression） BG大龍
【ML入门】李宏毅机器学习笔记02-回归问题（Regression）-知乎https://zhuanlan.zhihu.com/p/74684108
李宏毅机器学习笔记第8周_批次与动量 MoxiMoses 机器学习深度学习
文章目录一、Review：OptimizationwithBatch二、SmallBatchv.s.LargeBatch三、Momentum1.SmallGradient2.VanillaGradient3.GradientDescent+Momentum一、Review：OptimizationwithBatch在计算微分的时候，并不是把所有的data对计算出来的L做微分，而是把data分成一个
【ML入门】李宏毅机器学习笔记01-Learning Map BG大龍
【ML入门】李宏毅机器学习笔记01-LearningMap-知乎https://zhuanlan.zhihu.com/p/74377397
李宏毅机器学习—机器学习介绍修_远李宏毅机器学习
李宏毅机器学习笔记github链接：https://github.com/datawhalechina/leeml-notes李宏毅机器学习笔记在线阅读链接：https://datawhalechina.github.io/leeml-notes机器学习介绍这门课，我们预期可以学到什么呢？我想多数同学的心理预期就是你可以学到一个很潮的人工智慧。我们知道，从今年开始，人工智慧这个词突然变得非常非常非
【李宏毅机器学习笔记】9、卷积神经网络（Convolutional Neural Network，CNN） qqqeeevvv 机器学习深度学习机器学习深度学习
【李宏毅机器学习笔记】1、回归问题（Regression）【李宏毅机器学习笔记】2、error产生自哪里？【李宏毅机器学习笔记】3、gradientdescent【李宏毅机器学习笔记】4、Classification【李宏毅机器学习笔记】5、LogisticRegression【李宏毅机器学习笔记】6、简短介绍DeepLearning【李宏毅机器学习笔记】7、反向传播（Backpropagatio
李宏毅机器学习笔记第8周_自动调整学习速率 MoxiMoses 机器学习深度学习
文章目录一、Trainingstuck≠SmallGradient二、Waitaminute三、Trainingcanbedifficultevenwithoutcriticalpoints四、Differentparametersneedsdifferentlearningrate五、Rootmeansquare六、RMSProp七、Adam:RMSProp+Momentum八、Learning
【李宏毅机器学习笔记1】第一节机器学习基本概念简介（上） freezing001 深度学习深度学习机器学习
第一节机器学习基本概念简介（上）1.机器学习第一步：function机器学习MachineLearning≈LookingforFunctionML的三大任务：Regression(回归)+classification（分类）+strcturedlearning(createsomethingwithstructure)即让机器产生有结构的东西机器学习的model：带有未知parameters的f
李宏毅机器学习笔记-Lecture1 不废江河954 笔记深度学习学习机器学习学习人工智能
李宏毅机器学习笔记-Lecture1_续机器学习基本概念（下）PiecewiseLinearCurvesBeyondPiecewiseLinearCurvesSigmoidFunction各参数对Sigmoid的影响用Sigmoid拟合PiecewiseLinearCurvesNewModelwithMoreFeatures最终模型对各个参数的认识MLFramework构造模型构造损失函数找到最优
2021李宏毅机器学习笔记--7.1 backpropagation guoxinxin0605 机器学习神经网络人工智能深度学习
2021李宏毅机器学习笔记--7.1backpropagation1摘要2步骤2.1chainrule链式法则2.2lossfunction2.2.1forwardpass2.2.2backwardpasscase1未知的两项在输出层case2未知的两项并不在输出层3小结及展望1摘要上文讲到可以用Backpropagation的方法对网络中的所有参数（w和b）进行更新，最终使totalloss达到
2021李宏毅机器学习笔记--16 Recursive Network guoxinxin0605 网络神经网络
2021李宏毅机器学习笔记--16RecursiveNetwork递归网络摘要一、Application:SentimentAnalysis(应用：情绪分析)二、RecursiveNetwork三、RecursiveNetworkTensorNetwork四、Matrix-VectorRecursiveNetwork五、TreeLSTM六、MoreApplication(更多应用：句子关联)总结摘
2021李宏毅机器学习笔记--7 deep learning深度学习与 fully connect feedforward network全连接前馈网络 guoxinxin0605 神经网络机器学习深度学习人工智能网络
2021李宏毅机器学习笔记--7deeplearning深度学习与fullyconnectfeedforwardnetwork全连接前馈网络摘要步骤step1NeuralnetworkFullyConnectFeedforwardNetwork全连接前馈网络step2goodnessofafunctionstep3Backpropagation小结与展望摘要近些年来。在各个领域，用到深度学习的地方
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>