Andrewings

西瓜书学习笔记——第三章：线性模型

第三章：线性模型

3.1 基本形式
3.2 线性回归
- - - - 对离散变量的处理
      - 3.2.1 对于样本只有一种属性的情况
      - 3.2.2 对于样本由d个属性描述的情况
      - 用矩阵形式表示：
        
        ①当$X^{T}X$为满秩矩阵或正定矩阵时：
        
        ②当$X^{T}X$不为满秩矩阵或正定矩阵时：
      - 3.2.3 广义线性模型（$y$的衍生）
3.3 对数几率回归（用线性模型做分类任务）
- - - - 对数几率回归的小总结
        
        求解对数几率回归模型的$w$和$b$
- 3.4 线性类别分析（LDA，做分类任务）
- - 3.4.1 LDA的思想
  - 3.4.2 均值向量，协方差，协方差矩阵的概念
  - 3.4.3 LDA二分类的情况
  - 3.4.4 LDA多分类的情况
- 3.5 多分类学习
- - 3.5.1 多分类学习的基本思路
  - 3.5.2 多分类学习的拆分策略
  - - 一对一(OvO)
    - 一对其余(OvR)
    - 多对多(MvM)
    - - 最常用的MvM技术：纠错输出码(ECOC)
- 3.6 类别不平衡问题

3.1 基本形式

线性模型：试图学得一个通过属性的线性组合来进行预测的函数，即：
$f\left( x\right) =w_{1}x_{1}+w_{2}x_{2}+\ldots +w_{d}x_{d}+b$
其中， $x=(x_{1};x_{2};...;x_{d})$ 是有d个属性的示例
一般用向量形式写成：
$f\left( x\right) =w^{T}x+b$

在线性模型的基础上通过引入层级结构或高维映射可得到许多功能更为强大的非线性模型（nonlinear model）。

3.2 线性回归

线性回归（linear regression）试图学得一个线性模型以尽可能地预测实值输出标记。

对离散变量的处理

若属性值之间存在序关系，可通过连续化将其转换为连续值：如高中低对应{1, 0.5, 0}
若属性之间不存在序关系，假定属性值有k个，则通常转化为k维向量：如瓜类的取值黄瓜，西瓜，冬瓜可转化为（0,0,1）,（0,1,0）（1,0,0）

3.2.1 对于样本只有一种属性的情况

线性回归试图学得：
$\qquad\qquad\qquad\qquad\qquad$ $f(x_{i})=wx_{i}+b$ ，使得 $f(x_{i}) \simeq y_{i}$

对于 $f(x_{i}) \simeq y_{i}$ ，我们可以通过让均方误差最小化来达到（即找到一条直线，使得所有样本到该直线的欧几里得距离之和最小）。
$\left( w^{\ast },b^{\ast }\right) =arg\space min_{\left( w,b\right) }\sum ^{m}_{i=1}\left( f\left( x_{i}\right) -y_{i}\right) ^{2}$ $\space\space\qquad\qquad =arg\space min_{\left( w,b\right) }\sum ^{m}_{i=1}\left( y_{i}-wx_{i}-b\right) ^{2} \tag{3.4}$

求解 $E\left( w,b\right) = \sum ^{m}_{i=1}\left( y_{i}-wx_{i}-b\right) ^{2}$ 最小化的过程，称为线性回归模型的最小二乘“参数估计”（parameter estimation）。

$E\left( w,b\right)$ 是关于 $w$ 和 $b$ 的凸函数（U型曲线如f(x)=x^2通常为凸函数，可求其最优解）
对 $E\left( w,b\right)$ 关于 $w$ , $b$ 求一阶偏导，再令导数为0则可得 $w$ , $b$ 最优解的闭式解：

$\dfrac {\partial E\left( w,b\right) }{\partial w}=2\left( w\sum ^{m}_{i=1}x^{2}_{i}-\sum ^{m}_{i=1}\left( y_{i}-b\right) x_{i}\right)\tag{3.5}$
$\dfrac {\partial E\left( w,b\right) }{\partial b}=2\left(mb-\sum ^{m}_{i=1}\left( y_{i}-wx_{i}\right)\right)\tag{3.6}$

(3.5)，(3.6)公式推导：

待插图......

令(3.5)，(3.6)为零，得 $w$ , $b$ 最优解的闭式解：

$w=\dfrac {\sum ^{m}_{i=1}y_{i}\left( x_{i}-\overline {x}\right) }{\sum ^{m}_{i=1}x^{2}_{i}-\dfrac {1}{m}( \sum ^{m}_{i=1}x_{i})^{2}}\tag{3.7}$

$b=\dfrac {1}{m}\sum ^{m}_{i=1}\left( y_{i}-wx_{i}\right)\tag{3.8}$

其中 $\overline {x}=\dfrac {1}{m}\sum ^{m}_{i=1}x_{i}$ 为 $x$ 的均值

公式(3.7)，(3.8)的推导：

待插图......

3.2.2 对于样本由d个属性描述的情况

更一般的情况，样本由多个属性描述。给定数据集 $D=\{(x_{1},y_{1}),(x_{2},y_{2}),...(x_{n},y_{n})\}$ ，其中 $x_{i}=(x_{i1};x_{i2};...;x_{id})，y_{i} \in\R$

此时线性回归模型试图学得：
$\qquad\qquad\qquad\qquad\qquad$ $f(x_{i})=w^{T}x_{i}+b$ ，使得 $f(x_{i}) \simeq y_{i}$

此即为多元线性回归（multivariate linear regression）

类似的，我们可以利用最小二乘法来对 $w$ 和 $b$ 进行估计。

用矩阵形式表示：

我们把w和b写成向量形式 $\overline {w}=(w,b)$ ，把数据集 $D$ 表示成m(d+1)的矩阵 $X$ 。每一行对应一个示例，该行前d个元素表示d个属性值，最后一个为1（常数项b系数为1）：

把标记写成向量形式： $y=(y_{1};y_{2};...;y_{3})$ ，则与公式(3.4)类似的，我们有：

公式(3.10)的推导：

待插图......

令该导数为零可得 $\widehat{w}$ 最优解的闭式解，但涉及矩阵逆计算，比之前的单变量情形更复杂一些。需进行一下讨论：

①当 $X^{T}X$ 为满秩矩阵或正定矩阵时：

令式(3.10)为零可得
$\widehat w^{\ast }=\left( X^{T}X\right) ^{-1}X^{T}y\tag{3.11}$

公式(3.11)的推导：

待插图......

令 $\widehat x_{i }=(x_{i};1)$ ，则最终学得的多元线性回归模型为
$\widehat x_{i})= \widehat x_{i}^{T}\left( X^{T}X\right) ^{-1}X^{T}y\tag{3.12}$

公式(3.12)的推导：

待插图......

②当 $X^{T}X$ 不为满秩矩阵或正定矩阵时：

现实任务中 $X^{T}X$ 往往不是满秩矩阵。我们会遇到大量变量，其数目超过样例数时， $X$ 的列数多于行数， $X^{T}X$ 显然不满秩（线性方程组自变量过多，则会有多组解）。对于解出的多个 $\widehat w$ ，它们都能使均方误差最小化，选择哪一个作为输出，将由学习算法的归纳偏好决定，常见做法是引入正则化（regularization）项。

3.2.3 广义线性模型（ $y$ 的衍生）

为了便于讨论，我们把线性回归模型简写为
$y =w^{T}x+b$
若我们认为示例所对应的输出标记是在指数尺度上变化，那就可将输出标记的对数作为线性模型逼近的目标，即
$ln y=w^{T}x+b$
此即为对数线性回归（log-linear regression），它形式上仍是线性回归，但实质上是求取输入空间到输出空间的非线性函数映射

下图中对数函数起到了将线性回归模型的预测值与真实标记（指数函数的 $y$ ）联系起来的作用

因此，更一般地，我们可这样推广到一个广义线性模型（generalized linear model）

考虑单调可微函数 $g(\cdot)$ （连续且充分光滑），令
$y=g^{-1}(w^{T}x+b)\tag{3.15}$
函数 $g(\cdot)$ 称为“联系函数”（link function）

显然，对数线性回归就是广义线性模型在 $g(\cdot)=\ln(\cdot)$ 时的特例

那么，广义线性模型是否也可像式(3.4)(3.9)类似进行均方差误差最小化呢？
当然可以。通常，广义线性模型的参数估计通过加权最小二乘法或极大似然法进行。

<加权最小二乘法链接>

3.3 对数几率回归（用线性模型做分类任务）

线性模型怎么做分类任务？

答案就在式(3.15)的广义模型中：只需找个单调可微函数将分类任务的真实标记 $y$ 与线性回归模型的预测值 $z$ 联系起来。
二分类任务的真实标记 $y\in\{0,1\}$ ，而线性回归模型产生的预测值 $z=w^{T}x+b$ 为实值，则可将 $z$ 对应到{0,1}里。最理想的是单位阶跃函数（unit-step function）：

即线性模型的预测值 $z$ 大于零就判定为正例，小于零就判定为反例，为临界值0时则可任意判定

为不连续的单位阶跃函数找到了对数几率函数作为代替函数（可以看到対率函数曲线的特性近似于阶跃函数，它是一种“Sigmoid函数”，它将 $z$ 值转化为一个接近0或1的 $y$ 值，其输出值在 $z = 0$ 附近变化很陡）
对数几率函数：
$y=\dfrac {1}{1+e^{-z}}$
将对数几率函数作为 $g^{-}(\cdot)$ 代入式(3.15)，得到：
$y=\dfrac {1}{1+e^{-\left( w^{T}x+b\right) }} \tag{3.18}$
转化为线性形式则为（类似于式(3.14)）：
$\ln\dfrac {y}{1+y}=w^{T}x+b\tag{3.19}$
若将 $y$ 看做样本 $x$ 作为正例的可能性，则 $1 - y$ 是其反例的可能性，两者的比值 $\dfrac{y}{1-y}$ 称为 “几率”，反映了 $x$ 作为正例的相对可能性，
$\ln\dfrac {y}{1-y}$ 则为对数几率(log odds，亦称logit)

由式(3.19)可见，式(3.18)实际上是在用线性回归模型的预测结果去逼近真实标记的对数几率

对数几率回归的小总结

求解对数几率回归模型的 $w$ 和 $b$

首先，我们将式(3.18)中的 $y$ 视为类后验概率估计 $p (y = 1 ∣ x)$ ，则 $1 - y$ 即为 $p (y = 0 ∣ x)$
则式(3.19)可重写为
$\ln \dfrac {p (y=1|x) }{p( y= 0|x)} =w^{T}x+b\tag{3.22}$
注： $p (y = 1 ∣ x) + p (y = 0 ∣ x) = 1$
则有：

这里我们用极大似然法来估计 $w$ 和 $b$
给定数据集 $\left\{ \left( x_{i},y_{i}\right) \right\} ^{m}_{i=1}$ ，对率回归模型最大化“对数似然”（log-likelihood）
$f\left( w,b\right) =\sum ^{m}_{i=1}\ln p\left(y_{i}\right| x_{i};w,b)\tag{3.25}$
注：这里的似然项的参数 $\theta _{c}=(x_{i};w,b)吗？是(w,b)还是(w;b)?$

式(3.26)的推导：

待插入图

由式(3.23)(3.24)(3.25)(3.26)可知，最大化式(3.25)等价于最小化
$l\left( \beta \right) =\sum ^{m}_{i=1}\left( -y_{i}\beta ^{T}\widehat x_{i}+\ln \left( 1+e^{\beta ^{T }\widehat x_{i}}\right) \right)\tag{3.27}$

这是关于 $\beta$ 的高阶可导连续函数，根据凸优化定理，经典的数值优化算法如梯度下降法，牛顿法都可求其最优解，于是得到
$\beta\ast=arg\space min\space l(\beta)\tag{3.28}$
注：<牛顿法补充链接>

公式推导待插图

笔记已做好，待补充

3.4 线性类别分析（LDA，做分类任务）

3.4.1 LDA的思想

3.4.2 均值向量，协方差，协方差矩阵的概念

3.4.3 LDA二分类的情况

3.4.4 LDA多分类的情况

3.5 多分类学习

3.5.1 多分类学习的基本思路

3.5.2 多分类学习的拆分策略

一对一(OvO)

一对其余(OvR)

多对多(MvM)

最常用的MvM技术：纠错输出码(ECOC)

3.6 类别不平衡问题

你可能感兴趣的:(西瓜书学习笔记,西瓜书,线性模型)

小白零基础学数学建模系列-Day1-数学建模入门介绍与案例实践川川菜鸟数学建模小白到精通系列数学建模
目录一、数学建模的定义和重要性1.1什么是数学建模？1.2数学建模的重要性二、常见的数学建模方法概述2.1线性模型和案例2.1.1特点2.1.2应用2.1.3问题2.1.4模型2.1.5数学表达式2.1.6求解算法2.2非线性模型和案例2.2.1特点2.2.2应用2.2.3问题2.2.4模型2.2.5数学表达式2.2.6算法2.3动态模型2.3.1特点2.3.2应用2.3.3常见问题2.3.4模型
人工智能机器学习算法分类全解析 power-辰南人工智能人工智能机器学习算法 python
目录一、引言二、机器学习算法分类概述（一）基于学习方式的分类1.监督学习（SupervisedLearning）2.无监督学习（UnsupervisedLearning）3.强化学习（ReinforcementLearning）（二）基于任务类型的分类1.分类算法2.回归算法3.聚类算法4.降维算法5.生成算法（三）基于模型结构的分类1.线性模型2.非线性模型3.基于树的模型4.基于神经网络的模型
【西瓜书《机器学习》七八九章内容通俗理解】游戏乐趣人工智能机器学习人工智能
第七章：贝叶斯分类器7.1贝叶斯决策论基础核心概念：贝叶斯分类器是基于概率来做分类决策的。简单来说，就是根据已知的一些条件，去计算每个类别出现的概率，然后选择概率最大的那个类别作为分类结果。就好比你在猜一个盒子里装的是红球还是蓝球，你可以根据之前从这个盒子里摸球的一些经验（比如摸出红球的次数多），来判断这次盒子里更有可能是红球还是蓝球。例子：假如你要判断一幅图片是猫还是狗。你知道在所有的图片数据里
R语言广义加性模型：使用广义线性加性模型GAMs构建logistic回归 TechInk r语言回归开发语言 R语言
R语言广义加性模型：使用广义线性加性模型GAMs构建logistic回归在数据分析和建模领域，广义加性模型（GeneralizedAdditiveModels，简称GAMs）是一种常用的非参数统计方法。它结合了广义线性模型（GeneralizedLinearModels，简称GLMs）的灵活性和非线性关系的建模能力，可以适用于各种类型的响应变量，包括二元回归（logistic回归）。本文将介绍如何
周志华机器学习西瓜书第五章神经网络-学习笔记(超详细) Sodas（填坑中....）周志华西瓜书——详细笔记附例题图解机器学习神经网络学习人工智能数据挖掘算法
在机器学习中，神经网络一般指的是"神经网络学习"，是机器学习与神经网络两个学科的交叉部分。所谓神经网络，目前用的最广泛的一个定义是"神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体做出交互反应"。神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助
机器幻觉产生的原因人机与认知实验室机器学习人工智能
机器幻觉是指模型生成的不符合现实的内容，比如图像生成中的错误或者不合理的输出。线性函数在神经网络中的作用通常是传递梯度，但如果每一层都是线性的，整个网络就相当于一个单层的线性模型，无法学习复杂的模式。所以如果只有线性层而没有非线性激活函数的话，网络将无法处理复杂任务。对于激活函数而言，常见的如ReLU、sigmoid、tanh。激活函数引入非线性，让网络有能力学习复杂的特征。但是如果没有合适的激活
AI人工智能机器学习之监督线性模型 rockfeng0 人工智能机器学习 sklearn
1、概要本篇学习AI人工智能机器监督学习框架下的线性模型，以LinearRegression线性回归和LogisticRegression逻辑回归为示例，从代码层面测试和讲述监督学习中的线性模型。2、监督学习之线性模型-简介监督学习和线性模型是的两个重要概念。监督学习是一种机器学习任务，其中模型在已标记的数据集上进行训练。线性模型是一类通过线性组合输入特征来进行预测的模型。线性模型的基本形式可
【机器学习算法选型：分类与回归】常见分类算法介绍云博士的AI课堂哈佛博后带你玩转机器学习机器学习分类回归分类与回归机器学习算法选型深度学习人工智能
第2节：常见分类算法介绍在机器学习中，分类算法是用于预测一个样本所属类别的工具。无论是在金融风控、医疗诊断、图像识别还是推荐系统等领域，分类算法都扮演着至关重要的角色。不同的分类算法各自有不同的优缺点和应用场景，因此了解这些算法的特点及其适用条件，是构建高效分类模型的关键。1.逻辑回归（LogisticRegression）介绍逻辑回归是一种广泛应用于二分类问题的线性模型，其目标是根据输入特征预测
《西瓜书》大白话思想总结-第三章小溪子子西瓜书概率论机器学习分类
第三章3.1+3.2分类和回归是监督式学习，都是根据数据，分析特征，作出预测，只是预测的值是离散的叫分类，连续的叫回归。为什么叫线性回归呢？因为线性就可以看成是直线，直线当然是连续的。而所给的直线就是根据离散点拟合出来的线，其本质就是一种预测。那么根据离散点的特征，给出了预测方程的这个直线，就符合回归的定义。因此，这就叫作线性回归。（个人理解，不一定对）这个拟合直线的方程，或者叫预测的函数，各个自
【机器学习基础】第六课：线性回归 x-jeff 机器学习基础机器学习线性回归人工智能
【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。1.线性模型基本形式给定由ddd个属性描述的示例x=(x1;x2;...;xd)\mathbfx=(x_1;x_2;...;x_d)x=(x1;x2;...;xd)，那么线性模型的基本形式可写为：f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(\mathbfx)=w_1x_1+w_2x_2+w_3x_3
机器学习的模型类型（Model Types）路野yue 人工智能机器学习
1.传统机器学习模型线性模型（LinearModels）：线性回归（LinearRegression）：用于回归任务，拟合线性关系。逻辑回归（LogisticRegression）：用于分类任务，输出概率值。岭回归（RidgeRegression）和Lasso回归（LassoRegression）：带正则化的线性回归。树模型（Tree-basedModels）：决策树（DecisionTree）：
机器学习课程的常见章节结构 zhangfeng1133 机器学习分类学习
以下是机器学习课程的常见章节结构，结合了搜索结果中的信息：1.机器学习基础知识机器学习的定义与分类监督学习、无监督学习、半监督学习、强化学习机器学习的产生与发展机器学习的历史与现代应用经验误差与过拟合过拟合与欠拟合的概念及解决方案评估方法与性能度量交叉验证、准确率、召回率、F1分数等偏差与方差偏差-方差权衡及其对模型的影响2.经典机器学习算法2.1线性模型一元线性回归与多元线性回归梯度下降算法（批
python版本的列线图绘制（二分类）医学AppMatrix 预测模型构建和评价人工智能数据分析机器学习 python
python版本的列线图绘制（二分类）列线图是为临床预测模型提供了一个使用的工具，借助列线图可以把指标转变为预测概率，但是近年来随着网页计算器的出现，列线图的使用没有原来广泛。但是，最近随着预测模型解释的流行，发现列线图还具有作为线性模型解释的工具的潜力，所以又想着把之前“用python绘制nomogram”的项目做完，那是之前的一个想法，后来因为水平不够没有完全完成，现在借助AI的力量，终于可以
机器学习:决策树小源学AI 人工智能机器学习决策树人工智能
1.初步概念决策树是一种基于分裂特征的机器学习方法，用于分类和回归任务。它通过将数据按特征值进行分割，最终做出预测。与线性模型不同，决策树能够自动识别重要的特征，并根据数据情况生成复杂的决策规则。2.决策树的核心思想决策树的核心思想在于选择一个特征作为分裂条件，将当前的数据划分为两个子节点，并重复这个过程直到达到停止条件。分裂条件的选择通常基于信息增益（香农信息量）或基尼不等式，以确保每次分裂都能
机器学习 - 学习线性模型的重要性谦亨有终跟着AI向前走机器学习学习人工智能
在接下来的博文中，我们将重点学习线性模型的回归模型和分类模型，在学习之前，让我们来了解一下学习线性模型的重要性，以及如何入门学习。一、作为初学者如何学习线性模型？作为初学者，要高效学习机器学习以及其中的线性模型，可以遵循以下几个步骤和建议：（一）、机器学习的整体学习策略打好数学基础线性代数：理解向量、矩阵、线性变换等，这些是理解模型表示（如y=w^Tx+b）和算法优化的基础。微积分：掌握导数、梯度
常见的深度学习模型总结编码时空的诗意行者深度学习人工智能
1.深度前馈神经网络(DeepFeedforwardNetworks)发明时间：2006年左右，随着计算能力的提升和大数据集的可用性增加，深度学习开始兴起。发明动机：解决传统机器学习模型在复杂数据上的局限性，如线性模型无法处理非线性关系的数据。模型特点：由多个隐藏层组成的神经网络，每一层的节点与下一层的节点完全连接。应用场景：分类、回归、语音识别、图像识别等。2.卷积神经网络(Convolutio
机器学习: 逻辑回归小源学AI 人工智能机器学习逻辑回归人工智能
概念与定义逻辑回归是一种用于分类问题的统计方法。它通过计算目标变量的概率来预测类别归属，并假设数据服从伯努利分布（二分类）或多项式分布（多分类）。逻辑回归模型输出的是概率值，通常使用sigmoid函数将线性组合映射到0和1之间。1.概念逻辑回归用于解决分类问题，特别是二分类问题。它通过估计输入变量与目标变量之间的关系来预测目标变量的类别。2.定义逻辑回归是一种广义线性模型，其核心思想是将线性组合通
逻辑回归不能解决非线性问题，而svm可以解决江河地笑机器学习逻辑回归支持向量机算法
逻辑回归和支持向量机（SVM）是两种常用的分类算法，它们在处理数据时有一些不同的特点，特别是在面对非线性问题时。1.逻辑回归逻辑回归本质上是一个线性分类模型。它的目的是寻找一个最适合数据的直线（或超平面），用来将不同类别的数据分开。它的分类决策是基于输入特征的加权和，即：由于逻辑回归是线性模型，因此它只能在数据集是线性可分的情况下表现良好。如果数据的分布是非线性的，逻辑回归可能无法有效地分类，因为
机器学习（入门3） caspesjpe 机器学习 python 逻辑回归算法
机器学习（入门3有监督学习算法之回归算法）4回归算法4.1线性回归：利用函数对一个或多个特征值和目标值之间关系进行建模分析的方式回归问题：目标值------连续性函数公式：h(W)=w1x1+w2x1+w3x3+…+b一般用矩阵形式表示4.1.1线性模型：自变量一次；参数一次(自变量高次方,非线性函数）y=w1x1+w2x2^2+…+b4.1.2线性回归的损失和优化[目标：求模型参数]损失函数co
acados安装与调试指南：版本兼容性问题 t0_54coder 编程问题解决手册 java 数据库服务器个人开发
在计算机编程领域，软件工具和库的安装与调试是每个开发者必经的挑战。最近，在安装和使用acados库时，我遇到了一个有趣的问题，这里我将详细分享我的经验和解决方案。背景acados是一个用于非线性模型预测控制（NMPC）的高性能算法库，其在优化问题求解上具有显著的效率和灵活性。安装过程通常包括编译库和配置Python接口，这在官方文档中有着详细的步骤指导。问题描述在我的Ubuntu20.04LTS系
机器学习--学习计划 kyle~ 机器学习机器学习学习人工智能
3周机器学习速成计划基于「28原则」，聚焦机器学习20%的核心概念，覆盖80%的常见应用场景。计划分为理论学习+项目实战，每周学习后通过5个递进项目巩固知识。第1周：数据与监督学习基础学习目标：掌握数据预处理、线性模型与分类任务的基础流程。核心概念（20%关键内容）：数据预处理缺失值处理（均值填充、删除）特征缩放（标准化、归一化）分类变量编码（独热编码、标签编码）监督学习基础线性回归（原理、损失函
软件过程模型 final.TD 软件工程软件工程
软件过程概念软件生命周期软件过程在工作产品构建过程中，所需完成的工作活动，动作和任务的集合。软件过程模型软件过程评估能力成熟度模型（CMM）传统软件过程模型瀑布模型（第一个软件过程模型，1970年模型）线性模型推迟实现缺点：增加工作量开发风险大早期错误发现晚不适应需求变化适用于需求明确，技术成熟，管理严的V模型（瀑布模型的变种）原型模型（原型化模型，快速原型模型）原型：一个部分开发的产品，让客户和
L8打卡学习笔记无涯学徒1998 学习笔记支持向量机
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊SVM与集成学习SVMSVM线性模型SVM非线性模型SVM常用参数集成学习随机森林导入数据查看数据信息数据分析随机森林模型预测结果结果分析个人总结SVM超平面：SVM在特征空间中寻找一个能够最大化类别间隔的超平面，称为最大间隔超平面。这个超平面就是将数据集分成不同类别的边界。支持向量：支持向量是离分隔超平面最近的样本点，它们决定了超平面的
机器算法之逻辑回归(Logistic Regression)详解 HappyAcmen 算法合集算法逻辑回归机器学习
一、什么是逻辑回归？逻辑回归并不是传统意义上的回归分析，而是一种用于处理二分类问题的线性模型。它通过计算样本属于某一类别的概率来进行分类，尽管名字中有“回归”二字，但它实际上是一种分类算法。简单来说，逻辑回归回答的是“这件事发生的可能性有多大”。二、逻辑回归的基本原理在讲原理之前，我们先来了解一下逻辑回归的数学基础。逻辑回归的核心是一个Logistic函数（或称为Sigmoid函数），它的公式如下
广义加性模型的参数、半参数、非参数形式智识小站可解释机器学习算法
简要介绍在统计学中，广义加性模型（GAM）是一种广义线性模型，其中线性响应变量线性地依赖于一些预测变量的未知光滑函数，并且人们对这些光滑函数的推理很感兴趣。GAM最初由TrevorHastie和RobertTibshirani[1]开发，用于将广义线性模型的性质与加性模型相结合。它们可以被解释为朴素贝叶斯生成模型的判别推广。该模型将一个单变量响应变量Y和一些预测变量联系起来。为Y指定指数族分布，例
概率潜在语义分析（Probabilistic Latent Semantic Analysis,PLSA）—无监督学习方法、概率模型、生成模型、共现模型、非线性模型、参数化模型、批量学习剑海风云 Artificial Intelligence 人工智能机器学习概率潜在语义分析 PLSA
定义输入:设单词集合为W={ω1,ω2,⋯ ,ωM}W=\{\omega_1,\omega_2,\cdots,\omega_M\}W={ω1,ω2,⋯,ωM},文本集合为D={d1,d2,⋯ ,dN}D=\{d_1,d_2,\cdots,d_N\}D={d1,d2,⋯,dN},话题集合为Z={z1,z2,⋯ ,zN}Z=\{z_1,z_2,\cdots,z_N\}Z={z1,z2,⋯,zN},共现
潜在狄利克雷分配（Latent Dirichlet Allocation,LDA）—无监督学习方法、概率模型、生成模型、线性模型、非参数化模型、贝叶斯学习、批量学习剑海风云 Artificial Intelligence 人工智能机器学习潜在狄利克雷分配 LDA
定义输入:单词集合W={ω1,⋯ ,ωv,⋯ ,ωV},其中ωv是第v个单词,v=1,2,⋯ ,V,V是单词第个数。单词集合W=\{\omega_1,\cdots,\omega_v,\cdots,\omega_V\},其中\omega_v是第v个单词,v=1,2,\cdots,V,V是单词第个数。单词集合W={ω1,⋯,ωv,⋯,ωV},其中ωv是第v个单词,v=1,2,⋯,V,V是单词第个数。文
【机器学习】广义线性模型（GLM）的基本概念以及广义线性模型在python中的实例（包含statsmodels和scikit-learn实现逻辑回归） Lossya 机器学习 python scikit-learn 线性回归人工智能逻辑回归
引言GLM扩展了传统的线性回归模型，使其能够处理更复杂的数据类型和分布文章目录引言一、广义线性模型1.1定义1.2广义线性模型的组成1.2.1响应变量（ResponseVariable）1.2.2链接函数（LinkFunction）1.2.3线性预测器（LinearPredictor）1.3常见的广义线性模型1.3.1线性回归1.3.2逻辑回归1.3.3泊松回归1.4GLM的特性1.5广义线性模型
AdaBoost算法（AdbBoost Algorithm）—有监督学习方法、非概率模型、判别模型、非线性模型、非参数化模型、批量学习剑海风云 Artificial Intelligence 人工智能机器学习提升方法 AdaBoost
定义输入:训练数据集T={(x1,y1),(x2,y2),⋯ ,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}T={(x1,y1),(x2,y2),⋯,(xN,yN)},其中，xi∈χ⊆Rn,yi∈y={−1,+1}x_i\in\chi\subseteqR^n,y_i\in{\tty}=\{-1,+1\}xi∈χ⊆Rn,yi∈y={−1,+1}
(感知机-Perceptron)—有监督学习方法、非概率模型、判别模型、线性模型、参数化模型、批量学习、核方法剑海风云 Artificial Intelligence 机器学习人工智能感知机 Perceptron
定义假设输入空间（特征空间）是χ\chiχ⊆Rn\subseteqR^n⊆Rn,输出空间是y={+1,−1}=\{+1,-1\}={+1,−1}。输入x∈χx\in\chix∈χ表示实例的特征向量，对应于输入空间（特征空间）的点；输出y∈y\iny∈y表示实例的类别。由输入空间到输出空间的如下函数：f(x)=sign(ω⋅x+b)f(x)=sign(\omega\cdotx+b)f(x)=sign
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他