煎饼证

【统计学习方法】学习笔记-第1章-统计学习及监督学习概论

【知乎同步：https://zhuanlan.zhihu.com/p/305028771】

【统计学习方法】学习笔记-第1章-统计学习及监督学习概论

1.1 统计学习

统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。统计学习也称为统计机器学习(statistical machine learning)
赫尔伯特·西蒙(Herbert A.Simon)对“学习”的定义：如果一个系统能够通过执行某个过程改进它的性能，这就是学习
统计学习的研究对象是数据(data)。从数据出发，提取数据的特征，抽象出数据的模型，发现数据中的知识，又回到对数据的分析与预测中去
统计学习关于数据的基本假设是：同类数据具有一定的统计规律性
统计学习的目的：对数据的预测和分析，尤其是未知数据
统计学习由监督学习(supervised learning)、无监督学习(unsupervised learning)和强化学习(reinforcement learning)等组成
统计学习方法可以概括为：从给定的、有限的、用于学习的训练数据(training data)集合出发，假设数据是独立同分布产生的；并且假设要学习的模型属于某个函数的集合，称为假设空间(hypothesis space)；应用某个评价准则(evaluation criterion)，从假设空间中选取一个最优的模型，使它对已知训练数据及未知测试数据(test data)在给定的评价准则下有最优的预测；最优模型的选取由算法实现。
统计学习方法三要素：模型(model，模型的假设空间)、策略(strategy，模型选择的准则)、算法(algorithm，模型学习的算法)
实现统计学习方法的步骤：
- 得到一个有限的训练数据集合
- 确定包含所有可能的模型的假设空间，即学习模型的集合
- 确定模型选择的准则，即学习的策略
- 实现求解最优模型的算法，即学习的算法
- 通过学习方法选择最优模型
- 利用学习的最优模型对新数据进行预测或分析

1.2 统计学习的分类

基本分类

监督、无监督、强化，半监督、主动

监督学习是指从标注数据中学习预测模型的机器学习问题。本质是学习输入到输出的映射的统计规律
监督学习中，输入与输出所有可能取值的集合分别称为输入空间(input space)与输出空间(output space)
每个具体的输入是一个实例(instance)，通常由特征向量(feature vector)表示。所有特征向量存在的空间称为特征空间(feature space)。模型是定义在特征空间上的
监督学习从训练数据(training data)集合中学习模型，对测试数据(test data)进行预测，输入与输出对又称为样本(sample)或样本点。
变量符号表示：
- 输入变量 $X$
- 输出变量 $Y$
- 输入变量取值 $x$
- 输出变量取值 $y$
- 输入实例 $x$ 的特征向量， $x^{(i)}$ 表示 $x$ 的第 $i$ 个特征
  - $x=(x^{(1)},x^{(2)},...,x^{(i)},...,x^{(n)})^T$
- $x_i$ 表示第 $i$ 个变量
  - $x_i=(x^{(1)}_i,x^{(2)}_i,...,x^{(n)}_i)^T$
- 训练集
  - $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$
输入输出变量为连续变量的预测问题称回归问题；输出变量为有限离散变量的预测问题称为分类问题；输入输出变量均为变量序列的预测问题称为标注问题。
统计学习假设数据存在一定的统计规律， $X$ 和 $Y$ 具有联合概率分布 $P (X, Y)$ 就是监督学习关于数据的基本假设。 $P (X, Y)$ 表示分布函数，或分布密度函数。
监督学习的模型可以是概率模型或非概率模型，分别由条件概率分布 $P (Y ∣ X)$ 或决策函数 $Y = f (X)$ 表示，预测写作 $P (y ∣ x)$ 或 $y = f (x)$ 。
训练得到的模型表示为条件概率分布 $\hat{P}(Y|X)$ 或决策函数 $Y=\hat{f}(X)$ ，描述输入和输出随机变量间的映射关系。对于输入 $x_{N+1}$ ，由模型 $y_{N+1}=\mathop{\arg max}_{y} \hat{P}(y|x_{N+1})$ 或 $y_{N+1}=\hat{f}(x_{N+1})$ 给出输出 $y_{N+1}$ 。
无监督学习是指从无标注数据中学习预测模型的机器学习问题。无监督学习的本质是学习数据中的统计规律或潜在结构。实现对数据的聚类、降维或概率估计。
$\mathcal{X}$ 是输入空间， $\mathcal{Z}$ 是隐式结构空间。要学习的模型可表示为函数 $z = g (x)$ 、条件概率分布 $P (z ∣ x)$ 、或条件概率分布 $P (x ∣ z)$ 形式。旨在从假设空间中选出在给定评价标准条件下的最优模型。
强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。本质是学习最优的序贯决策。
每个时间步 $t$ ，智能系统从环境中观测一个状态 $s_t$ 和一个奖励 $r_t$ ，采取一个动作 $a_t$ 。环境根据动作得到下个时间步 $t + 1$ 的状态 $s_{t+1}$ 和奖励 $r_{t+1}$ 。
系统的目标是长期累积奖励最大化，通过不断试错(trial and error)，学习最优策略，策略表示为给定状态下采取的动作

强化学习的马尔可夫决策过程是状态、奖励、动作序列上的随机过程，由五元组 $< S, A, P, r, γ >$ 组成：

$S$ 是有限状态(state)的集合
$A$ 是有限动作(action)的集合
$P$ 是状态转移概率(transition probability)函数
- $P(s^{'}|s,a)=P(s_{t+1}=s^{'}|s_t=s,a_t=a)$
$r$ 是奖励函数(reward function)
- $r(s,a)=E(r_{t+1}|s_t=s,a_t=a)$
$\gamma$ 是衰减系数(discount factor)
- $\gamma \in [0,1]$

马尔可夫决策过程具有马尔可夫性，下一个状态只依赖于前一个状态与动作，由状态转移概率函数 $P(s^{'}|s,a)$ 表示；下一个奖励依赖于前一个状态与动作，由奖励函数 $r (s, a)$ 表示
策略 $\pi$ ：定义为给定状态下动作的函数 $a = f (s)$ 或条件概率分布 $P (a ∣ s)$ 。给定一个策略 $\pi$ ，智能系统与环境互动的行为就已确定
价值函数(value function)或状态价值函数(state value function) 定义为策略 $\pi$ 从某一个状态 $s$ 开始的长期累计奖励的数学期望

$v_{\pi}(s)=E_{\pi}[r_{t+1}+\gamma r_{t+2}+\gamma^2 r_{t+3}+...|s_t=s]$

动作价值函数(action value function)定义为策略 $\pi$ 从某一个状态 $s$ 和动作 $a$ 开始的长期累积奖励的数学期望

$q_\pi(s,a)=E_\pi[r_{t+1}+\gamma r_{t+2}+\gamma^2 r_{t+3}+...|s_t=s,a_t=a]$

强化学习的目标是在所有可能的策略中选出价值函数最大的策略 $\pi^*$
强化学习的方法有基于策略(policy-based)、基于价值(value-based)，二者属于无模型(model-free)方法
有模型(model-based)方法试图直接学习马尔可夫决策过程的模型，包括转移概率函数 $P(s^{'}|s,a)$ 和奖励函数 $r (s, a)$ ，通过模型对环境的反馈进行预测，求出价值函数最大的策略 $\pi^*$ 。
无模型、基于策略的方法不直接学习模型，而试图求解最优策略 $\pi^*$ ，表示为 $a=f^*(s)$ 或条件概率分布 $P^*(a|s)$ 。学习通常从一个具体决策开始，搜索更优的策略。
无模型、基于价值的方法不直接学习模型，而试图求解最优价值函数，特别是最优动作价值函数 $q^*(s,a)$ ，间接学习最优策略。学习通常从一个具体价值函数开始，通过搜索更优的价值函数进行。
半监督学习(semi-supervised learning)是指利用标注数据和未标注数据学习预测模型的机器学习问题。
主动学习(active learning)是指机器不断主动给出实例让教师进行标注，然后利用标注数据学习预测模型的机器学习问题。相比下通常的监督学习可以看做”被动学习“。

按模型分类

统计学习模型可以分为概率模型(probabilistic model)和非概率模型(non-probabilistic model)或确定性模型(deterministic model)。
- 监督学习中，概率模型取 $P (y ∣ x)$ ，非概率模型取 $y = f (x)$
- 无监督学习中，概率模型取 $P (z ∣ x)$ 或 $P (x ∣ z)$ ，非概率形式取 $z = g (x)$
监督学习中，概率模型是生成模型，非概率模型是判别模型
概率模型：决策树、朴素贝叶斯、隐马尔可夫模型、条件随机场、概率潜在语义分析、潜在狄利克雷分配、高斯混合模型；非概率模型：感知机、支持向量机、k近邻、AdaBoost、k均值、潜在语义分析、神经网络。逻辑斯谛回归可以看做概率模型，也可以看做非概率模型
条件概率分布 $P (y ∣ x)$ 和函数 $y = f (x)$ 可以相互转化，条件概率分布最大化后得到函数，函数归一化后得到条件概率分布。
概率模型和非概率模型的区别在于模型的内在结构，概率模型一定可以表示为联合概率分布的形式。
概率模型的代码是概率图模型(probabilistic graphical model)

统计学习模型可以分为线性模型(linear model)和非线性模型(non-linear model)，取决于函数 $y = f (x)$ 或 $z = g (x)$ 是否线性函数。

线性模型：感知机、线性支持向量机、k近邻、k均值、潜在语义分析
非线性模型：核函数支持向量机、AdaBoost、神经网络

统计学习模型可以分为参数化模型(parametric model)和非参数化模型(non-parametric model)。参数化模型的模型参数维度固定有限；非参数化模型的模型参数维度不固定或无穷，随训练数据量增加而增大。

参数化模型：感知机、朴素贝叶斯、逻辑斯谛回归、k均值、高斯混合模型
非参数化模型：决策树、支持向量机、AdaBoost、k近邻、潜在语义分析、概率潜在语义分析、潜在狄利克雷分配

按算法分类

可分为在线学习(online learning)和批量学习(batch learning)。前者每次接受一个样本，进行预测并学习模型；后者一次接受所有数据学习模型，再进行预测。强化学习本身就有在线学习的特点。
需要在线学习的场景，①数据达到无法存储，需要及时处理；②数据规模大，无法一次处理所有；③数据模式随时间动态变化，不满足独立同分布假设。

按技巧分类

贝叶斯学习(Bayesian learning)，也称贝叶斯推理(Bayasian inference)，主要思路是在概率模型的学习和推理中，利用贝叶斯定理，计算给定条件下的模型的条件概率，即后验概率，并应用该原理进行模型估计和数据预测。如朴素贝叶斯、潜在狄利克雷分配学习
$D$ 表示数据， $\theta$ 表示模型参数。根据先验概率 $P(\theta)$ 和似然函数 $P(D|\theta)$ ，可计算后验概率：

$P(\theta|D)=\frac{P(\theta)P(D|\theta)}{P(D)}$

模型估计时，估计整个后验概率分布 $P(D|\theta)$ ，若需要给出模型则取后验概率最大的模型
模型预测时，计算数据对后验概率分布的期望，其中 $x$ 是新样本

$P(x|D)=\int P(x|\theta,D) P(\theta|D) \mathrm{d}\theta$

贝叶斯估计和极大似然估计在思想上有很大不同，但也可以简单关联起来：假设先验分布是均匀分布，取后验概率最大，就能从贝叶斯估计得到极大似然估计

核方法(kernel method)是使用核函数表述和学习非线性模型的一种机器学习方法。一些线性模型的学习方法基于相似度计算，如向量内积，核方法可以把他们扩展到非线性模型的学习。如核函数支持向量机、核PCA、核k均值
把线性模型扩展为非线性模型，直接的做法是显式地定义从输入空间到特征空间的映射，并在特征空间中进行内积计算。
$x_1,x_2$ 是输入空间任意两个实例，内积 $< x_{1}, x_{2} >$ ，输入空间到特征空间的映射是 $\varphi$ ，则对应特征空间上的内积是 $<\varphi(x_1),\varphi(x_2)>$ 。核方法直接在输入空间中定义核函数 $K(x_1,x_2)$ ，使其满足 $K(x_1,x_2)=<\varphi(x_1),\varphi(x_2)>$ 。

1.3 统计学习方法三要素

方法=模型+策略+算法
模型：模型就是所要学习的条件概率分布或决策函数。
模型的假设空间可以定义为决策函数的集合 $\mathcal{F}=\{f|Y=f(X)\}$ ，此时 $\mathcal{F}$ 通常是由一个参数向量决定的函数族，即 $\mathcal{F}=\{f|Y=f_\theta(X),\theta \in \mathrm{R}^n\}$ ，其中n维欧式空间 $\mathrm{R}^n$ 称为参数空间(parameter space)。
模型的假设空间也可以定义为条件概率的集合 $\mathcal{F}=\{P|P(Y|X)\}$ ，此时 $\mathcal{F}$ 通常是由一个参数向量决定的条件概率分布族，即 $\mathcal{F}=\{P|P_\theta(Y|X),\theta \in \mathrm{R}^n\}$ 。
策略：按照什么准则学习或选择最优模型。
损失函数度量模型一次预测的好坏，风险函数度量平均意义下模型预测的好坏。
用损失函数(loss function)或代价函数(cost function)度量预测错误的程度，记作 $L (Y, f (X))$ 。
统计学习常用的损失函数有以下几种：

0-1损失函数(0-1 loss function)

$KaTeX parse error: Got function '\newline' with no arguments as argument to '\begin{array}' at position 1: \̲n̲e̲w̲l̲i̲n̲e̲$

平方损失函数(quadratic loss function)

$L(Y,f(X))=(Y-f(X))^2$

绝对损失函数(absolute loss function)
$L (Y, f (X)) = ∣ Y - f (X) ∣$
对数损失函数(logarithmic loss function)或对数似然损失函数(log-likelihood loss function)
$L(Y,P(Y|X))=-\log P(Y|X)$

风险函数(risk function)或期望损失(expected loss)是理论上模型 $f (X)$ 关于联合分布 $P (X, Y)$ 的平均意义下的损失

$R_{exp}(f)=E_p[L(Y,f(X))]=\int_{\mathcal{X}\times\mathcal{Y}}L(y,f(x))P(x,y)dxdy$

学习的目标就是选择期望风险最小的模型。由于联合分布 $P (X, Y)$ 未知， $R_{exp}(f)$ 不能直接计算；而若联合分布已知，则不需要学习。所以监督学习就成为一个病态问题(ill-formed problem)
经验风险(empirical risk)或经验损失(empirical loss)记作：

$R_{emp}(f)=\frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))$

期望风险 $R_{exp}(f)$ 是模型关于联合分布的期望损失，经验风险 $R_{emp}(f)$ 是模型关于训练样本集的平均损失。根据大数定律，样本容量N趋于无穷时，经验风险 $R_{emp}(f)$ 趋于期望风险 $R_{exp}(f)$
现实中训练样本数目有限，所以用经验风险估计期望风险常常并不理想，要对经验风险进行一定校正，监督学习的两个基本策略即经验风险最小化和结构风险最小化。
经验风险最小化(empirical risk minimization,ERM)的策略认为经验风险最小的模型是最优的模型，即求解最优化问题：
$\min_{f\in \mathcal{F}}\frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))$
样本容量够大时，经验风险最小化能有很好的学习效果。如极大似然估计(maximum likelihood estimation)是经验风险最小化的一个例子，当模型是条件概率分布、损失函数是对数损失函数时。经验风险最小化就等价于极大似然估计。
样本容量很小时，会产生过拟合(over-fitting)现象。
结构风险最小化(structural risk minimization,SRM)是为了防止过拟合而提出来的策略。等价于正则化(regularization)。
结构风险在经验风险上增加了正则化项(regularizer)或罚项(penalty term)， $J (f)$ 为模型的复杂度，表示了对复杂模型的惩罚。 $\lambda \ge 0$ 是系数，权衡经验风险和模型复杂度

$R_{srm}(f)=\frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))+\lambda J(f)$

结构风险最小化的策略认为结构风险最小的模型是最优的模型，即求解最优化问题：

$\min_{f\in\mathcal{F}} \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))+\lambda J(f)$

算法指学习模型的具体计算方法。统计学习问题归结为最优化问题，统计学习算法成为求解最优化问题的算法。

1.4 模型评估与模型选择

给定损失函数时，基于损失函数的模型训练误差(training error)和测试误差(test error)即学习方法评估的标准。学习和评估采样的损失函数未必一致，最好一致。
训练误差是模型 $Y=\hat{f}(X)$ 关于训练数据集的平均损失， $N$ 是训练样本容量
$R_{emp}(\hat{f})=\frac{1}{N}\sum_{i=1}^{N}L(y_i,\hat{f}(x_i))$
测试误差是模型 $Y=\hat{f}(X)$ 关于测试数据集的平均损失， $N^{'}$ 是测试样本容量
$e_{test}=\frac{1}{N'}\sum_{i=1}^{N'}L(y_i,\hat{f}(x_i))$
当损失函数是0-1损失时，测试误差即测试数据集上的误差率(error rate)，其中 $I$ 是指示函数(indicator function)，True为1，False为0
$e_{test}=\frac{1}{N'}\sum_{i=1}^{N'}I(y_i \neq \hat{f}(x_i))$
对应的准确率(accuracy)为
$r_{test}=\frac{1}{N'}\sum_{i=1}^{N'}I(y_i = \hat{f}(x_i))$
对未知数据的预测能力称为泛化能力(generalization ability)
对于假设空间中不同复杂度(如不同参数个数)的模型，我们期望所选择的模型要逼近真模型，具体地：所选择的模型与真模型的参数个数相同、参数向量相近
过拟合(over-fitting)，指模型包含参数过多，导致模型在已知数据上预测很好，而对未知数据预测很差的现象。
过拟合示意图
选择复杂度适当的模型，使测试误差最小。两种常用的模型选择方法有：正则化和交叉验证

1.5 正则化与交叉验证

正则化是结构风险最小化策略的实现，即在经验风险最小化上加一个正则项或罚项，作用是选择经验风险和模型复杂同时较小的模型。一般具有如下形式：

$\min_{f\in \mathcal{F}}\frac{1}{N}\sum_{i=1}^{N} L(y_i,f(x_i))+\lambda J(f)$

正则化符合奥卡姆剃刀(Occam’s razor)原理，即能够很好地解释已知数据并十分简单的才是最好的模型。
从贝叶斯估计角度看，正则化项对应模型的先验概率，即假设简单模型有较大的先验概率。
正则化项一般是模型复杂度的单调增函数，如参数向量的范数， $\|w\|$ 为参数向量 $w$ 的 $L_2$ 范数， $w\|_1$ 为 $L_1$ 范数。

$L(w)=\frac{1}{N}\sum_{i=1}^{N}(f(x_i;w)-y_i)^2+\frac{\lambda}{2}\|w\|^2\\ L(w)=\frac{1}{N}\sum_{i=1}^{N}(f(x_i;w)-y_i)^2+\lambda\|w\|_1$

【延伸：范数】
- 0范数，向量中非零元素的个数。
- 1范数，为绝对值之和。
- 2范数，就是通常意义上的模。
- p范数， $\|x \|_p=(\sum\limits_{i=1}^{N} |x_i|^p)^{\frac{1}{p}}$
- $\infty$ 范数， $\|x\|_{\infty} = arg \max_{i}{|x_i|}$

交叉验证(cross validation)：重复使用数据组合训练集、测试集，在此基础上反复进行训练、测试以及模型选择。
- 简单交叉验证：随机分为两部分，如70%和30%，选择测试误差最小模型
- S折交叉验证：且分为S份互不相交、大小相同的子集，每次S-1份训练，1份测试，重复进行S次，选择平均测试误差最小的那个模型
- 留一交叉验证：S这交叉验证的特殊情形， $S = N$ ，在数据缺乏情况下使用

1.6 泛化能力

泛化能力(generalization ability)指该方法学习到的模型对未知数据的预测能力。泛化误差(generalization error)反映学习方法的泛化能力，也是所学到的模型的期望风险，公式如下， $\hat{f}$ 为习得的模型。

$KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ R_{exp}(\h…$

泛化能力的分析往往通过泛化误差上界(generalization error bound)进行。性质：
- 是样本容量的函数，当样本容量增加时，泛化上界趋于0
- 是假设空间容量的函数，假设空间容量越大，模型越难学，泛化误差上界越大。

【定理1.1（泛化误差上界）】

对二类分类问题，当假设空间是有限个函数的集合 $\mathcal{F}=\{f_1,f_2,...,f_d\}$ 时，对任意一个函数 $f\in \mathcal{F}$ ，至少以概率 $1-\delta,0<\delta<1$ ，以下不等式成立：
$R(f)\le \hat{R}(f)+\varepsilon(d,N,\delta)$
其中：
$\varepsilon(d,N,\delta)=\sqrt{\frac{1}{2N}(\log d+\log \frac{1}{\delta})}$
- 不等式左侧 $R (f)$ 是泛化误差，右侧是泛化误差上界；
- 右侧第1项是训练误差，训练误差越小，泛化误差越小；
- 第2项是 $N$ 的单调减函数， $N$ 趋近于无穷时为0；是 $\sqrt{\log d}$ 阶的函数，假设空间包含的函数越多，值越大

1.7 生成模型和判别模型

监督学习方法可以分为生成方法(generative approach)和判别方法(discriminative approach)，所学到的模型称为生成模型(generative model)和判别模型(discriminative model)
生成方法由数据学习联合概率分布 $P (X, Y)$ ，然后求出条件概率分布 $P (Y ∣ X)$ 作为预测的模型，即生成模型。如：朴素贝叶斯法、隐马尔可夫模型。
$P(Y|X)=\frac{P(X,Y)}{P(X)}$
判别方法由数据直接学习决策决策函数 $f (X)$ 或条件概率分布 $P (Y ∣ X)$ 作为预测的模型，即判别模型。如：k近邻法、感知机、决策树、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法和条件随机场等。
生成方法的特点：可以还原出联合概率分布 $P (X, Y)$ ，判别方法不能；学习收敛速度更快，当样本容量增加时，学到的模型更快收敛于真实模型；存在隐变量时，仍可以使用，而判别方法不能。判别方法的特点：直接学习条件概率分布 $P (Y ∣ X)$ 或决策函数 $f (X)$ ，准确率往往更高；可以对数据进行各种程度的抽象、定义特征和使用，简化学习问题。

1.8 监督学习应用

监督学习的应用主要三个方面：分类问题、标注问题、回归问题。
输出变量 $Y$ 为有限个离散值时，预测问题称为分类问题。学习到的分类模型或分类决策函数，称为分类器(classifier)。分类器对新的输入进行输出的预测，称为分类(classification)。可能的输出称为类别(class)。类别有多个时，称为多类分类问题。
分类器性能评价指标一般为分类准确率。
对二分类问题，常用评价指标是精确率(precision)和召回率(recall)，根据实际类别和预测结果分为4类
- TP：将正类预测为正类
- FN：将正类预测为负类
- FP：将负类预测为正类
- TN：将负类预测为负类
- 精确率： $P=\frac{TP}{TP+FP}$
- 召回率： $R=\frac{TP}{TP+FN}$
- $F_1$ 值为精确率和召回率的调和平均值： $\frac{2}{F_1}=\frac{1}{P}+\frac{1}{R}=\frac{2TP}{2TP+FP+FN}$

【补充】
- 4个值的理解
【延伸：TPR、FPR、ROC、AUC】

标注问题的输入是一个观测序列，输出是一个标记序列或状态序列
即对一个观测序列 $x_{N+1}=(x_{N+1}^{(1)},x_{N+1}^{(2)},...,x_{N+1}^{(n)})^T$ 找到使条件概率 $P((y_{N+1}^{(1)},y_{N+1}^{(2)},...,y_{N+1}^{(n)})^T|(x_{N+1}^{(1)},x_{N+1}^{(2)},...,x_{N+1}^{(n)})^T)$ 最大的标记序列 $y_{N+1}=(y_{N+1}^{(1)},y_{N+1}^{(2)},...,y_{N+1}^{(n)})^T$ 。
标注常用的统计学习方法有：隐马尔可夫模型、条件随机场
标注问题在信息抽取、自然语言处理等领域广泛应用，是这些领域的基本问题。如词性标注(part of speech tagging)
回归问题(regression)的学习等价于函数拟合，选择一条函数曲线使其很好地拟合已知数据且很好地预测位置数据
回归问题按照变量个数，分为一元回归和多元回归，按输入变量和输出变量间的关系，分为线性回归和非线性回归。

人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
每日一题——二叉树的直径 tt555555555555 面经算法题 C语言数据结构算法 leetcode
二叉树的直径问题描述示例示例1示例2提示问题分析算法设计代码实现复杂度分析测试用例测试用例1测试用例2总结问题描述给定一棵二叉树的根节点，返回该树的直径。二叉树的直径是指树中任意两个节点之间最长路径的长度。这条路径可能经过也可能不经过根节点root。两节点之间路径的长度由它们之间边数表示。示例示例1输入：root=[1,2,3,4,5]输出：3解释：最长路径的长度为3，例如路径[4,2,1,3]或
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
从关键词到权重：TF-IDF算法解析多巴胺与内啡肽. 机器学习 tf-idf 算法机器学习
文章目录前言一、TF-IDF：关键词的“价值”评估师二、TF-IDF的计算：拆解关键词的“价值”三、TF-IDF的应用：从搜索引擎到文本挖掘四、代码实现：从《红楼梦》中提取核心关键词1、分卷处理1.1代码功能1.2代码实现1.2.1、读取文件1.2.2逐行处理1.2.3.关闭文件2、分词与停用词过滤2.1代码功能2.2代码实现2.2.1读取分卷内容构建DataFrame：2.2.2分词与停用词过滤
【算法学习之路】12.DFS 零零时算法学习之路深度优先算法学习 c++开发语言数据结构全排列
DFS前言一.DFS简介二.思路三.缺点四.三种类型五.题目1.2前言我会将一些常用的算法以及对应的题单给写完，形成一套完整的算法体系，以及大量的各个难度的题目，目前算法也写了几篇，题单正在更新，其他的也会陆陆续续的更新，希望大家点赞收藏我会尽快更新的！！！一.DFS简介1.深度优先搜索，是一种用于遍历或搜索树或图的算法。所谓深度优先，就是说每次搜尝试向更深的节点走。2.在搜索算法中，该DFS常常
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
成为编程大佬！！-----＞数据结构与算法（2）——顺序表！！ Elnaij 算法数据结构 c语言
前言：线性表是数据结构与算法的重中之重，所有具有线性逻辑结构的数据结构，都能称为线性表。这篇文章我们先来讨论线性表中的顺序表，顺序表和线性表都是后续实现栈，树，串和图等等结构的重要基础。目录❀简单介绍线性表❀顺序表❀顺序表的存储❀动态存储❀静态存储❀静态存储与动态存储的优缺点❀顺序表操作❀1.初始化顺序表❀2.销毁顺序表❀3.插入数据❀插入数据之判断已满否❀插入操作之尾插❀插入操作之头插❀插入数据
字符串模式匹配——Brute-Force暴力查找算法以及KMP算法具象图解，超级详细！！ Elnaij 算法数据结构 c语言
目录前言1.串的模式匹配算法目的1.1Brute-Force算法图解Brute-force算法Brute-force暴力查找算法的弊端1.2KMP算法next数组1.2.1Getnext——求next数组的函数图解Getnext函数Getnext函数总结1.2.2KMP模式匹配操作KMP匹配过程图解KMP算法总结结束语：前言这两个算法，尤其是KMP算法，可以说是让许多算法小白头痛的了。如果你也十分
HarmonyOS开发，A持有B，B引用A的场景会不会导致内存泄漏，代码示例告诉你答案 MardaWang HarmonyOS NEXT OpenHarmony harmonyos 华为
问题：A持有B，B引用A的场景会不会导致内存泄漏？答案：方舟虚拟机的内存管理和GC采用的是根可达算法，根可达算法可以解决循环引用问题，不会导致A引用B，B引用A的内存泄漏。根可达算法原理根可达算法以一系列被称为“根对象”（如栈中的局部变量、静态变量等）作为起始点，从这些根对象开始向下搜索，能够被搜索到的对象被认为是可达对象，而那些无法被搜索到的对象则被判定为不可达对象，会在垃圾回收时被清理。所以，
【etcd】茉菇 etcd 数据库
一、ETCD简介etcd是一个由CoreOS团队开发的开源项目，旨在提供一个高可用的、分布式的、一致的键值存储，用于配置共享和服务发现。尽管它看起来像一个键值存储，但etcd的设计目标远远超出了传统数据库的功能范围。etcd的核心特性包括：高可用性和容错性：etcd使用Raft共识算法来确保数据的一致性和服务的高可用性。这意味着即使集群中的某些节点出现故障，etcd也能继续提供服务，并保证数据的一
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
【打卡d5】快速排序归并排序吧啦吧啦吡叭卜排序算法算法 java
快速排序算法模板——模板题AcWing785.快速排序voidquick_sort(intq[],intl,intr){if(l>=r)return;inti=l-1,j=r+1,x=q[(l+r)/2];while(ix);if(i=r)return;intmid=（l+r）>>1;merge_sort(q,l,mid);merge_sort(q,mid+1,r);intk=0,i=l,j=mi
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
探索AI知识库的无限潜力：定义、应用与未来展望知识库知识库管理知识库软件
一、AI知识库的定义AI知识库，作为人工智能技术与传统知识库概念的融合，是指利用人工智能算法和技术构建、管理和维护的信息存储系统。它不仅包含了大量的结构化、半结构化和非结构化数据，还具备智能检索、推理分析、自我学习和优化等高级功能。AI知识库通过模拟人类的认知过程，实现了对知识的有效组织和高效利用，为各种应用场景提供了强大的支持。二、AI知识库的应用1.客户服务与支持在电子商务领域，AI知识库的应
【Go基础】Go入门与实践资源帖小超人冲鸭 golang 开发语言后端
看到好的持续更新……Go系统教程从语法讲起：李文周博客七天快速上手项目Go测试驱动开发博客孔令飞项目开发实战课程，孔令飞图文教程《Go语言高级编程》书籍Go算法刷题模板Go实战项目KV系统crawlab分布式爬虫平台seaweedfs分布式文件系统Cloudreve云盘系统gfast后台管理系统（基于GoFrame）alist多存储文件列表（基于Gin、React）Yearning开源SQL审核平
【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
基于粒子滤波与卡尔曼滤波的锂离子电池放电时间预测与使用特征研究算法如诗电池建模(RUL BC)粒子滤波锂离子电池放电时间预测
基于粒子滤波与卡尔曼滤波的锂离子电池放电时间预测与使用特征研究一、研究背景与意义锂离子电池作为现代储能系统的核心组件，其放电时间（End-of-DischargeTime,EOD）的准确预测对电池管理系统（BMS）的可靠性和安全性至关重要。传统方法（如安时积分法）易受噪声、温度漂移等因素干扰，而基于状态估计的滤波算法（粒子滤波/PF、卡尔曼滤波/KF）通过动态更新模型参数，能显著提升预测精度。二、
选择排序算法解析与代码实例展示程序员总部 java 排序算法算法 java
选择排序是一种简单、直观的排序算法，适合用来处理小规模的数据。它的基本思想是每次从待排序的元素中选择最小的元素，然后将其放到已排序序列的末尾。听起来挺简单吧？接下来，让我们详细了解一下选择排序的工作原理、代码实现和一些性能特点。选择排序的步骤可以分为几个关键部分：初始状态：假设我们有一个数组，里面存放了一系列的数字。比如说，数组是[64,25,12,22,11]。在排序之前，这些数字是无序的。选择
Ai斗地主智能出牌算法 zzzzzzzzzzzw___ ——灌水算法人工智能斗地主
去年有想写个斗地主的小游戏，自己玩玩。找了很多资料，后来好不容易在网上找到了一个AI算法。转过的的时候是贴在自己电脑的TXT文本上，再次感谢下原作者。现在借花献佛发给你参考下。我以前写过一个斗地主机器人。思路如下，希望对你有帮助。斗地主AI设计一、牌型1火箭：大小王在一起的牌型，即双王牌，此牌型最大，什么牌型都可以打。2炸弹：相同点数的四张牌在一起的牌型，比如四条A。除火箭外，它可以打任何牌型，炸
基于android平台的斗地主AI 清源Eamonmon cocos2d-x学习笔记
本软件是基于android平台的斗地主AI，我们在源代码的基础之上，旨在改进AI的算法，使玩家具有更丰富的体验感，让NPC可以更为智能。（一）玩法解析：（1）发牌和叫牌：一副扑克54张，先为每个人发17张，剩下的3张作为底牌，玩家视自己手中的牌来确定自己是否叫牌。按顺序叫牌，谁出的分多谁就是地主，一般分数有1分，2分，3分。地主的底牌需要给其他玩家看过后才能拿到手中，最后地主20张牌，农民分别17
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
深度学习在医学影像分析中的应用：DeepSeek系统的实践与探索 Evaporator Core #深度学习 #DeepSeek快速入门 DeepSeek进阶开发与应用深度学习人工智能
随着人工智能技术的迅猛发展，深度学习在医学领域的应用逐渐成为研究热点。医学影像分析作为医疗诊断的重要组成部分，正受益于深度学习技术的突破。DeepSeek系统是一种基于深度学习的医学影像分析平台，旨在通过高效、精准的算法辅助医生进行疾病诊断和治疗决策。本文将深入探讨DeepSeek系统的技术原理、实现方法及其在医学影像分析中的实际应用，并结合代码示例展示其核心功能。1.DeepSeek系统的技术架
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
STOPWATCH类抗争到底zhy 前端
在C#中，Stopwatch类属于System.Diagnostics命名空间，它的主要用途是精准测量代码块的执行时间。在性能分析、算法优化以及其他需要时间测量的场景里，这个类非常实用。下面为你详细介绍Stopwatch类。基本使用步骤1.引入命名空间usingSystem.Diagnostics;2.创建Stopwatch实例Stopwatchstopwatch=newStopwatch();3
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

【统计学习方法】学习笔记-第1章-统计学习及监督学习概论

【统计学习方法】学习笔记-第1章-统计学习及监督学习概论

1.1 统计学习

1.2 统计学习的分类

基本分类

按模型分类

按算法分类

按技巧分类

1.3 统计学习方法三要素

1.4 模型评估与模型选择

1.5 正则化与交叉验证

1.6 泛化能力

1.7 生成模型和判别模型

1.8 监督学习应用

你可能感兴趣的:(统计学习方法,读书笔记,机器学习,算法,统计学习方法,机器学习,数据挖掘)