王小希ww

第一章、统计学习方法概论

文章目录

- 第一章、统计学习方法概论
- - 1、统计学习的特点
  - 2、统计学习的研究
  - 3、统计学习方法的基本步骤
  - 3、监督学习
  - - 3.1 基本概念
    - - 1）输入变量 & 输入空间 & 特征向量 & 特征空间
      - 2）输出变量 & 输出空间
      - 3）训练集
      - 4）预测任务的分类
    - 3.2 问题的形式化
    - 3.3、小总结
  - 4、统计学习的三要素
  - - 4.1 假设空间(模型)
    - 4.2 策略
    - - 1）策略是什么
      - 2）评价准则
      - 3）基本策略
    - 4.3 算法
  - 5、模型评估与模型选择
  - - 5.1 训练误差 & 测试误差
    - 5.2 模型选择
    - - 1）过拟合
      - 2）模型复杂度
      - 3）交叉验证
  - 6、泛化能力
  - - 6.1 泛化误差
    - 6.2 泛化误差上界
  - 7、生成模型和判别模型
  - - 7.1 生成方法 & 生成模型
    - 7.2 判别方法 & 判别模型
    - 7.3 分类问题
    - - 1）正类 & 负类
      - 2）分类指标
      - 3）分类方法
      - 4）应用
    - 7.4 标注问题
    - 7.5 回归问题
  - 8、用python解决一元回归的函数拟合问题
  - - 8.1 最小二乘法（最小平方法）
    - 8.2 L-1，L-2正则化
    - 8.3 代码中的一些注意点
    - 8.4 代码演示
  - 9、本章问题
  - 10、参考文档

1、统计学习的特点

计算机基于数据构建模型，并运用模型对数据进行预测和分析。其中研究对象是数据，研究的目的是对未知的数据进行预测。
统计学习建立在一个基本假设上：同类数据具有一定的统计规律性。
- 统计规律：对大量偶然事件整体起作用的规律，表现这些事物整体的本质和必然的联系。https://baike.baidu.com/item/统计规律/894528?fr=aladdin
统计学习是概率论、统计学、信息论、计算理论、最优化理论、计算机科学等多个领域的交叉学科。

2、统计学习的研究

统计学习方法：旨在开发新的学习方法
统计学习理论：探求统计学习方法的有效性与效率
统计学习应用： 考虑将统计学习方法应用到实际问题中

3、统计学习方法的基本步骤

1）得到一个有限的训练数据集合
2）确定包含所有可能模型的假设空间，及学习模型的集合
3）确定模型选择的准则，及学习的策略
4）实现求解最优模型的算法，及学习的算法
5）通过学习方法选择最优模型
6）利用学习的最优模型对新数据进行预测或分析

3、监督学习

统计学习包括监督学习，半监督学习，非监督学习，强化学习。

监督学习利用训练数据集学习的一个模型，再用模型对测试样本集进行预测，训练集往往是人工给出的，所以称之为监督学习。

3.1 基本概念

1）输入变量 & 输入空间 & 特征向量 & 特征空间

输入空间是在输入过程中，所有可能取值的集合。
输入变量常用X表示，输入变量的值用x表示
每个具体的输入是一个实例 x，用特征向量（列向量）表示

$x^{(i)}$ 表示x的第i个特征
$x_{(i)}$ 表示多个输入变量X中的第i个
我的理解是：
- 每个特征向量对应一个实例x；有多少个特征向量，输入变量X就有多少个实例xi。
- 输入变量X可以统计实例个数，而输入空间指的是一个二维矩阵
- 实例是从输入空间映射到特征空间上的，这样特征空间相比于输入空间，可以有着更高的维度。

2）输出变量 & 输出空间

输出空间是在输出过程中，所有可能取值的集合
输出变量常用Y表示，输出变量的值用y表示

3）训练集

由输入（或特征向量）与输出对组成

4）预测任务的分类

人们根据输入，输出变量的不同类型，对预测任务给予不同的名称

回归问题：X，Y均为连续变量的预测

分类问题：X，Y均为有限个离散变量的预测

标注问题：X，Y均为变量序列的预测

3.2 问题的形式化

监督学习分为学习和预测过程
学习系统：学习系统通过不断的尝试，选取最好的模型。学习系统利用给定的训练数据集，通过学习（或训练）得到一个模型，表示为**条件概率分布 P^(Y|X)或决策函数Y＝ f^{(X)**。条件概率分布P}(Y|X)或决策函数Y＝ f^{(X)描述输入与输出随机变量之间的映射关系。(用P},f^表示学习系统学习得到的那个模型)
预测系统：在预测过程中，预测系统对于给定的测试样本集中的输入 $x_{N+1}$ ，由模型 $y_{N+1} = arg max_{N+1} P(y_{N+1} | x_{N+1})$ 或 $y_{N+1}$ ＝ $f(x_{N+1} )$ 给出相应的输出 $y_{N+1}$ 。

3.3、小总结

监督学习可以归结为最小化一个目标函数。求模型多项式的参数，防止过拟合。

4、统计学习的三要素

方法 = 模型 + 策略 + 算法

4.1 假设空间(模型)

假设空间用F表示，模型的假设空间包含所有可能的条件概率分布或决策函数。
假设决策函数是输入变量的线性函数，那么模型的假设空间就是所有这些线性函数构成的函数集合。假设空间中的模型一般有无穷多个。假设空间（模型）的确定意味着学习范围的确定。
假设空间的定义

决策函数的集合：

条件概率分布的集合：
参数向量 & 参数空间：
- 参数向量θ取值于n维欧氏空间 $R^n$ ，称为参数空间
- 假设“真模型”是决策函数，输入变量X的每一个实例x只有一个特征，那么我们可以用泰勒多项式来逼近这个真模型，得到最优的模型。其中多项式中特征x前的系数随着多项式的次数变化而变化，所有的系数构成一个参数向量。

4.2 策略

1）策略是什么

使它对已知训练数据和未知测试数据，在给定的评价准则下有最优的预测。我的理解是：利用训练集学习模型，在给定的评价标准下选择最优的模型，这个模型可以使得测试误差最小。

2）评价准则

损失函数
- 预测值f(X)与真实值Y可能一致也可能不一致，用一个损失函数或代价函数来度量预测错误的程度
- 损失函数是f(X)和Y的非负实值函数
- 损失函数的类型：
  - 0-1损失函数：
  - 平方损失函数：
  - 绝对损失函数：
  - 对数损失函数：
- 备注：如何理解对数损失函数
  - 对数损失函数和似然函数的关系
    - 似然函数是指一组参数在一堆数据下的似然值，这个值等于每一条数据在该组参数下的条件概率之积，公式为P(theta | x1, ..., xn) = P(x1 | theta) * ... * P(xn | theta)其中theta是参数，xi是数据。
    - 贝叶斯公式 P(si | c) = P(c | si) * P(si)，如果实例c只有一个特征（一个句子），则P(c| si) 是最简单的似然函数，其中P(si)是先验概率，是接下来介绍的结构风险中的正则化项（罚项）
    - 对数损失函数 = 负对数似然
    - 对数损失函数最小 = - log（最大似然函数）
  - 为什么要取对数？
    - 累乘变累加，方便计算
  - 为什么要取负数？
    - 概率值是[0,1]内，所以概率值累乘会变成一个很小的值。
    - 根据对数的图像，如果以大于1的数作为对数的底数，累乘的概率值一定小于0，而损失函数是非负实值，所以要取负。
风险函数 & 经验风险
- 损失函数值越小，模型就越好。由于模型的输入、输出（X,Y）是随机变量，遵循联合分布P(X,Y)，所以损失函数的期望是
  
  这是理论上模型f(X)关于联合分布P(X,Y)的平均意义下的损失，称为风险函数（risk function）或期望损失（expected loss）。
  
  由于联合概率分布在学习系统中是未知的（无论是学习模型，还是生成模型），所以期望损失（风险函数）无法计算，只能用经验风险来替代。
- 模型f(X)关于训练数据集的平均损失成为经验风险或者经验损失。
- 期望风险和经验风险的关系：
  
  期望风险 $R_{exp} (f)$ 是模型关于联合分布的期望损失，经验风险 $R_{emp} (f)$ 是模型关于训练样本集的平均损失。根据大数定律，当样本容量N趋于无穷时，经验风险 $R_{emp} (f)$ 趋于期望风险 $R_{exp} (f)$ 。
结构风险
- 在经验风险上加上表示模型复杂度的正则化项（regularizer）或罚项（penalty term）
- $J (f)$ 为模型的复杂度，复杂度表示了对复杂模型的惩罚，模型 $f$ 越复杂，复杂度 $J (f)$ 就越大；反之，模型 $f$ 越简单，复杂度 $J (f)$ 就越小
- λ≥0是系数，用以权衡经验风险和模型复杂度
- 对正则化项的理解
  - 正则化项可以取不同的形式。例如，回归问题中，损失函数是平方损失，正则化项可以是参数向量的L-2 范数。$||w||_2 $表示参数向量w的L-2 范数。
  - 正则化项也可以是参数向量的L-1 范数。 $w||_1$ 表示参数向量w的L-1 范数。
- 为什么要引入范数？
  - 二维实数空间中，取两个点（1，1）和（0，3），这个时候我们就没办法比较它们之间的大小，因为它们不是可以比较的实数，于是我们引入范数这个概念，把我们的（1，1）和（0，3）通过范数分别映射到实数\sqrt{2} 和 3 ，这样我们就比较这两个点了。所以你可以看到，范数它其实是一个函数，它把不能比较的向量转换成可以比较的实数。
  - 范数它其实是一个函数，它把不能比较的向量转换成可以比较的实数方便比较大小
- 范数的分类？
  - 矩阵范数：描述矩阵引起变化的大小，AX=B，矩阵X变化了A个量级，然后成为了B。
  - 向量范数：描述向量在空间中的大小。向量范数的通用公式为L-P范数。
    - L-0范数：用来统计向量中非零元素的个数。0的任何次方都为0
    - L-1范数 $W||_1$ ：向量中所有元素的绝对值之和。可用于优化中去除没有取值的信息，又称稀疏规则算子。稀疏规则化算子的引入就是为了完成特征自动选择的光荣使命，它会学习地去掉这些没有信息的特征，也就是把这些特征对应的权重置为0。
    - L-2范数 $W||_2$ ：典型应用——欧式距离。可用于优化正则化项，避免过拟合。
    - L-∞范数：计算向量中的最大值。

3）基本策略

经验风险最小化
- 经验风险最小化的策略认为，经验风险最小的模型是最优的模型。
- 当模型是条件概率分布，损失函数是对数损失函数时，经验风险最小化就等价于极大似然估计。
- 缺点：当样本容量很小时，会产生“过拟合(over-fitting)”现象。
结构风险最小化
- 结构风险最小化（structural risk minimization，SRM）是为了防止过拟合而提出来的策略。结构风险最小化等价于正则化（regularization）。
- 当模型是条件概率分布、损失函数是对数损失函数、模型复杂度由模型的先验概率表示时，结构风险最小化就等价于最大后验概率估计。
- 结构风险小需要经验风险与模型复杂度同时小。结构风险小的模型往往对训练数据以及未知的测试数据都有较好的预测。
- 注意训练集的个数N和参数的个数M不一定相等，所以加号不表示数组依次相加，而是数组的合并。
- 这里可以参考两个视频进行理解正则化
  
  什么是 L1 L2 正规化正则化 Regularization (深度学习 deep learning)
  
  10分钟彻底搞懂L2正则化–转自台大老师李宏毅2020

4.3 算法

模型学习的算法（算法）是指学习模型的具体计算方法
统计学习问题归结为最优化问题，统计学习的算法成为求解最优化问题的算法。

5、模型评估与模型选择

5.1 训练误差 & 测试误差

基于损失函数的模型的训练误差（training error）和模型的测试误差（test error）就自然成为学习方法评估的标准。最终的目的是使测试误差达到最小。
训练误差：模型Y= f^(X)关于训练数据集的平均损失（N为训练样本容量）
测试误差：模型Y= f^(X)关于测试数据集的平均损失（N’为测试样本容量）
- 误差率(error rate)：当损失函数是0-1损失时，测试误差就变成了常见的测试数据集上的误差率，y != f(x)时为1，否则为0
- 准确率(accuracy)：注意准确率的计算不使用0-1损失函数，而与之相反，即y = f(x)时为1，否则为0
- 误差率和准确率的关系
统计学习方法具体采用的损失函数未必是评估时使用的损失函数。当然，让两者一致是比较理想的。

5.2 模型选择

当假设空间含有不同复杂度（例如，不同的参数个数）的模型时，就要面临模型选择（model selection）的问题。所选择的模型要与真模型的参数个数相同，所选择的模型的参数向量与真模型的参数向量相近。

1）过拟合

指学习时选择的模型所包含的参数过多，以致于出现这一模型对已知数据预测得很好，但对未知数据预测得很差的现象
举个栗子：

如果M＝9，多项式曲线通过每个数据点，训练误差为0。从对给定训练数据拟合的角度来说，效果是最好的。但是，因为训练数据本身存在噪声，这种拟合曲线对未知数据的预测能力往往并不是最好的。

当M＝3时，多项式曲线对训练数据拟合效果足够好，模型也比较简单，是一个较好的选择。

2）模型复杂度

随着 多项式次数（模型复杂度） 的增加，训练误差会减小，直至趋向于0，但测试误差却不如此，它会随着多项式次数（模型复杂度）的增加先减小而后增大。多项式的次数越大，输入变量x前的次数越多（参数就越多），模型复杂度越大。
训练误差和测试误差与模型复杂度的关系

3）交叉验证

如果给定的样本数据充足，进行模型选择的一种简单方法是随机地将数据集切分成三部分，分别为训练集（training set）、验证集（validation set）和测试集（test set）。训练集用来训练模型，验证集用于模型的选择，而测试集用于最终对学习方法的评估。由于验证集有足够多的数据，用它对模型进行选择也是有效的。
但是，在许多实际应用中数据是不充足的。为了选择好的模型，可以采用交叉验证方法。交叉验证的基本想法是重复地使用数据；把给定的数据进行切分，将切分的数据集组合为训练集与测试集，在此基础上反复地进行训练、测试以及模型选择。
交叉验证的分类
- 简单交叉验证：
  - 从全部的训练数据S中随机选择s的样例作为训练集，剩余的作为测试集（验证集）。
  - 一般来说，简单交叉验证并非一种交叉验证，因为数据并没有交叉使用。
  - 由于验证集和训练集是分开的，就避免了过拟合的现象。
- S折交叉验证：
  - 将全部训练集 S分成 k个不相交的子集，假设 S中的训练样例个数为 m，那么每一个子集有 m/k 个训练样例，相应的子集称作 {s1,s2,…,sk}。每次从分好的子集中里面，拿出一个作为测试集（验证集），其它k-1个作为训练集。
- 留一交叉验证：
  - 留一法就是每次只留下一个样本做测试集，其它样本做训练集，如果有k个样本，则需要训练k次，测试k次。
  - 留一法计算最繁琐，但样本利用率最高。适合于小样本的情况。

6、泛化能力

学习方法的泛化能力（generalization ability）是指由该方法学习到的模型对未知数据的预测能力

6.1 泛化误差

测试误差的缺点：现实中采用最多的办法是通过测试误差来评价学习方法的泛化能力。但这种评价是依赖于测试数据集的。因为测试数据集是有限的，很有可能由此得到的评价结果是不可靠的。
如果学到的模型是f^，那么用这个模型对未知数据预测的误差即为泛化误差。事实上，泛化误差就是所学习到的模型的期望风险。
举个栗子：二类分类问题的泛化误差

6.2 泛化误差上界

它是样本容量的函数，当样本容量增加时，泛化上界趋于0；它是假设空间容量（capacity）的函数，假设空间容量越大，模型就越难学，泛化误差上界就越大。
泛化误差 & 泛化误差上界：
- 不等式（1.25）左端 $R (f)$ 是泛化误差，右端即为泛化误差上界。
- 在泛化误差上界中，第1项是训练误差(经验风险），训练误差越小，泛化误差也越小。
- 第2项 $ξ (d ， N, σ)$ 是N的单调递减函数，当N趋于无穷时趋于0；d是函数的个数，同时它也是** $l o g d$ 阶的函数**，假设空间F包含的函数越多，其值越大。(假设空间容量越大，模型就越难学，泛化误差上界就越大)

7、生成模型和判别模型

监督学习方法又可以分为生成方法（generative approach）和判别方法（discriminative approach）。所学到的模型分别称为生成模型（generative model）和判别模型（discriminative model）。

7.1 生成方法 & 生成模型

生成方法由数据学习联合概率分布P(X,Y)，然后**求出条件概率分布P(Y|X)**作为预测的模型，即生成模型：
生成方法的特点：
生成方法可以还原出联合概率分布P(X,Y)，而判别方法则不能；
生成方法的学习收敛速度更快，即当样本容量增加的时候，学到的模型可以更快地收敛于真实模型；
当存在隐变量时，仍可以用生成方法学习，此时判别方法就不能用
典型的生成模型有：朴素贝叶斯法和隐马尔可夫模型

7.2 判别方法 & 判别模型

判别方法由数据 直接学习决策函数f(X)或者条件概率分布P(Y|X) 作为预测的模型，即判别模型。
判别方法的特点：
- 判别方法直接学习的是条件概率P(Y|X)或决策函数f(X)，直接面对预测，往往学习的准确率更高；
- 由于直接学习P(Y|X)或f(X)，可以对数据进行各种程度上的抽象、定义特征并使用特征，因此可以简化学习问题。
典型的判别模型包括：k近邻法、感知机、决策树、逻辑斯谛回归模型、最大熵模型、支持向量机、提升方法和条件随机场等

7.3 分类问题

在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。这时，输入变量X可以是离散的，也可以是连续的。监督学习从数据中学习一个分类模型或分类决策函数，称为分类器（classifier）。
可能的输出称为类（class）。分类的类别为多个时，称为多类分类问题。本书主要讨论二类分类问题。

1）正类 & 负类

通常以关注的类为正类，其他类为负类，分类器在测试数据集上的预测或正确或不正确，4种情况出现的总数分别记作：

TP——将正类预测为正类数；
FN——将正类预测为负类数；
FP——将负类预测为正类数；
TN——将负类预测为负类数。

2）分类指标

准确率（见模型评估那部分）
精准率（查准率） ＝检索出的相关信息量 / 检索出的信息总量
召回率（查全率） ＝检索出的相关信息量 / 系统中的相关信息总量

附上两图便于理解

3）分类方法

k近邻法、感知机、朴素贝叶斯法、决策树、决策列表、逻辑斯谛回归模型、支持向量机、提升方法、贝叶斯网络、神经网络、Winnow等

4）应用

7.4 标注问题

可以认为标注问题是分类问题的一个推广，标注问题又是更复杂的结构预测（structure prediction）问题的简单形式。
举个栗子：输入：At Microsoft Research，输出：At/O Microsoft/B Research/E
标注方法：隐马尔可夫模型、条件随机场。
应用：

7.5 回归问题

回归用于预测输入变量（自变量）和输出变量（因变量）之间的关系。回归模型正是表示从输入变量到输出变量之间映射的函数。
回归问题的学习等价于函数拟合：选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。
并不是所有的拟合问题都是回归问题，只要模型是函数（用函数进行分类），就存在拟合问题。
回归的分类：
- 回归问题按照输入变量的个数，分为一元回归和多元回归
- 按照输入变量和输出变量之间关系的类型即模型的类型，分为线性回归和非线性回归
  - 线性和非线性的区别是是否可以用直线将样本划分开
  - 线性就是每个变量的指数都是1，而非线性就是至少有一个变量的指数不是1
回归方法：

回归学习最常用的损失函数是平方损失函数，在此情况下，回归问题可以由著名的最小二乘法（least squares）求解。
应用：

8、用python解决一元回归的函数拟合问题

了解代码之前，先回顾之前的概念，以及了解一些新概念

8.1 最小二乘法（最小平方法）

https://www.zhihu.com/question/37031188

8.2 L-1，L-2正则化

李航老师书中给的公式如下，即结构风险最小化=正则化= min（经验风险 + 正则化项）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DjihJUP1-1594783584760)(./img/Snipaste_2020-06-30_19-55-38.png)]

但是在python代码中，用了以下语句实现正则化，会发现得到的ret数组不是在原来的ret数组上，依次加上L-2范数。而是将ret数组和L-2范数得到的数组，合并成一个大的数组。

 # 经验风险[0.31972216 -0.28167978 -0.64009235 -0.23185228 0.37735337 1.20983082 1.89436378 2.78654483
 # 3.26961043 3.81895049] M+1个数

# 结构风险[3.19722159e-01 -2.81679783e-01 -6.40092347e-01 -2.31852279e-01 3.77353372e-01 1.20983082e+00
# 1.89436378e+00 2.78654483e+00 3.26961043e+00 3.81895049e+00 4.97801504e-04 8.94357277e-04 2.55965917e-	
# 03 6.09320893e-03 5.60403167e-03 3.88778337e-04 5.08172080e-03 2.28874924e-03 2.16380642e-03  	
# 2.23093071e-03] 2*(M+1)个数

设想一下，经验风险是平均损失，与训练数据个数N有关；而模型复杂度与参数个数有关， $J (f)$ 数组中元素个数，无论用是L-1范数，还是L-2范数计算，个数都与多项式的次数M有关；无法保证N和M相等，则数组不能相加，只能合并。

residuals_func_regularization:
...
 	print(len(ret)," ", len(np.sqrt(0.5*regularization*np.square(p))))
	ret = ret + np.sqrt(0.5*regularization*np.square(p));
    
main:
    # 在[0,1]区间内产生10个真实点(x,y)
    x_points = np.linspace(0,1,10)
    y_points = real_func(x_points)
... 
	y_polyld_reg = fit_func(fitting(3, x_points, y_points, residuals_func_regularization), x)
    plt.plot(x, y_polyld_reg, label="regulation curve", color="cyan", lw=2.0)
 
---
ValueError: operands could not be broadcast together with shapes (10,) (4,)

当参数 $w_i$ 越趋近于0时，function越光滑。在计算机制图中，会经常遇到曲线的光滑处理。曲线的光滑方法有许多，大体有两种类型：https://baike.baidu.com/item/曲线光滑/5170091
- 一种要求拟合曲线严格通过各离散点
- 另一种则根据点列的大体趋势按最小二乘法原理来拟合一条曲线，该曲线与离散点有较小偏离。
L2正规化可以使function更加光滑，而L1正规化得到的解是不稳定的

8.3 代码中的一些注意点

Q1：为什么用噪点来训练得到最优的参数向量（(p_lsq_9[0]），但是在绘制图像时不用噪点x_point，y_point来绘制?

A1：因为如果用噪点画function，画不出光滑曲线，应该用非噪点的x，代入选择的最优模型，求y_point进行绘制。
```
plt.plot(x, fit_func(p_lsq_9[0], x), label='fitted curve')
```
np.poly1d()的使用：通过传入长度为M+1的参数列表，构造M次多项式
通过最小二乘法（fitting方法里）+ 残差函数（或者正则化的残差函数）训练得到最优的参数列表

8.4 代码演示

import numpy as np;
from scipy.optimize import leastsq
import matplotlib.pyplot as plt;

# 目标函数sin(2πx)
def real_func(x):
    return np.sin(2*np.pi*x)

# 关于一个变量x的(次数依次递减）多项式函数
# p是一个多项式的系数列表，次数为M，系数个数为M+1
def fit_func(p,x):
    # np.poly1d的使用
    # >>> p = np.poly1d([1, 2, 3])
    # |  >>> print(np.poly1d(p))
    # |     2
    # |  1 x + 2 x + 3
    # |
    # |  Evaluate the polynomial at :math:`x = 0.5`:
    # |
    # |  >>> p(0.5)
    # |  4.25
    f = np.poly1d(p)
    return f(x)

# 经验风险(残差函数):预测值 - 真实值
def residual_func(p,x,y):
    return fit_func(p,x) - y

# 在residual_func经验风险的基础上，加上正则化项，变成结构风险
def residuals_func_regularization(p, x, y):

    regularization = 0.0001

    # 经验风险
    ret = residual_func(p,x,y)
    # print("经验风险", ret)
    # 经验风险[0.31972216 -0.28167978 -0.64009235 -0.23185228 0.37735337 1.20983082 1.89436378 2.78654483
    # 3.26961043 3.81895049] M+1个数
    

    # 结构风险(np。append()将两个数组合并成一个大数组，不是两个数组依次相加)
    ret = np.append(ret, np.sqrt(0.5*regularization*np.square(p))) # L2范数作为正则化项
    # print("结构风险", ret)
    # 结构风险[3.19722159e-01 -2.81679783e-01 -6.40092347e-01 -2.31852279e-01 3.77353372e-01 1.20983082e+00
    # 1.89436378e+00 2.78654483e+00 3.26961043e+00 3.81895049e+00 4.97801504e-04 8.94357277e-04 2.55965917e-	# 03 6.09320893e-03 5.60403167e-03 3.88778337e-04 5.08172080e-03 2.28874924e-03 2.16380642e-03  			# 2.23093071e-03] 2*(M+1)个数
    
    #如果是经验风险和正则化项依次相加，则有可能报错
    #print(len(ret)," ", len(np.sqrt(0.5*regularization*np.square(p))))
    #ret = ret + np.sqrt(0.5*regularization*np.square(p));
    
    return ret


# 函数参数是：M=多项式次数，x=训练集（噪点）横坐标，y=训练集（噪点）纵坐标，func=最小二乘法中选择的策略函数
# 通过产生M+1个随机的，[0,1]内的系数列表
# 使用最小二乘法的策略来避免学习到的多项式过拟合于目标函数
# 返回值是最优参数列表
def fitting(M, x, y, func):

    # dn表示数组的维度
    # out: ndarray, shape
    # ``(d0, d1, ..., dn)``
    # Random values.
    # >> > np.random.rand(3, 2)
    # array([[0.14022471, 0.96360618],  # random
    #        [0.37601032, 0.25528411],  # random
    #        [0.49313049, 0.94909878]])  # random
    p_init = np.random.rand(M + 1)
    print("初始参数列表", p_init)

    # 最小二乘法得到最优的参数向量（多项式中的系数（权值）列表）
    # leastsq()第一个参数为模型选择的策略函数：损失函数，经验风险函数，结构风险函数
    # 这里使用residual_func()，或者residuals_func_regularization作为策略函数，目的是得到最优的p_init列表,
    # args=(x,y)为residual_func()剩余的参数
    # 注意第一个参数是函数名，不带()
    p_lsq = leastsq(func,p_init,args=(x,y))
    print('最优参数列表', p_lsq[0])

    return p_lsq[0]

if __name__ == '__main__':
    # 在[0,1]区间内产生10个真实点(x,y)
    x_points = np.linspace(0,1,10)
    y_points = real_func(x_points)

    # 将真实点加上正态分布噪音的目标函数的值，作为训练集，散点表示
    # 参数loc(float)：正态分布的均值，对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布，
    # 参数scale(float)：正态分布的标准差，对应分布的宽度，scale越大，正态分布的曲线越矮胖，scale越小，曲线越高瘦。
    # 参数size(int 或者整数元组)：输出的值赋在shape里，默认为None。
    y_points = [np.random.normal(0, 0.1) + y1 for y1 in y_points]
    plt.scatter(x_points, y_points, label="noise",color="blue")

    # 在[0,1]区间内产生1000个点，汇出光滑的目标函数曲线
    x = np.linspace(0,1,1000)
    y = real_func(x)
    plt.plot(x, y, label="real curve",color="red",lw=2.0)

    # 利用噪点来训练多项式
    # 1、利用最小二乘法得到最优的参数列表  print(fitting(3,x_points,y_points))
    # 2、将最优的参数列表，噪点x代入fit_func(p, x),得到最优的多项式，即最优的模型
    y_polyld = fit_func(fitting(9,x_points,y_points,residual_func),x)
    plt.plot(x, y_polyld, label="fitted curve", color="green",lw=2.0)

    
    y_polyld_reg = fit_func(fitting(9, x_points, y_points, residuals_func_regularization), x)
    plt.plot(x, y_polyld_reg, label="regulation curve", color="cyan", lw=2.0)

    # 把所有图例放在一起
    plt.legend()
    plt.show()

9、本章问题

Q1：L-2范数的正则化项如何避免过拟合？

Q2：回归问题的学习等价于函数拟合，是不是说函数拟合问题只在回归问题中出现，在分类，标注问题中没出现？

Q3：联合概率分布是不是在判别模型中是未知的，但在生成模型中是已知的？

A3：联合概率在学习系统中是未知的

10、参考文档

1、对数损失函数

2、对数损失函数是如何度量损失的？

3、机器学习中的范数规则化之（一）L0、L1与L2范数

4、L1,L2,L0区别，为什么可以防止过拟合 - 简书

5、范数的用途、什么是范数

6、交叉验证（Cross Validation）

7、交叉验证（简单交叉验证、k折交叉验证、留一法）

8、李航统计学习方法笔记——泛化误差上界

9、机器学习面试之生成模型VS判别模型

10、如何解释召回率与精确率？

11、怎样区分线性和非线性_线性与非线性的区别（线性分析、线性模型）

12、最小二乘法的本质是什么？

13、什么是 L1 L2 正规化正则化 Regularization (深度学习 deep learning)

14、10分钟彻底搞懂L2正则化–转自台大老师李宏毅2020

15、李航老师的《统计学习方法》

你可能感兴趣的:(#,统计学习方法,统计学习方法概论)

儿童文学概论（第五章中国儿童文学历史发展概述）考文学
编辑|考文学排版|考文学一、古代儿童文学遗产的范围：1民间文学：神话、传说、寓言、儿歌2古典文学3启蒙读物二、怎样看待我国现代之前的儿童文学？应从哪几方面去发掘我国史前儿童文学的遗产？对中国来说，儿童这个概念是在现代文学史上才出现的，所以我们把现代以前的儿童文学叫做史前儿童文学。在现代之前，我们克不曾把儿童当作文学的独立的独立的读者对象，但这并不表明我们就缺乏这方面的文学遗产；纵然我国古代的文学形
【笔记】自然语言处理NLP---概论 xhanZ NLP相关
（from人文学院开设课程）目录1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自然语言的特点1.1.2自然语言处理研究的意义1.1.3国外研究现状1.2NLP的方法、特点和规律1.2.1理性主义与经验主义1.2.2语料库语言学：经验主义研究方法1.2.3汉语语言处理的方法1.2.4基于知识图谱的深度学习1.自然语言处理概论1.1自然语言处理研究的意义、历史与现状1.1.1自
决策树基础概论 Hello.Reader 算法算法决策树
1.概述在机器学习领域，决策树（DecisionTree）是一种高度直观且广泛应用的算法。它通过一系列简单的是/否问题，将复杂的决策过程分解为一棵树状结构，使得分类或回归问题的解决过程直观明了。决策树的最大特点在于可解释性强，每个决策节点都代表对特定特征的判断，最终根据这些判断得出结论。决策树适用于多种任务，例如：垃圾邮件分类、病症诊断、股票价格预测等。不仅如此，它还可以处理连续变量和离散变量，并
【统计学习方法读书笔记】（四）朴素贝叶斯法 Y.G Bingo 统计学习方法人工智能统计学习概率概率论
终于到了贝叶斯估计这章了，贝叶斯估计在我心中一直是很重要的地位，不过发现书中只用了不到10页介绍这一章，深度内容后，发现贝叶斯估计的基础公式确实不多，但是由于正态分布在生活中的普遍性，贝叶斯估计才应用的非常多吧！默认输入变量用XXX表示，输出变量用YYY表示概率公式描述：P(X=x)P(X=x)P(X=x)：表示当X=xX=xX=x时的概率P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣
复习筑基班第一课恩典芳芳
中原焦点团队讲13中24卓芳分享第369天概论走进心理世界1.首先我们要了解什么是心理学，走进心理学世界。关于对于心理学的解读。学习心理学不是为了猜测人心，也不是就能猜透人心，更多的还是去好奇未知，和对方去探讨，让对方能够呈现更多更深的东西。学习心理学的人也不代表无情绪。学习心理学是为了什么？为了完成自我的觉察和意识，你对自己会有更多的了解，对自己的性格特点、行为模式、以及对自己的优势、擅长、情绪
【统计学习方法】感知机 jyyym ml苦手机器学习
一、前言感知机是FrankRosenblatt在1957年就职于康奈尔航空实验室时所发明的一种人工神经网络。它可以被视为一种最简单的前馈神经网络，是一种二元线性分类器。Seemoredetailsinwikipdia感知机.本篇blog将从统计学习方法三要素即模型、策略、算法三个方面介绍感知机，并给出相应代码实现。二、模型假设输入空间是x∈Rnx\in{R^n}x∈Rn，输出空间是y∈{−1,+1
4.8小学数学教育概论洪叶啊
课堂以同学表演本组的魔术为开始，不同的魔术有不同的原理，不仅如此，老师会给幸运的表演小组赠送礼物。就这样，课堂以开心轻松的氛围开场。今天的数学概论课，老师依旧换了一种新的授课方式。今天的授课方式是微课。自新冠疫情一来，微课的普及大大增加，同时微课中形象生动的动画演示较之现场教学更为简单易懂。老师也给我们布置了一项任务———小组合作录制一节小学五年级的数学微课。这不仅是对新的事物的探索，还是对我们学
文件上传和下载提笔忘字_波
一、概论在Web应用系统开发中，文件上传和下载功能是非常常用的功能，今天来讲一下JavaWeb中的文件上传和下载功能的实现。对于文件上传，浏览器在上传的过程中是将文件以流的形式提交到服务器端的，如果直接使用Servlet获取上传文件的输入流然后再解析里面的请求参数是比较麻烦，所以一般选择采用apache的开源工具common-fileupload这个文件上传组件。这个common-fileuplo
数据库系统概论——关系数据库标准语言SQL time_silence 数据库 sql mysql
//[]中的内容不是必须内容，是为了实现某些功能时才添加的。1、SQL概述SQL(StructuredQueryLanguage）：结构化查询语言，是关系数据库的标准语言。1.1SQL的特点综合统一高度非过程化面向集合的操作方式以同一种语法结构提供多种使用方式语言简洁，易学易懂九个核心词SQL功能动词数据查询SELECT数据定义CREATE，DROP，ALTER数据操纵INSERT，UPDATE，
D066+3组王艳+《高效能人士的七个习惯》读书笔记俩果妈咪
今天阅读了第二章七个习惯概论和第三章积极主动两块内容。在第二章里，提到了七个习惯的训练、养成以及顺序都是紧密相关，环环相扣，但有一点却是不变的：由内而外。作者一直强调内在的改变从而影响外在。可能在当今社会里，浮躁的人也越来越多，大家都比较习惯于一些表相带来的诱惑，忽略了本质的重要性。第三章开始介绍七个习惯，首先还是积极主动。看到这里，心里不免有些失落，就积极主动而言，我不是没有做，而是没能坚持做！
2022-3-21晨间日记爱吃苹果的短发女孩
今天是什么日子起床：7:00就寝：11:00天气：雨心情：一个太阳纪念日：封校第二个星期任务清单昨日完成的任务，最重要的三件事：仰卧起坐：三十个。学习计划：药理学，药学概论第N次复习改进：天气太冷了，有点懒惰，不想出去看书，暂居寝室习惯养成：早起早睡每天运动半小时周目标·完成进度一切计划中学习·信息·阅读复试准备中健康·饮食·锻炼没有吃外卖，没有吃零食，基本在食堂打饭人际·家人·朋友室友一起成堆结
数据库系统概论：数据库完整性 ZachOn1y 数据库数据库 oracle 后端数据库系统 mysql
引言数据库是现代信息系统的心脏，数据的准确性和一致性对于业务流程至关重要。数据库完整性是确保数据质量的基石，它涵盖了数据的正确性、相容性和一致性，是数据安全与业务连续性的保障。数据库完整性是指数据的精确性、可靠性和逻辑一致性，它防止数据库中出现不符合语义的数据。其目的是保护数据免受意外或恶意破坏，确保数据在逻辑上的一致性、正确性和有效性。数据库完整性基本概念数据库的完整性（integrity）是指
初中地理教材分析和研究pdf weixin_43946945 pdf 经验分享学习
作者:初中地理教材分析和研究组编出版社:北京：人民教育出版社ISBN:7107080938资源大小:108.07MB目录如下（包含下载说明：http://literalink.top/resource/detail/7187026923246063616）概论1一、我国中学地理教材的沿革1二、初中地理教学的目的、任务11三、确定初中地理教学内容的原则12四、初中地理教材的结构特点14五、初中地理教
自考出成绩了逊珏逸卓
昨天，自考终于出成绩了。美学再一次失败，54分。虽然分数提高了，但还是没及格。论文及格了，90分，也算对得起那一天之内写6000个字的手了。还有三门！还有三门！注意:两句的语气和感情是不一样的！还有《美学》、《语言学概论》和《英语（二）》三门！看招生院的消息，现在很多专业都停了。看来是考自考的人越来越少了。我一定要在汉语言文学（本科）停考前考出来啊！看论文答辩那天的情形，汉语言文学专业还是有不少考
【信息安全概论】笔记 Hugo_McQueen 网络安全安全
课堂中零零散散记录的笔记网络攻击对信息造成的影响：对信息进行阻断、截获、篡改、伪造、破坏信息的可用性黑客的普遍含义是指对信息系统的非法入侵者？黑客的普遍含义是指违反或不遵守网络和信息系统安全策略和安全规则的行为人黑客攻击手段：破解密码猜测口令木马病毒攻击炸弹攻击拒绝服务攻击电子邮件诈骗软件后门网络监听其他入侵技术网络攻击的工作流程：目标探测和信息收集自身隐藏利用漏洞入侵主机稳固和扩大战果清除日志威
数据库概论第三章 SQL Server 代码时叶Shey SQL 数据库概论 SQL Server
仅供参考建表CREATEDATABASECourseSelection_assignment;USECourseSelection_assignment;CREATESCHEMA"S-T"AUTHORIZATIONdb_accessadmin;CREATETABLE[S-T].Student(SnoCHAR(8)PRIMARYKEY,SnameVARCHAR(20)UNIQUE,SsexCHAR(
2022.4.1小学数学教育概论 Morris111
今天涂老师向我们展示了数学魔术的魅力，在了解了好几个妙趣横生的魔术之后，我深深地感受到了涂老师不仅有丰富的专业知识，还有着成熟的教育经验。这节课使我对数学魔术产生了很大的兴趣。在大多数人心里觉得数学很枯燥，也离他们的生活很遥远。为了考试，为了升学而不得不学习数学。数学果真这样无趣吗？我现在认为并不是这样。美国著名数学科普作家马丁加德纳就是一位出类拔萃的魔术大师，他曾写过一本名著《数学与魔术的诡异》
Python大数据学习day01——大数据开发概论笨小孩124 python 学习总结大数据学习 python
目录大数据概念大数据特点大数据应用场景大数据分析业务步骤大数据职业规划大数据学习路线1.大数据解决问题海量数据存储——海量数据运算——海量数据迁移2.大数据特点（大、多、值、快、信）数据体量大种类和来源多源化实现低价值密度速度快数据的质量准确可信3.大数据应用4.大数据分析步骤明确分析目的思路——数据收集——数据处理（ETL）——数据分析——数据展现——撰写报告5.大数据职业规划6.大数据学习路线
CMake构建学习笔记8-OpenSceneGraph库的构建 charlee44 CMake C++学习 CMake C++构建 OpenSceneGraph
1.概论在连续构建了zlib、libpng、libjpeg、libtiff、giflib以及freetype这几个库之后，接下来我们就要来一个大的，构建OpenSceneGraph这样大型库。OpenSceneGraph（简称OSG）是一个高性能、跨平台的三维图形应用程序框架，广泛应用于科学可视化、模拟仿真、游戏开发等领域。理论上来说，上述几个库不是OSG的必须依赖库，但是将它们作为依赖库构建，O
刘衍文老先生长逝一日进步一点
据报道，2021年8月17日晚，古典文学研究专家、上海市文史馆馆员、华东师范大学中文系教授刘衍文先生因病逝世，享年一百零一岁。第一时间得知刘衍文老先生长逝，很是悲痛。我没有机会见到老先生，但是我对他非常崇拜。上大学的时候，学的《文学概论》，是他老人家所著，老师讲课的时候也讲过很多老人家的故事，后来到学校图书馆也看到关于老先生的许多故事，对老先生非常敬佩。老先生虽然与世长辞，但是他的书籍，他的故事会
读书感悟3——《行者无疆》谷雨Jennifer
2019年双11的时候，淘宝买了余秋雨先生的一套书，一直没有看，尽管心里总惦记着，就是动不了手。快过年的时候，从中挑了一本《行者无疆》带回老家，闷了半个月，看了别的，平时要补课，补完《文学概论》，也看完了别的两本书，这才拿起《行者无疆》读起来。在读的过程中，就有一种强烈的感觉，冥冥之中是否有天意，因为读这本书的时间，太巧了。如果我年前读，我还没学《文学概论》，没有听过一些西方学者的名字，对他们没有
赠书 | 李航老师的蓝皮书茗创科技
赠书活动统计学习方法“统计机器学习方法是实现智能化目标的最有效的手段，统计机器学习是各种智能性处理研究领域中的核心技术，并且在这些领域的发展及应用中起着决定性的作用。”作者简介李航，日本京都大学电气电子工程系毕业，日本东京大学计算机科学博士。北京大学、南京大学客座教授，IEEE会士，ACM杰出科学家，CCF高级会员。研究方向包括信息检索，自然语言处理，统计机器学习，及数据挖掘。曾出版过三部学术专著
opengl基础概论 Hello.Reader C++图形数据库策略模式 c++
一.概述OpenGL（OpenGraphicsLibrary）是一种跨平台的图形库，用于在计算机上实现2D和3D图形。它由KhronosGroup组织开发，是一个开放标准，可以在各种操作系统上运行，包括Windows、Linux、macOS和Android。OpenGL的主要功能是提供一组函数，用于创建和控制图形对象，例如点、线、三角形、四边形和多边形。它还提供了着色器编程，用于计算每个像素的颜色
软件工程概论之软件概述 Ethereal490 网络技能软件工程
1.软件的定义：软件不是程序，而是程序、数据、以及开发、使用、维护程序需要的所有文档的完整集合。2.程序：程序是为了解决某个特定问题而用程序设计语言描述的适合计算机处理的语句序列，由开发人员设计和编码。3.文档：文档是软件开发活动的记录，主要供人们阅读，既可以用于专业人员和用户之间的通信和交流，也可以用于软件开发过程的管理和运行阶段的维护。4.软件的特点：软件是一种逻辑产品，没有具体的物理实体，具
C++竞赛初阶L1-14-第六单元-数组(31~33课)541: T456471 计算书费麓小墨哥 c++免费文章 c++开发语言青少年编程算法数据结构
题目内容下面是一个图书的单价表：计算概论28.9元/本数据结构与算法32.7元/本数字逻辑45.6元/本C++程序设计教程78元/本人工智能35元/本计算机体系结构86.2元/本编译原理27.8元/本操作系统43元/本计算机网络56元/本JAVA程序设计65元/本依次给定每种图书购买的数量，编程计算应付的总费用。输入格式输入一行，含10个非负整数，每两个整数之间有一个空格。第i个整数表示要购买上述
60秒早报 2023-03-19 星期日南门里美
【微语】多数事并不如你想的那样一帆风顺，但你却因此成为了可以乘风破浪的人。1、西南大学开设公务员专业：学制1年，学费1920元，课程计划里包括申论概论、行政能力测试基础、公文写作等；2、港媒：中国所持美债从去年12月的8671亿美元降至8594亿美元，连续第6个月下降，创2009年5月以来最低点；3、导游因游客未购物大骂游客，海口通报：导游顶格罚款5万元、吊销导游证，旅行社罚款30万元，并责令改正
大学播音主持都学什么内容？播音主持专业学什么？配音新手圈
有些喜欢播音主持并且犹豫要不要报考这个大学专业的小伙伴们就会想要了解大学播音主持都学什么内容吧，毕竟如果不够了解就直接选择这个专业真的等选择完进去学习以后才知道这个专业并不是自己想要学习的东西那就来不及了。下面是小编为大家整理出来的一些播音主持专业学习的内容，请往下看吧。大学播音主持专业主要学习的课程有：播音发声、播音创作基础、广播播音主持、电视播音主持、文艺作品演播学概论、新闻学概论、新闻采编、
今天任务打卡坚持蹦哒
语言学概论两小时视频看完第八课了百词斩十个单词扇贝听力句子课文打卡有书快看雨果《悲惨世界》小仲马《茶花女》福楼拜《羊脂球》卢梭《忏悔录》今天完成这些，一千字写作还没完，马上马上！年纪大了脑子不好使，写啥也没有准备，也没有章程，好苦恼啊！
计算机通信与网络,计算机通信与网络基础 weixin_39559079 计算机通信与网络
一、概论1.计算机通信与网络的主要发展过程第一阶段：面向终端的计算机网络。第二阶段：多个计算机互连的计算机网络。第三阶段：面向标准化的计算机网络。第四阶段：面向全球互连的计算机网络。2.我国的网络发展现状3.计算机通信与网络的定义和组成计算机网络的定义：把分布在不同地点且具有独立功能的多个计算机，通过通信设备和线路连接起来，在功能完善的网络软件运行环境下，以实现网络中资源共享为目标的系统。计算机网
【网络基础】计算机网络概论有敬无畏乐以忘忧网络基础
网络的产生计算机网络是计算机技术和通信技术结合的产物。计算机硬件技术的发展提升了计算机的运算速度，而通信技术的发展提升了数据交换的速度。两者的结合推动了计算机网络的迅速发展。网络的定义：计算机网络是利用通信设备和通信线路，将地理位置分散的、具有独立功能的多个计算机系统互连起来，通过网络软件实现网络中资源共享、数据通信的系统。网络的发展面向终端的计算机通信网——单机系统单机系统的缺点：（1）主机既要
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那