李烟云

数据挖掘导论学习笔记第五章分类算法

5.1基于规则的分类器

基于规则的分类器的规则用析取范式 $R=(r_1\lor r_2 \lor \cdots \lor r_k)$ 表示。R称作规则集， $r_i$ 是分类规则或析取项。
每一个分类规则都可以表示为：规则前件 $\Rightarrow$ 规则后件
如果规则r的前件和记录x的属性匹配，则称r覆盖x。称r被激发或被触发。
分类规则的质量可以用覆盖率(coverage)和准确率(accuracy)来度量 $Coverage(r)=\frac{|A|}{|D|} \\ \\ \\ Accuracy(r)=\frac{|A\cap y|}{|A|}$
其中|A|表示符合前件的记录数， $|A\cap y|$ 表示同时符合前后件的记录数，|D|表示记录总数。

5.1.1基于规则的分类器的工作原理

互斥规则（Mutually Exclusive Rule）:如果规则集R中不存在两条规则被同一条记录触发，则称R中的规则是互斥的。。
穷举规则（Exhaustive Rule）：如果对属性值任一组合，R中都有一条规则加以覆盖，则称规则集R具有穷举覆盖
默认规则：默认规则的前件为空，当所有其他规则失效时触发。
有序规则（ordered rule）：在这种方法中，规则集中的规则按照优先级降序排列，优先级的定义方法很多（覆盖率准确率总描述长度规则产生的顺序等）。有序的规则集也称决策表（decision list）
无序规则：允许一条测试记录触发多条分类规则，每触发一次看做一次对类的加权投票（权数可以是准确率），最后根据票数将记录分配到某个类标号。这优于有序原则，建模开销也小，但对测试记录分类很繁重。
本章主要讨论使用有序规则的分类器

5.1.2规则的排序方案

基于规则的排序方案
基于类的排序方案：大部分分类器都是用这种方案

5.1.4规则提取的直接方法

直接方法就是直接从数据中提取分类规则

Rule_set = {}; //学习的规则集初试为空
 E是训练记录，Y是类的有序集
for 每个类c do
     repeat
         Rule = Learn_One_Rule(E,Att-vals,y)
         从E中删除被Rule覆盖的训练记录;
      until终止条件被满足
      Rule_set = Rule_set +Rule%追加rule到列表尾部
end for
把默认规则插入到规则列表的尾部
返回Rule_set

1.Learn-One-Rule函数

Learn_One_Rule采用一种贪心的增长规则。他先产生一个初始规则r。并不断对该规则求精，直到满足某种终止条件为止。
规则增长策略 ：
（1）从一般到特殊：从初始规则r（前件为空）开始，添加合取项来提高规则质量
（2）从特殊到一般：相反
束状搜索：算法维护k个最佳候选规则，个候选规则在其前件中添加或删除合取项独立增长。评估候选规则的质量，选择k个进行下一轮迭代
规则评估 由于准确率存在片面性，我们提供以下几种方法来解决问题。

（1）可以使用统计检验剪出覆盖率较低的规则。似然比（likelihood ratio）统计量： $R=2\sum_{i=1}^kf_i\log_2{f_i/e_i}$
k表示类的个数， $f_i$ 表示被规则覆盖的类i的样本的观测频率， $e_i$ 是规则做随机猜测的期望频率。R是满足自由度为k-1的 $\chi^2$ 分布。较大的R值说明该规则作出的正确预测数显著的大于随机猜测的结果。
（2）可以使用一种考虑规则覆盖率的评估度量：
$Laplace=\frac{f_++1}{n+k} \\ m估计=\frac{f_++k p_+}{n+k}$
n为规则覆盖的样例数， $f_+$ 为规则覆盖的正例数，k是总类数，p+是正类的先验概率。由于规则的覆盖率，两个度量达到了准确率和正类先验概率之间的平衡。当覆盖率很高时，他们都趋向于规则的准确率 $f_+/n$
（3）另一种可使用的评估度量是考虑规则的支持度计数的评估度量。
$FOIL信息增益=p_1 \times (\log_2{\frac{p_1}{p_1+n_1}}-\log_2{\frac{p_0}{p_0+n_0}})$ 在这种度量中，规则的支持度计数对应于它所覆盖的正例数。假设规则r：A→+覆盖p0个正例和n0个反例，增加新的合取项B，扩展后的规则r‘=A且B→+覆盖p1个正例，和n1个反例。
该度量值与p1和p1/(p1_n1)成正比，所以它倾向于选择那些高支持度计数和高准确率的规则。
规则剪枝，对于Learn——One——Rule函数产生的的规则，也可以像对第四章中的决策树一样剪枝，来改善泛化误差。就像4.4节介绍的那样。

2.顺序覆盖基本原理

规则提取出来后，顺序覆盖算法必须删除该规则所覆盖的所有正例和反例。

3.RIPPER算法

该算法的复杂度几乎线性的随着训练样例的数目增长，并且特别适合为类分布不均衡的数据及建立模型。它也能很好地处理噪声数据集。
RIPPER算法按照类的频率进行排序 $(y_1,y_2,\cdots,y_c)$ 其中，y1是最不频繁地类，在第一次迭代中，先把属于 $y_1$ 的样例标记为正例，把其他的样例标记为反例，使用顺序覆盖算法产生规则，直到剩下最后一个类yc，把它作为默认类。
规则增长使用FOIL信息增益来组安泽最佳合取项添加到规则前件中。通过计算 $(p - n) / (p + n)$ 来判断是否剪枝，其中p，n分别是被覆盖的确认集中的正例与反例数，如果该度量值增加就进行剪枝。
建立规则及规则生成后，他所覆盖的所有正反例都要删除。只要改规则不违反最小描述长度原则的终止条件，就将它添加到规则集中。具体措施需要进一步学习。

5.1.5规则提取的间接方法

现在介绍一种基于决策树生成规则集的方法。
决策树从根节点到叶节点的路径表示为一个分类规则，这样的规则是完全且互斥的。但可以进行简化，尽管简化后不再互斥，但更容易解释。
规则产生 只要简化后的规则的误差率低于原规则的误差率，就保留其中悲观误差率最低的规则。重复进行知道不能再改进为止。
规则排序 C4.5规则算法使用基于类的排序方案定序。同一个类的规则分到同一个子集中。计算每个子集的总描述长度，然后各类按照总描述长度由小到大排序。类的总描述长度等于 $L_{exception}+g\times L_{model}$ ,其中 $L_{exception}$ 是对误分类样例编码所需要的比特位数， $L_model$ 是对模型编码所需要的比特位数，而g是调节参数。调节参数取决于模型中冗余属性的数量。

基于规则分类器的特征

基于规则的分类器可以构造更为复杂的决策边界
基于类的规则的定序方法非常是预处理类分布不平均的数据集
性能可与决策树分类模型媲美

5.2 最近邻分类器

积极学习方法（eager learner）：先建模，再预测（一劳永逸）
消极学习方法（lazy learner）：比如Rote分类器，记住训练数据，匹配时再分类（现学现卖）
最近邻分类器：把每个样例看做d维空间的一个数据点，d是属性个数。
如果数据点的近邻中有多个类标号，则将该数据点指派到其最近邻的多数类。k值得选择很重要，k太小，分类器容易受到容易受到噪声影响产生过拟合，如果k太大可能会误分类。

5.2.1 算法

k-最近邻分类算法
令k是最近邻数目，D是训练样例集合
for 每个测试样例z=(x',y') do
	计算z和每个样例(x,y)∈D之间的距离d(x',x)
	选择离x最近的k个样例的集合D_z
	y'=argmax∑I（v=y_i）

距离加权表决 $y'=\argmax_v \sum_{(x_i,y_i)\in D_i}w_i \times I(v=y_i)$ 其中，v是类标号，y是一个最近邻的类标号， $I (.)$ 是指示函数，参数为真返回1，否则为0。 $w_i=1/d$ ,表示远离z的样例对分类的影响变弱。

5.3贝叶斯分类器

贝叶斯分类器是一种对属性集和类变量的概率关系建模的方法。

5.3.3 朴素贝叶斯分类器

2.朴素贝叶斯分类器如何工作

对每个类Y计算后验概率： $P(Y|X)=\frac{P(Y)\prod_{i=1}^dP(X_i|Y)}{P(X)}$ 由于对所有的Y，P(X)都是固定的，因此只需要计算条件概率就可以了。

3.估计分类属性的条件概率

对于分类属性 $X_i$ ,根据类y中属性值等于 $x_i$ 的训练实例的比例就可以了，比如7个还清房贷的人里面有3个结婚，那么就是3/7

4.估计连续属性的条件概率

朴素贝叶斯分类有两种方法
1.可以把一个连续属性离散化。这要注意，离散区间的数目不能太多也不能太少。
2.可以将设连续变量服从某种概率分布，然后使用训练数据估计分布的参数。比如正态分布，通过求训练记录的均值和方差来估计条件概率。
在计算条件概率的时候P(Y|X)，X是一个向量，包含多个属性，我们假设多个属性相互独立，所以应该算多个条件概率的乘积 $\prod P(X_i|Y)$

6.条件概率的m估计

上述方法有一个缺点就是，如果有一个属性的类条件概率为0，那么乘积为零。解决该问题的途径就是使用m估计
$P(x_i|y_j)=\frac{n_c+mp}{n+m}$ 其中，n是类 $y_j$ 中的实例总数， $n_c$ 表示类 $y_j$ 的训练样例中的取值 $x_i$ 的样例数，m是称为等价样本大小的参数，而p是用户指定的参数。如果n=0，则条件概率就就是p，因此p可以看做是类y中观察属性值x的先验概率。等价样本大小决定先验概率p与观测概率 $n_c/n$ 之间的平衡。

7.朴素贝叶斯分类器的特征

面对孤立的噪声点，朴素贝叶斯分类器是健壮的。
面对无关属性，也是健壮的。
相关属性可能会降低朴素贝叶斯分类器的性能

5.3.4 贝叶斯误差率

当先验概率不同时，决策边界朝着先验概率较小的类移动。
$Bates\ error \ rate =\int_0^{\hat{x}}P(Y_1|X)dX + \int_{\hat{x}}^{\infty}P(Y_2|X)dX$

5.3.5贝叶斯网络

该方法不需要给定类的所有属性都条件独立。

1.模型表示

贝叶斯信念网络(Bayesian belief networks,BBN ),用图形表示一组随机变量之间的概率关系。它有两个组成部分

一个有向无环图，表示变量之间的依赖关系
一个概率表，把节点和他的直接父节点关联起来。

如图，D是C的父母，是A的祖先，B是C的子女，B是D的后代

如果结点X没有父母结点，则表中只包含先验概率P(X)
如果结点X只有一个父母结点Y，则表中包含条件概率P(X|Y)
如果结点X有多个父母结点，则表中包含条件概率P(X|Y1,…,Yk)

性质1：贝叶斯网络中的一个结点，如果它的父母结点已知，则它的条件独立于它的所有非后代结点。
给定C，B独立于A和D。一条有向路径就是一条规则。

2.建立模型

创建网络结构
估计每一个结点的概率表

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FLmm539Y-1582592758681)(http://image.sciencenet.cn/album/201211/26/15452104kqr04wbr9o66kz.png)]
为了简化模型的计算，我们可以把变量分为原因变量和结果变量，然后规定从原因变量向其对应的结果变量画弧。

4.BBN的特点

1.用图形模型来捕获特定领域的先验知识，网络还可以用来对变量之间的因果依赖关系进行编码
2.构造网络费时费力，但一旦网络结构确定下来，添加新变量就很容易
3.BBN适合处理不完整的数据
4.因为数据和先验知识以概率的方式结合起来了，所以BBN对模型的的过拟合是很鲁棒的。

5.4人工神经网络

5.4.2 多层人工神经网络

在前馈神经网络(feed-foward)中，每一层结点仅和下一层结点相连。在递归(recurrent)神经网络中，允许同一层结点相连或一层结点连到前面各层中的结点
激活函数有很多，雨荨隐藏结点和输出节点的输出值呈非线性关系
因为缺少隐藏结点的真实输出的先验知识，这使得很难确定各隐藏结点的误差项。
我们可以使用梯度下降法，求误差函数的极小值来确定权数，但这也会出现局部最优的问题
反向传播(back-propagation):分为两个阶段，前向阶段和后向阶段。在前项阶段，使用前一次迭代所得到的权值计算网络中每一个神经元的输出值，计算是前项进行的，即先更新k层的权值再更新k+1层权值。在后向阶段，先更新k+1层，再更新k层。运用反向传播的方法，可以用k+1层的误差估计第k层的误差

设计问题

确定输入层结点的数目。对于k元变量，，可以为每一个分类值创建一个分类结点，也可以用 $log_2k$ 个输入节点对k元变量进行编码
选择网络拓部结构。目标函数取决于链上的权值，隐藏结点数和隐藏层数，结点的偏置和激活函数的类型。找拓扑结构的一种方法是，使用足够多的结点和隐藏层的全连接网络然后使用较少的结点重复该建模过程，这种方法非常耗时。另一种方法是，不重复建模过程。而是删除一些结点，然后重复模型评价过程来选择合适的模型复杂度
初始化可以随机赋值

5.4.3人工神经网络的特点

选择合适的拓扑结构防止过拟合很重要
ANN可以处理冗余特征，因为权值是自动学习的，可以很小
对噪声敏感。处理噪声的一种方法是使用确认集来确定模型的泛化误差，另一种是每次迭代把权值减少一个因子
在权值更新公式中添加一个动量项(momentum term)

5.5 支持向量机(supporting vector machine,SVM)

支持向量机可以很好地应用于高维数据，避免了维灾难问题。它使用训练实例的一个子集来表示决策边界，该子集称作支持向量。

5.5.1最大边缘超平面

每个决策边界都对应着一对超平面，超平面之间的距离就是分类器的边缘
基本原理：具有较大边缘的决策边界有更好的决策误差
结构风险最小化理论：在概率 $1-\eta$ 下，分类器的泛化误差在最坏条件下满足 $R\le R_e +\varphi\left( \frac{h}{N},,\frac{\log(N)}{N}\right)$
$R_e$ 是分类器的训练误差、训练样本数N，模型复杂度h即它的能力(capacity)，R表示泛化误差的上界， $\varphi$ 是能力h的单调增函数。
它与4.4.4节中最想描述长度原理十分相似。体现了训练误差和复杂度之间的折中。线性模型的能力和它的边缘逆相关，拥有较小边缘的模型拥有较高的能力

5.5.2线性支持向量机：可分情况

线性SVM寻找具有最大边缘的超平面，因此也被称为最大边缘分类器
1线性决策边界
$KaTeX parse error: Expected & or \\ or \cr or \end at end of input: … \\ end{cases}$
2线性分类器边缘
两个平行的超平面可以表示如下
$,如果w·z+b>0\\ y=-1,如果w·z+b<0$ 两个超平面可以表示为
$b_{i1}:w\bullet x+b=\ \ \ 1\\ b_{i2}:w\bullet x+b=-1$
$d=\frac{2}{||w||}$ d表示边缘大小

3.学习线性SVM模型
为了学习出 $w, b$ 我们得到一个约束
$y_i(w·x_i+b)\ge 1,i=1,2,\cdots,N$
为了求最大边缘，要求 $f(w)=\frac{||w||^2}{2}$ 的最小值
于是我们可以综合写成一个拉格朗日函数的形式
$L_p=\frac{1}{2}{||w||}^2-\sum_{i=1}^N(y_i(w·x_i+b)-1)$
通过对 $w, b$ 求偏导和KKT条以及把 $L_p$ 写成对偶形式
决策边界可以表示成 $\left(\sum_{i=1}^N \lambda_iy_ix_i·x \right)+b=0$
b可以通过求解支持向量公式 $\lambda_i[y_i(w·x_i+b)-1]=0$ 得到，由于lambda通过数值计算得到，因此b可能不唯一，它取决于所使用的支持向量，实践中使用b的平均值做决策边界的参数。

5.5.3不可分情况

类似

5.5.4非线性支持向量机

当我们遇到非线性的分类情况，很难用线性的超平面来划分。因此我们可以使用属性变换的方法变化坐标系，把非线性空间转换成线性空间，但这会导致维灾难。这个问题在后面的叙述中会提到解决办法

学习非线性SVM模型

这个过程和学习线性SVM的过程完全相似，惟一的区别在于用 $\phi(x)$ 来替换一切x，其中 $\phi$ 是x的变换函数

核技术

在原属性中计算的相似度函数K称为核函数（ernel function）.
在非线性SVM中使用的核函数必须满足Mercer定理。这样我们不必知道 $\phi$ 的具体形式，因为核函数可以用x与y的点积形式表示。
比如： $K(x,y)=(x·y+1)^p$ 、 $K(x,y)=tanh(kx·y-\sigma)$

支持向量机的特征

SVM学习问题可以表示为凸优化问题，因此可以求得全局最优解
SVM扩展到多类问题

5.6 组合方法

通过聚集多个分类器的预测来提高准确率。这些技术称为组合(ensemble).组合方法有训练数据构建一组基分类器，通过对每个基分类器的预测进行投票来进行分类。

5.6.1基本原理

如果基分类器实行互独立的（即他们的误差是不相关的），则仅当超过一半的基分类器都预测错误时，组合分类器才会做出错误预测。这种情况下，组合分类器的误差率为：
$e_ensemble=\sum^{25}_{i=12}C_{25}^i\varepsilon^i(1-\varepsilon)^{(25-i)}$ 这里假设有一个25个分类器的组合，每一个基分类器的误差为 $\varepsilon$ ,当 $\varepsilon\gt0.5$ 时组合分类器比不上基分类器。
实际上，基分类器很难做到相互独立，当然也不会完全相似，因此组合还是有优势的。

5.6.2 构建组合分类器的方法

通过处理训练数据集。比如装袋(bagging)和提升(boosting)
通过处理输入特征。比如随机森林算法
通过处理类标号。比如错误-纠正输出编码(error-correcting output coding)
通过处理学习算法。比如在同一个训练数据集上多次执行算法可能得到不同的模型。
组合方法对于不稳定的分类器(unstable classifer)比如决策树、基于规则的分类器、人工神经网络 ,训练样本的可变性是分类器误差的主要来源之一。

5.6.3 偏倚(bias)-方差分解

$d (期望误差) = B i a s + V a r i a n c e + N o i s e$ 期望误差是一个分类器误分一个给定样本的概率。一般来说，分类器关于它的决策边界性质所做的假定越强，分类器的偏倚就越大。实际决策边界与平均决策边界之间的差反映了分类器的偏倚，决策边界的可变性反映了分类器的方差。

5.6.4装袋(bagging)

又称自助聚集(boot strap aggregating),是一种根据均匀概率分布从数据集中重复抽样（有放回）的技术。每个自主样本集都和原数据集一样大。一般来说每个自主样本 $D_i$ 大约包含63%的原训练数据。训练过k个分类器后，测试样本被指派到得票最高的类 $C^(x)=\argmax_y\sum_i\delta(C_i(x)=y)$ 如果参数为真则 $\delta(.)=1$ ，否则等于0
决策树桩(decision stump):他是一个分类器，仅包含一层的二叉决策树，只有一个测试条件 $x\le k$ ，其中k是使得叶结点熵最小的分裂点。
装袋通过降低基分类器方差改善了泛化误差，而且对于噪声数据，装袋不太受过分拟合的影响。装袋的性能依赖于基分类器的稳定性。如果基分类器不稳定那很好，若是稳定的，则误差主要由偏倚产生，分类器达不到改善的效果。

5.6.5提升

提升是一个迭代过程，用来自适应的改变训练样本的分布，使得基分类器聚焦在那些很难分的样本上。它给每一个训练样本赋一个权值，而且可以在每一轮提升结束时自动的提升权值。权值可以用于

用作抽样分布
基分类器使用权值学习有利于高权值样本的模型

不同的提升算法的差别在于

每轮结束时如何更新权值
如何组合每个分类器的预测
下面说一个具体的提升例子AdaBoost算法

5.7不平衡类问题

本节将给出一些为处理不平衡类问题而开发的方法。

5.7.1可选度量

在不平衡数据集中，稀有类比多数类更有意义。对于二元分类，稀有类通常记为正类，而多数类被认为是负类。由此我们得到混淆矩阵

TP —— $f_{++}$
FN —— $f_{+-}$
FP —— $f_{-+}$
TN —— $f_{--}$
**真正率(true positive rate,TPR)或灵敏度(sensitivity)被定义为模型正确预测的正样本比例 $TRP=\frac{TP}{TP+FN}=\frac{f_{++}}{f_{++}+f_{-+}}$
同理真负率(TNR)或特指度(specificity)**被定义为模型正确预测负样本的比例 $TNR=\frac{TN}{TN+FP}$
假正率(FPR) $FPR=\frac{FP}{TN+FP}$
假负率(FNR) $FNR=\frac{FN}{TP+FN}$
召回率®和精度§是两个广泛使用的度量 $p=\frac{TP}{TP+FP}\\ \\r=\frac{TP}{TP+FN}$
精度越高，假正错误越低。召回率越高，真正率越高。因此构建一个最大化精度和召回率是分类算法的主要任务之一。
$加权准确率=\frac{w_1TP+w_4TN}{w_1TP+w_2FP+w_3FN+w_4TN}$

度量	$w_1$	$w_2$	$w_3$	$w_4$
召回率	1	1	0	0
精度	1	0	1	0
$F_{\beta}值$	$\beta^2$ +1	$\beta^2$	1	0
准确率	1	1	1	1

其中
$F_{\beta}值$ 表示召回率与精度之间的一个度量值

5.7.2 接受者操作特征曲线

接受者操作特征(ROC)曲线是显示分类器真正率和假正率之间折中的一种图形化方法。在一个ROC曲线中，TPR沿y轴绘制，FPR沿x轴绘制。
ROC曲线下方的面积（AUC）提供了一个评价的方法
如果模型是完美的，那么AUC=1
如果模型是随机猜测的，那么AUC=0.5
AUC越大，模型越优。
ROC曲线的绘制是一个连续迭代的过程。

5.7.3代价敏感学习

代价矩阵对讲一个类的记录分类到另一个类的惩罚进行编码。 $C (i, j)$ 表示把一个i类预测成为j的代价。在不平衡类问题中，不同的错误的代价也是不一样的，严重的错误代价更大。
代价信息可以用来：

选择用以分类数据的最好的属性
决定子树是否需要修枝
处理训练记录的权值
修改每个叶节点上的决策规则

5.7.4基于抽样的方法

抽样是处理不平衡问题的另一种方法。主要思想是改变实例的分布，从而帮助稀有类在训练数据集中很好地表示。
现有的技术包括，不充分抽样、过分抽样、和两种技术的混合。
考虑一个100个正例1000个负例的记录

不充分抽样：只取100个负样本的随机抽样和正样本组成训练集。（可以多次进行，覆盖更广）
过分抽样：把100个正例复制到1000个。（容易受到噪声影响，过拟合等问题）
混合：对多数类进行不充分抽样，对稀有类进行过分抽样

5.8多类问题

本节给出一些将二类问题推广到多类的方法

一对其他（1-r）方法：将多类问题分解成K个二类问题。为每一个类yi创建一个二类问题，然后构建一个二元分类器，将属于yi的样本从其他类中分离出来。
一对一（1-1）方法：构建K(K-1)/2个二类分类器，每个分类器用来区分一对类（yi，yj）。

纠错输出编码（error-correcting output coding,ECOC）

基本思想是借助于代码字向传输信息中增加一些冗余，从而能使得接收方能发现接受信息中的一些错误，而且如果错误量少还可能回复原始信息。
对于多类学习，每个类yi用一个长度n的唯一位串来表示，称为它的代码字。然后训练n个二元分类器，预测每个代码字串的二进位。如果一个类的代码字与二元分类器的海明距离最近，那么这个类就是检验实例的预测类。海明距离是他们的不同二进位的数目。

Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
学习笔记：oracle online系列：oracle：Per-Process PGA memory limit 认真就输DBA Oracle 学习随笔学习笔记 oracle
我们的文章会在微信公众号IT民工的龙马人生和博客网站(www.htz.pw)同步更新，欢迎关注收藏，也欢迎大家转载，但是请在文章开始地方标注文章出处，谢谢！由于博客中有大量代码，通过页面浏览效果更佳。本文转自朋友的真实案例分享。oracleonline系列：oracle：Per-ProcessPGAmemorylimit前几日，东区某客户的19crac出现了ORA-04030，从报错的trace来
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
DPDK探测设备并初始化分享放大价值 DPDK dpdk probe 设备初始化 mmap
本文整理下之前的学习笔记，基于DPDK17.11版本源码分析。主要看一下DPDK探测网卡设备，并进行初始化的流程，用到了类似kernel中的总线-设备-驱动模型。本文的重点之一是DPDK如何在用户态操作网卡寄存器，这里先给个答案:想要操作网卡寄存器，需要用到网卡的基地址BAR，intel网卡一般使用BAR0就行，通过mmap此文件/sys/bus/pci/devices/'pciaddress'/
第五章算法设计题
以二叉链表作为二叉树的存储结构，编写以下算法：（1）统计二叉树的叶结点个数。[题目分析]如果二叉树为空，返回0，如果二叉树不为空且左右子树为空，返回1，如果二叉树不为空，且左右子树不同时为空，返回左子树中叶子节点个数加上右子树中叶子节点个数。[算法描述]intLeafNodeCount(BiTreeT){if(T==NULL) return0;//如果是空树，则叶子结点个数为0elseif(T
动手学深度学习13.7. 单发多框检测（SSD）-笔记&练习（PyTorch） scdifsn 深度学习笔记 pytorch ssd 单发多框检测（SSD）目标检测 mAP评价
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：45SSD实现【动手学深度学习v2】_哔哩哔哩_bilibili本节教材地址：13.7.单发多框检测（SSD）—动手学深度学习2.0.0documentation本节开源代码：…>d2l-zh>pytorch>chapter_optimization>ssd.ipynb单发多框
动手学深度学习3.3线性回归的简洁实现-笔记&练习（PyTorch） scdifsn 深度学习线性回归笔记 pytorch
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：线性回归的简洁实现_哔哩哔哩_bilibili本节教材地址：3.3.线性回归的简洁实现—动手学深度学习2.0.0documentation(d2l.ai)本节开源代码：...>d2l-zh>pytorch>chapter_linear-networks>linear-regre
Python学习笔记2-垃圾回收机制 Carrie_Lei Python python 学习笔记
Python的垃圾回收机制是自动管理内存的系统，用于回收不再使用的内存，以避免内存泄漏和优化内存使用。Python使用引用计数（ReferenceCounting）和垃圾回收（GarbageCollection）两种方式来管理内存。1.引用计数(ReferenceCounting)引用计数是Python内存管理的基础机制。每个对象都维护一个引用计数器，记录有多少个引用指向该对象。当一个新的引用指向
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第1-11个视频笔记）胡说八道的Dr. Zhu 深度学习 pytorch 学习
本学习笔记源自于B站up主【我是土堆】的视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】本博客是该视频教程中第1-11个视频的详细学习笔记，第12-22个视频、第23-33个视频的详细学习笔记链接如下：PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第12-22个视频笔记）PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第23-33个视频笔记）目录1、P
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
CSC研修计划的书写
博主最近在申请CSC，所以也会更新一下自己的学习笔记，有需要的可以关注我一下，同时有问题大家可以一起交流一下啊一要求（fromCSC官网）①拟留学专业(研究课题)在国内外研究情况及水平；②拟选择的留学国别、留学单位及选择原因(应简单评述对方国家及留学单位在申请人所从事学科、专业领域的水平、优势，申请人及所在单位与对方有无合作基础及业务联系);③达到本次出国学习预期目标的可行性,结合本人目前从事的工
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【DeepSeek开源周】Day 4：DualPipe & EPLB 学习笔记蓝海星梦 DeepSeek开源周探秘开源学习笔记人工智能云计算分布式
目录一、DualPipe&EPLB概述二、DualPipe详解1.流水线并行策略（1）F-then-B策略（2）1F1B策略2.朴素流水线并行3.GPipe微批次流水线并行4.PipeStream5.ZBPP6.DualPipe7.DualPipeV8.流水线并行方案对比三、EPLB详解1.专家并行（EP）2.EPLB冗余专家策略3.负载均衡策略（1）分层负载均衡（2）全局负载均衡（3）接口和示例
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
OpenHarmony解读之设备认证：Pake协议详解与实战陈乔布斯鸿蒙开发 HarmonyOS OpenHarmony harmonyos 分布式鸿蒙开发软总线 openHarmony 嵌入式硬件
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）①鸿蒙应用开发与鸿蒙系统开发哪个更有前景？②嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~③对于大前端开发来说，转鸿蒙开发究竟是福还是祸？④鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？⑤记录一场鸿蒙开发岗位面试经历~⑥持续更新中……一、概述在设备认证过程中，pake协议用于认证会话密钥协商，基于该会话密钥，双方可以安全地交换各自的
【ESP32最全学习笔记（基础篇）——7.ESP32 ADC – 使用 Arduino IDE 读取模拟值】「已注销」 ESP32学习笔记学习 ESP32 单片机嵌入式硬件 Arduino
关于本教程：ESP32基础篇1.ESP32简介2.ESP32Arduino集成开发环境3.VS代码和PlatformIO4.ESP32引脚5.ESP32输入输出6.ESP32脉宽调制7.ESP32模拟输入☑8.ESP32中断定时器9.ESP32深度睡眠
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
PyQt5—QTextEdit 学习笔记寄思～ Python——PyQt5笔记 qt 学习笔记 python
第二章控件学习一、QTextEdit基础认知QTextEdit是PyQt/PySide框架中用于处理富文本内容的强大控件，它不仅支持纯文本编辑，还能处理HTML、图片等复杂内容，是开发文本编辑器、日志查看器等应用的核心组件。二、最简单的QTextEdit实现下面是一个创建QTextEdit并显示的基础案例，适合零基础入门：importsysfromPyQt5.QtWidgetsimportQApp
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

数据挖掘导论学习笔记 第五章 分类算法