Yuuuuu丶Tian

《机器学习》及实战一、模型评估与选择

Python版本： Python3.x
运行平台： Windows
IDE： PyCharm
参考资料：《机器学习》（西瓜书）《机器学习实战》（王斌）
转载请标明出处：https://blog.csdn.net/tian121381/category_9748511.html
目录
- 一、前言
- 二、模型评估与选择
- - 1 评估方法
  - - 留出法
      
      K折交叉验证法
      
      自助法
  - 2 性能度量
  - - 错误率与精度
      
      查准率、查全率与Fl
      
      ROC 与 AUC
      
      代价敏感错误率与代价曲线
      
      比较检验
- 三、总结

一、前言

博主一时兴起开始写博客啦，不知道啥时候兴趣下去。(￣▽￣)"。初衷是为了把自己学习的内容复习一遍，巩固自己知识用的。但细想何不分享出来，让更多人少走弯路。
博主一开始只学习了深度学习，但对其中公式原理甚是不解啊，想着过遍基础吧，也正直新冠疫情，在家闲来无事，就用了1个月的时间，突击了一下机器学习的内容，会在近几天把一个月的收获发出来的，时间紧促，如有错误，请不吝指正。

二、模型评估与选择

1 评估方法

留出法

留出法很简单，无非三七分，二八分之类的，但是要注意训练集与测试集同分布或者进行多次随机划分，训练出多个模型，最后取平均值。例如我有一组有100个样本的数据集，其中正例70个，反例30个，我没有随机划分。而是选择了70个正例为训练集，那么我训练出来的模型，那错误率几乎就是100%了

K折交叉验证法

此方法用了留出法的留一法，将样本空间划分为k个大小相似的互斥子集，每次使用k-1个子集作为训练集，余下的为测试集，这样k是几，就进行几次训练几次测试，最后将测试结果求平均，如上图所示。它的缺点也很明显，数据量较大时，对算力要求较高

自助法

通过有放回采样产生训练集，有放回这样的作法肯定就有没有被采样到的，以此作为测试集。给定包含m个样本的数据集D ，每次从D 中采样一个样本，拷贝后放入D′中，采样m次，得到包含m个样本的数据集D′。明显D中有一部分样本会多次出现，而另一部分样本不出现。
于是估计样本在m次采样中始终不被采到的概率：

通过自助采样,初始数据集D中约有36.8%的样本未出现在测试集D’中。自助法在数据集较小、难以有效划分训练/测试集时很有用;此外，自助法能从初始数据集中产生多个不同的训练集，这对集成学习等方法有很大的好处. 然而，自助法产生的数据集改变了初始数据集的分布，这会引入估计偏差.因此，在初始数据量足够时，留出法和交叉验证法更常用一些。

2 性能度量

在预测任务中，给定样例集 D = {(X1, Y1), (X2， Y2)， . . . , (Xm, Ym)}，其中Yi是示例 Xi 的真实标记.要评估学习器 f 的性能，就要把学习器预测结果 f(x) 与真实标记 Y进行比较。对学习器的泛化性能的评估，衡量模型泛化能力的评价标准，就是性能度量(performance measure)。
回归任务最常用的性能度量是"均方误差" (mean squared error) 。

更一般的，对于数据分布 Ð 和概率密度函数 p(.)，均方误差可描述为

解释一下：第一个式子很容易理解吧？将预测值减去真实值求和再平均，第二个式子只是第一个的另一个写法，只不过第一个用于离散情况，第二个用于连续情况，1/m用各自的概率p代替，求和用积分代替了。

错误率与精度

这是分类任务中最常用的两种性能度量，既适用于二分类任务，也适用于多分类任务。错误率是分类错误的样本数占样本总数的比例，精度则是分类正确的样本数占样本总数的比例.对样例集 D，分类错误率定义为

（其中小双杠是统计，满足括号里的条件的元素的个数的意思。相当于if语句）
精度则定义为：

查准率、查全率与Fl

对于二分类问题，可将样例根据其真实类别与学习器预测类别的组合划分为真正例(true positive)、假正例(false positive)、真反倒(true negative)、假反例(false negative)四种情形，令 TP、 FP、 TN、 FN 分别表示其对应的样例数，则显然有 TP+FP+TN+FN=样例总数.分类结果的混淆矩阵。

先看一下查准率，查全率的公式定义，下面我再用白话解释一遍。

查全率就是真实为正例的样本有多少被预测出来，强调的是所有情况，突出了‘全’字。查准率是我预测为正的样本有多少是正确的，突出了‘准’字。
查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低;而查全率高时，查准率往往偏低。再来白话解释一下为什么会这样？如果我在谨慎的条件下筛选，那么肯定通过我这一关的样本就少，我的准确率会提高，但是真实是正例的我没有预测出来的数量就会增多，因为有一点疑问我就不让它通过，我这个‘全’肯定会减少。所以就很容易理解查准率和查全率不可能同向的。

在很多情形下，我们可根据学习器的预测结果对样例进行排序，排在前面的是学习器认为"最可能"是正例的样本，排在最后的则是学习器认为"最不可能"是正例的样本.按此顺序逐个把样本作为正例进行预测，则每次可以计算出当前的查全率、查准率以查准率为纵轴、查全率为横轴作图，就得到了查准率-查全率曲线，简称 “P-R曲线"显示该曲线的图称为 “P-R图”。
再讲P-R图前，先看一下这个排序，举一个简单的例子。（判断一个数是否为5）。

设越往右分值越高，中间的竖线是阈值，也就是’我‘在那把关，检查让谁出城，如果我在左边第一个，那么我就查的很严格，一般人我不让他过去( $ _ $ )。于是通过的3个数全是5（正例），我的准确率不就是100%了嘛，但是这个样本集有6个5，我没有查全，那么查全率就为3/6。再如我如果在左边第一个，我查的松，只要长得不太过分我就让他出城，这时可以看出，样本集中的5全都出去了，查全率就是100%，但不该出城的也有出去的，8个中有6个正确的，查准率就是6/8了。
好，现在再看一下"P-R图”。

P-R 图直观地显示出学习器在样本总体上的查全率、查准率，在进行比较时，若一个学习器的 P-R 曲线被另一个学习器的曲线完全"包住" ，则可断言后者的性能优于前者，例如上图中学习器 A 的性能优于学习器 C; 如果两个学习器的 P-R 曲线发生了交叉呢，如A 与 B 难以判断两者孰优孰劣，只能在具体的查准率或查全率条件下进行比较然而，在很多情形下，人们往往仍希望把学习器 A 与 B 比出个高低. 这时一个比较合理的判据是比较 P-R曲线下面积的大小，它在一定程度上表征了学习器在查准率和查全率上取得相对"双高"的比例.但这个值不太容易估算，因此人们设计了一些综合考虑查准率、查全率的性能度量.
"平衡点 " (Break-Event Point，简称 BEP)(方法1)就是这样一个度量，它是"查准率=查全率"时的取值，例如上图中学习器 C 的 BEP 是 0.64，而基于 BEP 的比较，可认为学习器 A 优于 B .
但 BEP 还是过于简化了些，更常用的是 F1（方法2）度量:

在一些应用中，对查准率和查全率的重视程度有所不同.例如在商品推荐系统中，为了尽可能少打扰用户，更希望推荐内容确是用户感兴趣的，此时查准率更重要;而在逃犯信息检索系统中，更希望尽可能少漏掉逃犯，此时查全率重要。
F1就是基于查准率与查全率的调和平均(harinonic mean)定义的:

可通过此式推导F1公式。

ROC 与 AUC

很多学习器是为测试样本产生一个实值或概率预测，然后将这个预测值与一个分类阔值(threshold)进行比较，若大于阈值则分为正类，否则为反类.例如，神经网络在一般情形下是对每个测试样本预测出一个 [0.0，1.0] 之间的实值，然后将这个值与 0.5 进行比较，大于 0.5 则判为正例，否则为反例.这个实值或概率预测结果的好坏，直接决定了学习器的泛化能力。实际上，根据这个实值或概率预测结果，我们可将测试样本进行排序，“最可能"是正例的排在最前面， “最不可能"是正例的排在最后面.这样，分类过程就相当于在这个排序中以某个"截断点” (cut point)将样本分为两部分，前一部分判作正例，后一部分则判作反例.（相似与前面的判断是否为5的例子）
与 P-R 曲线使用查准率、查全率为纵、横轴不同，ROC 曲线的纵轴是"真正例率” (True Positive Rate，简称 TPR)，横轴是"假正例率" (False Positive Rate，简称 FPR)，基于表 2.1 中的符号，两者分别定义为

在字面意思也很好理解，大白话又来了(ง •_•)ง，“真正例率” 就是真实为正例的中有预测为正的概率。“假正例率” 就是真实为反例的中有预测为正的概率。
显示 ROC 曲线的图称为 “ROC 图"下图为一个示意图，显然，对角线对应于 “随机猜测” 模型，而点 (0，1) 则对应于将所有正例排在所有反例之前的"理想模型”。

进行学习器的比较时，与 P-R 图相似，若一个学习器的 ROC 曲线被另一个学习器的曲线完全"包住"，则可断言后者的性能优于前者;若两个学习器的 ROC 曲线发生交叉，则难以判断两者孰优孰劣. 此时如果一定要进行比较，则较为合理的判据是比较 ROC曲线下的面积，即 AUC (Area Under ROC Curve)。

形式化地看， AUC 考虑的是样本预测的排序质量，因此它与排序误差有紧密联系.给定 m+个正例和 m- 个反例，令 D+ 和 D-分别表示正、反例集合，则排序"损失" (loss)定义为

单看公式是不是很懵逼，同样咱们用判断是否为5的那个例子来说明一下。

蓝色的为反例的序号，m-为6，红色的为正例序号，m+为6。分数从左到右升高。判断一下反例中是否有分数比正例高。序号+1，有-5，-6的分数比它高，有两个。同理，+2有一个-6，+3有一个-6，故共2+1+1=4个。（m+）+（m-）=12。就解出了rank_loss = 4 / 12。
考虑每一对正、反例，若正例的预测值小于反例，则记一个"罚分，相等则记0.5个"罚分"，容易看出， lrαnk 对应的是 ROC 曲线之上的面积:若一个正例在 ROC 曲线上对应标记点的坐标为 (x,y)，则 x 恰是排序在其之前的反例所占的比例,即假正例率.因此有

代价敏感错误率与代价曲线

在现实任务中常会遇到这样的情况:不同类型的错误所造成的后果不同. 例如在医疗诊断中，错误地把患者诊断为健康人与错误地把健康人诊断为患者，看起来都是犯了"一次错误"但后者的影响是增加了进一步检查的麻烦，前者的后果却可能是丧失了拯救生命的最佳时机;再如,门禁系统错误地把可通行人员拦在门外，将使得用户体验不佳，但错误地把陌生人放进门内，则会造成严重的安全事故.为权衡不同类型错误所造成的不同损失，可为错误赋予"非均等代价" (unequal cost).
以二分类任务为例，我们可根据任务的领域知识设定一个"代价矩阵" (cost matrix)，如下表所示，其中 costij 表示将第 i 类样本预测为第 j 类样本的代价.一般来说， costii = 0; 若将第 0 类判别为第 1 类所造成的损失更大，则 cost01 > cost10; 损失程度相差越大， cost01 与 cost10值的差别越大。

回顾前面介绍的一些性能度量可看出，它们大都隐式地假设了均等代价，定义的错误率是直接计算"错误次数"，并没有考虑不同错误会造成不同的后果.在非均等代价下，我们所希望的不再是简单地最小化错误次数，而是希望最小化"总体代价" (total cost). 若将上表中的第 0 类作为正类、第 1 类作为反类，令 D+ 与 D一分别代表样例集 D 的正例子集和反例子集，则"代价敏感" (cost-sensitive)错误率为

这个式子也是通俗易懂的，我们把cost01，与cost10看成罚分，只要与预测错误，我们就罚分。
下面就是代价曲线。这里看一下知乎上的讲解
代价曲线的目的就是：对于一个模型，根据p（p = 正例/总体）的不同，找到使代价总期望最小的模型的阈值。
在非均等代价下， ROC 曲线不能直接反映出学习器的期望总体代价，而 “代价曲线” (cost curve) 则可达到该目的.代价曲线图的横轴是取值为 [0，1] （因为归一化了，下有公式）的正例概率代价：

其中 p 是样例为正例的概率;纵轴是取值为 [0,1] 的归一化代价

FPR 是定义的假正例率， FNR = 1 - TPR 是假反例率。代价曲线的绘制很简单: ROC 曲线上每一点对应了代价平面上的一条线段，设 ROC 曲线上点的坐标为 (TPR， FPR)，则可相应计算出 FNR，然后在代价平面上绘制一条从 (O，FPR) 到 (1，FNR) 的线段，线段下的面积即表示了该条件下的期望总体代价;如此将 ROC 曲线上的每个点转化为代价平面上的一条线段，然后取所有线段的下界，围成的面积即为在所有条件下学习器的期望总体代价，如下图

俗话说，光说不练假把戏。那么上代码！！！
例子仍是判断是否为5。
12个数字

#分数从左到右依次升高，那么我们就简单的给它们打个分
output_score = list(range(12))
#print(output_score)   #测试
#按上图给它们正确的分类：0不是5，1是5
y = [0,0,0,0,1,0,1,1,0,1,1,1]
#设p，p为正例的比例
p = list(range(0,101,10))
p = [i/100 for i in p]
#print(p)   #测试
#代价，即罚分
c01 = 3
c02 = 2
#设置阈值
theta = 6.5  #取分数大于6.5的判断为5
#判断输出的函数,如分数大于6.5是正例，反之是反例
def calculate_output_result(output_score,theta):
    output_result = []
    for i in range(len(output_score)):
        if output_score[i] < theta:
            output_result.append(0)
        else:
            output_result.append(1)
    return output_result
output_result = calculate_output_result(output_score,theta)
print(output_result)

结果：

import pandas as pd
def calculate_m_positive_negative(y):
    result = pd.value_counts(y)   #不同类型个数,返回0：6   1：6
    m_positive = result[1]
    m_negative = result[0]
    return m_positive,m_negative

m_positive,m_negative = calculate_m_positive_negative(y)
print(m_positive,m_negative)

结果：6  6
正例，反例都是6

下面需要求混淆矩阵，通过笔算，得到以下结果，

（括号内为个数），编写代码，双向检查一下自己写的对不对

#计算混淆矩阵的con1，con2，con3，con4的个数
def calculate_confusion(y,output_result):
    con1 = 0
    con2 = 0
    con3 = 0
    con4 = 0
    for i in range(len(y)):
        if y[i] == 1:
            if y[i] == output_result[i]:
                con1 += 1
            else:
                con2 += 1
        else:
            if y[i] == output_result[i]:
                con4 += 1
            else:
                con3 += 1
    return con1,con2,con3,con4
con1,con2,con3,con4 = calculate_confusion(y,output_result)
print(con1,con2,con3,con4)

结果：

有上面公式知，下面需要求FNR，FPR。

def calculate_FNR_FPR(con1,con2,con3,con4):
    FNR = round(con2/(con1+con2),4)
    FPR = round(con3/(con3+con4),4)
    return FNR,FPR

FNR,FPR = calculate_FNR_FPR(con1,con2,con3,con4)
print(FNR,FPR)

结果：

正概率代价（行轴）。

def calculate_Pcost(p,c01,c02):    #p为正例的概率
    Pcosts = []
    for i in range(len(p)):
        Pcost = round((p[i] * c01) /( p[i] * c01 + (1 - p[i]) * c02),4)
        Pcosts.append(Pcost)
    return Pcosts

Pcosts = calculate_Pcost(p,c01,c02)
print(Pcosts)

结果：

同样通过上述公式求纵轴归一化（上数第2个）

def calculate_cost_norm(p,FNR,FPR,c01,c02):
    costs_norm = []
    for i in range(len(p)):
        cost_norm = round((FNR * p[i] * c01 + FPR * (1 - p[i]) * c02)/(p[i] * c01 + (1 - p[i]) + c02),4)
        costs_norm.append(cost_norm)
    return costs_norm
costs_norm = calculate_cost_norm(p,FNR,FPR,c01,c02)
print('b',costs_norm)

结果：

到这考虑一下，为什么要归一化，这就要通过图像来比较一下归一化的和没有归一化的图像了。

#图像函数
import matplotlib as mpl
import matplotlib.pyplot as plt
def plot_lines(X,Y,color):
    plt.plot(X,Y,color)
#画出图像
plot_lines(Pcosts,costs_norm,"r")
plot_lines(p,costs_norm,"b")
plt.show()

如图所示。正概率代价归一化的是红线，未归一化的是蓝线，虽然未归一化的也是一一映射，但是非线性，会影响到后续的操作。
那么怎么画代价曲线与期望总体代价的图像呢？
正如概念所说：将 ROC 曲线上的每个点转化为代价平面上的一条线段，然后取所有线段的下界，围成的面积即为在所有条件下学习器的期望总体代价。这就知道了，一个阈值可以画一个代价曲线，那就需要咱们引入多个阈值了。

"""
多个阈值theta的情况
"""
thetas = list(range(12))
thetas = [i + 0.5 for i in thetas]
#阈值反别是[0.5, 1.5, 2.5, 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5, 10.5, 11.5]
#print(thetas)
#定义计算每个theta对应的点的函数，并存在列表里
def calculate_Pcost_cost_norm(thetas,output_score,y,calculate_Pcost,calculate_cost_norm):
    Pcosts_n = []
    costs_norm_n = []
    theta_FPR_PNR = {}
    for i in range(len(thetas)):
        theta = thetas[i]
        #计算输出的结果
        output_result = calculate_output_result(output_score,theta)
        #计算正反例的个数
        m_positive,m_negative = calculate_m_positive_negative(y)
        #计算混淆矩阵
        con1,con2,con3,con4 = calculate_confusion(y,output_result)
        #计算FNR，FPR
        FNR,FPR = calculate_FNR_FPR(con1,con2,con3,con4)
        theta_FPR_PNR[theta] = [FNR,FPR]
        #正概率代价
        Pcosts = calculate_Pcost(p,c01,c02)
        Pcosts_n.append(Pcosts)
        #归一化总概率
        costs_norm = calculate_cost_norm(p,FNR,FPR,c01,c02)
        costs_norm_n.append(costs_norm)
    return Pcosts_n,costs_norm_n,theta_FPR_PNR
Pcosts_n,costs_norm_n,theta_FPR_PNR = calculate_Pcost_cost_norm(thetas,output_score,y,calculate_Pcost,calculate_cost_norm)
for i in range(len(Pcosts_n)):
    plot_lines(Pcosts_n[i],costs_norm_n[i],'r')
plt.show()    #12个阈值，12条线

结果：
下面围成的面积就是期望总体代价。

比较检验

比较检验这里只讲假设检验
有了实验评估方法和性能度量，看起来就能对学习器的性能进行评估比较了:先使用某种实验评估方法测得学习器的某个性能度量结果，然后对这些结果进行比较.但怎么来做这个"比较"呢?是直接取得性能度量的值然后"比大小"吗?机器学习中性能比较主要涉及几个重要因素:首先，我们希望比较的是泛化性能，然而通过实验评估方法我们获得的是测试集上的性能，两者的对比结果可能未必相同;第二，测试集上的性能与测试集本身的选择有很大关系，且不论使用不同大小的测试集会得到不同的结果，即使用相同大小的测试集，若包含的测试样例不同，测试结果也会有不同;第三，很多机器学习算法本身有一定的随机性，即便用相同的参数设置在同一个测试集上多次运行，其结果也会有不同.那么，有没有适当的方法对学习器的性能进行比较呢?
统计假设检验(hypothesis test)为我们进行学习器t性能比较提供了重要依据.基于假设检验结果我们可推断出，若在测试集上观察到学习器 A 比 B 好，则 A 的泛化性能是否在统计意义上优于 B，以及这个结论的把握有多大。下面就介绍一下最基本的假设检验。
假设检验中的"假设"是对学习器泛化错误率分布的某种判断或猜想，泛化错误率为 ε的学习器在一个样本上犯错的概率是 ε; 测试错误率ε’意味着在 m 个测试样本中恰有ε’ x m 个被误分。假定测试样本是从样本总体分布中独立采样而得，那么泛化错误率为 ε 的学习器将其中 m’ 个样本误分类、其余样本全部分类正确的概率是

由此可估算出其恰将 ε‘ x m 个样本误分类的概率如下式所示，这也表达了在包含 m 个样本的测试集上，泛化错误率为 ε的学习器被测得测试错误率为ε’的概率:

我们来代码实现一下。
首先定义一个模型上的错误率，即ε = 0.3。假设测试集有10个样本，错误了6个，计算错6个的概率。

from scipy.special import comb
#定义模型上的错误率
e_all = 0.3
#测试集T
m_T = 10
m_T_error = 6
#模型上的错误率
e = round(m_T_error / m_T,4)
#出现错6个情况的概率
def calculate_p(m_T,m_T_error):
    p = comb(m_T,m_T_error)*(e_all ** m_T_error) * ((1 - e_all) ** (m_T - m_T_error))    #comd就是C几几。
    p = round(p,4)
    return p
print(calculate_p(m_T,m_T_error))

结果：

这里得出在错误率为0.3时，错6个的概率时0.0368。
细想一下，很容易想到，10个样本，0.3的错误率，那么平均错3个概率最大。来实现对比一下吧！

#将所有错误个数列出
def calculate_ps(m_T):
    ps = []
    m_T_errors = []
    for i in range(m_T + 1):   #错0个到错10个依次处理
        m_T_error = i
        m_T_errors.append(i)
        p = comb(m_T, m_T_error) * (e_all ** m_T_error) * ((1 - e_all) ** (m_T - m_T_error))
        p = round(p, 4)
        ps.append(p)
    return m_T_errors,ps
m_T_errors,ps = calculate_ps(m_T)
#print(m_T_errors)
#print(ps)
#画出图像
import matplotlib.pyplot as plt
def plot_scatter(x,y):
    plt.scatter(x,y,s = 20, c = 'b', alpha=1)  #散点图
    plt.show()
plot_scatter(m_T_errors,ps)

结果：

由图明显看出错3个的概率为最大的。
我们可使用"二项检验" (binomial test)来对"ε<=0.3"(即"泛化错误率是否不大于0.3" )这样的假设进行检验。更一般的，考虑假设 “ε<=ε0”，则在 1 一 α 的概率内所能观测到的最大错误率如下式计算.这里 1 一 α 反映了结论的 “置信度” (confidence)，直观地来看，相应于下图中非阴影部分的范围。

此时若测试错误率ε’小于临界值，则根据二项检验可得出结论:在 α 的显著度下，假设"ε<=ε0"不能被拒绝，即能以 1 - α 的置信度认为，学习器的泛化错误率不大于ε0; 否则该假设可被拒绝，即在 α 的显著度下可认为学习器的泛化错误率大于ε0。

用例子来说明一下置信度。很容易理解，这里会用到概率论的知识，如t分布，F分布等。不细讲，大学都学过了。忘记的可以去复习一下吧。(～￣▽￣)～传送门
那么非阴影面积怎么求呢？？？上代码 ε=ε=ε=(_￣▽￣)
面积无非就是累加。
在重复一下题：假设上图都是非阴影的（此为题干图），模型错误率是0.3，这个假设，只设了上限，不管下限。拒绝的办法就是出现大于某个数的错误，那么这个界值是多少呢？置信区间为90%。也就是左边面积为90%使用累加求面积。

import numpy as np
#求累加的面积
def calcullate_Ps(ps):
    Ps = []
    p = 0
    for i in range(len(ps)):
        p += ps[i] * 1    #累加面积
        Ps.append(p)
    return Ps
Ps = calcullate_Ps(ps)   #
print(Ps)
plot_scatter(m_T_errors,Ps)
Ps_array = np.array(Ps)
#返回数组中所有大于0.9的数字的索引值,判断在什么情况下大于了0.9。
confindence_indexs = np.argwhere(Ps_array > 0.9)
#大于0.9的第一个数
confindence_index = confindence_indexs[0]
print(confindence_index)   #输出累加大于0.9的第一个数

	结果：[0.0282, 0.1493, 0.38280000000000003, 0.6496, 0.8496999999999999, 0.9525999999999999, 0.9893999999999998, 0.9983999999999998, 0.9997999999999998, 0.9998999999999998, 0.9998999999999998]
	      [5]

图：
结果显示，到5的累加超过了0.9.
由图也可看出，错前5个概率的累加已经超过了0.9。
这时在看题干的图。5为界限（5左边面积是总面积的90%）。这时就可以说，在置信度为90%（1-α =0.9）的情况下，样本取值的错误率为0.3了。
这章剩下的就不讲了，不讲了。。。。。。。。(～﹃～)~zZ

三、总结

这章本就需要有总体思想，突然一看一头雾水也是正常的。
近几天我会更新完我的总结与领悟，看完那些回来再看看此章。。。。。
本文结合各位大牛所思所想，不胜感激！
如有错误，请不吝指正！

计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
MNIST数据集&手写数字识别 Zoro｜ keras tensorflow 人工智能机器学习
TensorFlow是一个开源的机器学习框架，由Google开发并发布。它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。张量是TensorFlow中的基本数据单位，可以理解为多维数组，可以是标量、向量、矩阵或更高维度的数组。流图是由一系列操作（Operation）和张量组成的。操作定义了计算和转换张量的方式。
OpenLSD是一个自适应开源数据集，旨在支持逻辑综合中的多种机器学习任务。数据集
2024-11-14，由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集，目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。一、研究背景：逻辑综合是电子设计自动化（EDA）流程中的关键环节，它负责将高级设计规范转化为门级网络列表。近年来
【Python】测试数据生成工具 --- Faker pythonfaker数据分析
Faker库介绍Faker是一个强大的库，能够帮助开发者和测试人员生成大量的假数据，但这些数据看起来却非常真实。它支持生成多种类型的数据，如姓名、地址、公司名称、电子邮件等，甚至能够根据不同国家的特定文化生成相应的数据。Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
机器学习线性回归学习心得_线性回归为机器学习的初学者解释 weixin_26750481 机器学习 python 人工智能逻辑回归深度学习
机器学习线性回归学习心得Datasciencewiththekindofpoweritgivesyoutoanalyzeeachandeverybitofdatayouhaveatyourdisposal,tomakesmart&intelligentbusinessdecisions,isbecomingamust-havetooltounderstandandimplementinyouror
统计机器学习 (Statistical Machine Learning) 原理与代码实例讲解 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
统计机器学习(StatisticalMachineLearning)原理与代码实例讲解1.背景介绍统计机器学习是现代人工智能和数据科学的核心领域之一。它结合了统计学和计算机科学的理论与方法，通过数据驱动的方式来构建预测模型和决策系统。统计机器学习不仅在学术研究中占据重要地位，还在工业界有广泛应用，如推荐系统、图像识别、自然语言处理等。2.核心概念与联系2.1统计学与机器学习的关系统计学关注数据的收
【python 机器学习】sklearn数据集的使用人才程序员 python 机器学习 sklearn 人工智能深度学习神经网络目标检测
文章目录sklearn数据集的使用1.`sklearn`内置数据集2.导入`sklearn`数据集3.加载和使用Iris数据集3.1加载数据3.2查看数据3.3使用数据集进行分类任务4.加载和使用Digits数据集4.1加载数据4.2查看数据4.3使用数据集进行分类任务5.加载和使用BreastCancer数据集5.1加载数据5.2查看数据5.3使用数据集进行分类任务6.总结sklearn数据集的
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南 2401_85702623 conda pip python
标题：【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南Conda是一个强大的包管理器和环境管理器，广泛用于Python社区，尤其是在数据科学和机器学习领域。尽管Conda本身可以处理大多数包的安装和管理，但有时我们可能仍需使用pip来安装特定的Python包。本文将详细解释如何在Conda环境中使用pip，包括配置、安装包、环境管理等，确保您可以充分利用这两个工具的优势。1.C
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f