Lyndon_zheng

机器学习（6）——从线性回归到逻辑斯特回归

Linear Regression

在学习李航《统计学习方法》的逻辑斯特回归时，正好coursera上相应的线性回归和逻辑斯特回归都学习完成，在此就一起进行总结，其中图片多来自coursera课程上。
线性回归是机器学习中很好理解的一种算法。我们以常见的房屋销售为例来进行简单分析：
假设我们统计的一个房屋销售的数据如下：

在此，我们从单一变量谈起，直观上比较容易理解。训练集定义为 {(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))} ,其中 x 是输入特征， y 是输出目标， m 是样本的总数目。线性回归的最终目的如下所示，就是通过学习，得到一个拟合函数，使得通过输入特征就能预测目标输出值，本例即通过房屋大小估计房屋价格。

假设空间

实际线性回归假设能够拟合各种不同的曲线，实际的房子价格可能与房间面积、房间厅室、房间朝向等多个变量有关，我们可以定义特征 x={x1,x2,…,xi} 那么我们可以定义拟合函数为:

h (x) = h θ (x) = θ 0 + θ 1 x 1 + θ 2 x 2 + \dots + θ i x i = θ T x

其中

θT=[θ0,θ1,…,θi],xT=[x1,x2,…,xi] ,最后是其向量表达形式。我们可以看出，每一组

θ 值对应一个拟合函数，为了选出其中最好的

θ ，我们定义一个评价标准，即损失函数(loss function)或代价函数(cost function)。

代价函数

在线性回归中，我们定义代价函数为：

J (θ) = 1 m \sum i = 1 m 1 2 (h θ (x (i)) - y (i)) 2

min θ J θ

其中，系数

12 是为了求导方便，

1m 在不同的讲义中可能会有所不同，我们以斯坦福的讲义为标准。
从表达式我们可以看出，学习的最终目的就是优化代价函数，使代价函数变小了，预测值和真值的差异就越小，训练出来的模型就越好。如何求解

J(θ) 有很多种办法，常见的有梯度下降法和最小二乘法。

梯度下降法

梯度下降法是求解无约束最优化问题的一种最常见的方法，其实现简单，易于理解。如下图所述带有二元参数的目标函数 J(θ0,θ1) ,求解其最小值。我们可以初始化一个参数值 (θ0,θ1) ,然后求 J(θ0,θ1) 在各个方向的偏导，通过一个学习步长来改变参数，并最终求得 J(θ0,θ1) 的最小值。具体算法流程为：

Algorithm 6.1
initialize θ ， θ={0,0,…,0}
for k = 1 : NumIter do
θj=θj−α∂∂θjJ(θ)
end for
在线性线性回归中:

$\partial \partial θ j J (θ) = 1 m \sum i = 1 m (h θ (x (i)) - y (i)) x i j$
其中 xij 是第 i 个样本实例的第 j 维特征。由此我们就可以学习出每个特征的参数。

在梯度下降法中有两个个关键参数选择：学习率 α 和初始化 θ 。
对于合适的学习率 α ，目标函数 J(θ) 在每次迭代中都会减小，因此可以通过 J(θ) 的值检测算法的正确性。在实际操作中， α 太小，算法的收敛速度会很慢，当 α 太大时，则会出现震荡，学习不到最佳参数。
对于初始参数 θ ，不同的起点，可能会得到不同的最优解，即陷入局部最优。

最小二乘法

梯度下降法需要不断的迭代计算，一般来说，收敛速度都会比较慢，另一种快速求解最佳解的方法是最小二乘法，具体公式为：

θ = (X T X) - 1 X T Y

在自我编程实现中，矩阵逆的求解是一个难点。另外，也存在不可解的情况：一是特征相互关联，不独立；二是样本数少于特征数，可能使得矩阵的逆不存在。

过拟合和正则化

过拟合是机器学习中很普遍的例子，指的是训练模型在训练集上有很好的分类回归效果，但是在新的测试数据集上表现却很差，即模型的泛化能力差。
如下图所示，依旧以“大小-房价”线性回归为例来说明。房价与房屋大小可能是非线性关系，如图1所示，假设模型为 θ0+θ1x ,即线性关系，拟合效果不好，称为欠拟合；图2则是非线性拟合，假设模型为 θ0+θ1x+θ2x2 ,能够比较好的拟合两者之间的关系；图3所示的多项式 θ0+θ1x+θ2x2+θ3x3+θ4x4 则能够拟合所有的数据，即对训练样本的学习效果很好，但是这明显不是我们所期望的学习模型，存在严重过拟合。

解决过拟合问题常有以下几种方式：

减少特征数量
- 人为选择特征，去掉不必要的特征
- 机器学习选择特征，主成分分析降维等
正则化
- 保持所有特征，但是减小学习参数 θ 的值。
如上图3所示，通过惩罚项使最终的学习参数 θ3,θ4 极小，则最终模型与图2模型很相近。即：

$min 1 m {\sum i = 1 m (h θ (x (i)) - y (i)) + 1000 θ 23 + 1000 θ 24}$
通过将 θ3,θ4 带入到损失函数中，使函数考虑模型复杂度的影响。正则化的目的就是将模型的复杂度考虑到代价函数中，使模型趋于简单，不易过拟合。对于线性回归，正则化代价函数为:
$J (θ) = 1 2 m [\sum i = 1 m (h θ (x (i)) - y (i)) 2 + λ \sum i = 1 n θ 2 j]$
其中，前面一部分是对训练数据集的拟合误差，后一部分正则化项是对模型复杂度的约束， λ 是调节两则之间的权重：
当 λ 较小时，极限情况下 λ=0 ，则不考虑模型的复杂度，是原有的损失函数
当 λ 较大时，则训练的参数很小，模型可能会欠拟合

Logistic Regression

回归问题一般是连续预测：如房价预测、销售额预测，即输出 y 的状态可能有无限多种；
分类问题则是离散预测：邮件分类(垃圾/正常)，细胞检测(正常/癌变)，输出一般对应有限状态。
一般来说，线性回归不能直接用于分类问题，因为回归是连续性模型，而且受噪音比较大，我们一般选择logistic回归来进行分类。logistic本质是线性回归，只是在特征到结果的映射中加入了一层映射函数。

逻辑斯特回归模型

对于二分类系统，我们希望学习模型的输出为0或1，对于固定的特征，我们希望学习模型预测其属于正例的概率。即： hθ(x)=P(y=1|x:θ) ,对于二分类系统， P(y=1|x:θ)+P(y=0|x:θ)=1 。logistic的假设函数为：

h θ (x) = g (θ T x) = 1 1 + e - θ T x

如下图所示，我们定义逻辑斯特回归的学习规则为：

θTx≥0 ,则 hθ(x)≥0.5 ,此时认为样本属于正样本的概率更大，即 y=1
θTx<0 ,则 hθ(x)<0.5 ,此时认为样本属于正样本的概率更大，即 y=0

决策边界

对于分类问题，最终就是得到一个分类边界，使样本能够被准确区分开。如下图所示的两类样本，我们假设红色为正样本，即 y=1 ,蓝色为负样本，即 y=0 。分类决策面有两个特征 x1,x2 ，因此我们定义假设模型为： hθ(x)=g(θ0+θ1x1+θ2x2) 。取 θT=[−3,1,1] ,即分类平面为 −3+x1+x2=0 ,我们可以看到：

当 −3+x1+x2≥0 时，即 θTx≥0 ，此时有 hθ(x)≥0.5 ，决策为正样本，从图中我们可以看到 −3+x1+x2=0 右上侧为正样本
同理，当 −3+x1+x2<0 时，即 θTx<0 有 hθ(x)<0.5 ，决策为负样本。
通过该直线我们可以将二分类样本正确区分开，这样的边界也称为决策边界。如果样本是非线性可分的，我们也可以通过复杂多项式进行分类。逻辑斯特回归最终学习到的模型就是这样的边界图，在边界的两边就是两个不同的类别。

损失函数

逻辑斯特回归代价函数一般定义为：

C o s t (h θ (x), y) = {- log (h θ (x)), - log (1 - h θ (x)), if y = 1 if y = 0

因为

hθ(x) 是输出为(0,1)之间的函数，如果真值为

y=1 ，预测值

hθ(x) 越接近1，代价越小，即预测越正确。同理，真值为

y=0 ，预测值

hθ(x) 越接近0，代价越小，即预测越正确。我们可以将代价函数改写为：

C o s t (h θ (x), y) = - y log (h θ (x)) - (1 - y) log (1 - h θ (x))

最终的代价函数为：

J (θ) = - 1 m \sum i = 1 m [y (i) log (h θ (x (i))) + (1 - y (i)) log (1 - h θ (x (i)))]

如果考虑模型的复杂度，即加入正则项，则为：

J (θ) = - 1 m \sum i = 1 m [y (i) log (h θ (x (i))) + (1 - y (i)) log (1 - h θ (x (i)))] + 1 2 m \sum j = 1 n θ 2 j

最终目标是最小化目标函数，用梯度下降法求解，则：

\partial \partial θ j J (θ) = - 1 m \sum i = 1 m [y (i) 1 h θ ( x ( i ) ) h' θ (x (i)) - (1 - y (i)) 1 1 - h θ ( x ( i ) ) h' θ (x (i))] = - 1 m \sum i = 1 m [y ( i ) - y ( i ) h θ ( x ( i ) ) - h θ ( x ( i ) ) + y ( i ) h θ ( x ( i ) ) h θ ( x ( i ) ) ( 1 - h θ ( x ( i ) ) )] h' θ (x (i)) = - 1 m \sum i = 1 m [y ( i ) - h θ ( x ( i ) ) 1 1 + e - θ T x e - θ T x 1 + e - θ T x] e - θ T x ( 1 + e - θ T x ) 2 x (i) j = 1 m \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j

通过推导我们发现逻辑斯特回归的代价函数与线性回归形式上很像，不同之处在于模型假设不一样，线性回归是

hθ(x)=θTx ，而逻辑回归在此基础上多了一层映射

hθ(x)=11+e−θTx

多分类问题

logistic回归也可用于扩展用于多分类问题，解决办法常见的就是一对多。如下图所示有三类样本，我们可以先用一个分类器将类别一与另外两类区分开(右图1)，然后用同样的办法训练两个分类器，将每个类别区分开。在得到的三个假设模型中，我们计算每个样本在每个模型中的值，即概率，通过选取最大的概率，就能确定样本所属的类别。

Python实现

最后我们通过Python实现了简单的logistic二分类问题，具体代码如下：
读取txt文件中的训练数据，包含特征和标签，并给特征加上偏置项1

# load training data set
def loadData(path):
    dataMat = []; labelMat = [];
    f = open(path)
    data= f.read().split()
    for datastring in data:
        dataMat.append([1,float(datastring.split(',')[0]),float(datastring.split(',')[1])])
        labelMat.append(int(datastring.split(',')[2]))
    return dataMat,labelMat

从txt中读取的特征值很大，进行标准归一化之后进行训练。

def featureNormalize(dataMat):
    dataMatrix = mat(dataMat)
    data_norm = dataMatrix;
    m,n = shape(dataMatrix)
    mu = mean(dataMatrix[:,1:3],axis = 0)
    sigma = std(dataMatrix[:,1:3],axis = 0)
    data_norm[:,1:3]= [x/y for x,y in zip((dataMatrix[:,1:3]-tile(mu,(m,1))),tile(sigma,(m,1)))]
    return data_norm,mu,sigma

绘制最终分类效果图和损失函数的变化

# plot data set
def plotdata(theta,mu,sigma,dataMat,labelMat):
    dataArr = array(dataMat)
    positive_x =[]; positive_y = []
    negtive_x =[]; negative_y = []
    for i in range(len(labelMat)):
        if 1 == int(labelMat[i]):
            positive_x.append(dataArr[i,1]);positive_y.append(dataArr[i,2])
        else:
            negtive_x.append(dataArr[i,1]);negative_y.append(dataArr[i,2])
    fig1 = plt.figure('fig1')
    ax = fig1.add_subplot(111)
    ax.scatter(positive_x,positive_y,s=30,c='red',marker='s')
    ax.scatter(negtive_x,negative_y,s=30,c='green')
    min_x = min(dataArr[:,1])
    max_x = max(dataArr[:,1])
    y_min_x = (-theta[0]-theta[1]*(min_x-mu[0,0])/sigma[0,0])*sigma[0,1]/theta[2]+mu[0,1]
    y_max_x = (-theta[0]-theta[1]*(max_x-mu[0,0])/sigma[0,0])*sigma[0,1]/theta[2]+mu[0,1]
    ax.plot([min_x,max_x],[y_min_x,y_max_x],'-g')
    plt.xlabel('X1');plt.ylabel('X2');plt.legend();
    plt.show()

# plot cost
def plotJ(J_history):
    fig2 = plt.figure('fig2')
    ax = fig2.add_subplot(111)
    x = arange(0,len(J_history),1)
    ax.plot(x,J_history)
    plt.xlabel('Iter');plt.ylabel('cost');plt.legend();
    plt.show()

梯度下降算法：

# sigmoid function
def sigmoid(z):
    return 1.0 / (1+exp(-z))

# train 
def gradientReg(dataMat,labelMat,alpha,lambda1,MaxIter):
    dataMatrix = mat(dataMat)
    labelMatrix = mat(labelMat).transpose()
    m,n = shape(dataMatrix)
    J = zeros((MaxIter,1))
    theta = zeros((n,1))
    for k in range(MaxIter):
        h = sigmoid(dataMatrix*theta)
        J[k] = 1.0/m*sum(-multiply(labelMatrix,log(h))-multiply((1-labelMatrix),log(1-h)))+\
        lambda1/(2*m)*(sum(theta[2:n]**2))
        error = (h-labelMatrix)
        for i in range(n):
            if 0 == i:
                theta[i] = theta[i] - alpha*1.0/m*(error.transpose()*dataMatrix[:,i])
            else:
                theta[i] = theta[i] - alpha*1.0/m*(error.transpose()*dataMatrix[:,i]+lambda1*theta[i]) 
    return theta,J

通过训练模型进行分类预测

# predict 
def predict(theta,dataMat):
    prob = sigmoid(dataMat*theta)
    p = double(prob>0.5)
    return p;

主函数

# main
if __name__=="__main__":
    dataMat = []; labelMat = [];
    alpha = 0.1;lambda1 = 0; MaxIter = 1000;
    datapath = 'F:\Program\Python\Machine_Learning\Logistic\src\ex2data1.txt'
    dataMat,labelMat=loadData(datapath)
    data_norm,mu,sigma =featureNormalize(dataMat)
    theta,J_history = gradientReg(data_norm,labelMat,alpha,lambda1,MaxIter)
    plotdata(theta,mu,sigma,dataMat,labelMat)
    plotJ(J_history)
    p = predict(theta,data_norm)
    print "the classify accuracy is:%.3f%%" %(mean(double(p.transpose() == labelMat)) * 100)

当 α=0.1,λ=0 时，分类效果图为：

当 α=0.1,λ=10 时，分类效果图为：

当 α=1,λ=0 时，分类效果图为：

通过对比图1和图2，可以发现当调节参数 λ 变化时，代价函数会改变，分类效果和分类结果都会变化，说明它通过引入正则项可以改变模型的复杂程度；通过对比图1和图3，可以发现，在一定范围内 α 越大，代价函数收敛越快，模型学习迭代次数越少，但是模型最终分类效果和分类结果都没变化，学习率只影响了模型训练速度，而不会影响模型的性能。

PS：
本文主要参考了李航《统计学习方法》和斯坦福的在线课程，图表也多引用自斯坦福课程，主要用于自我学习总结，代码完整示例见此处。

群体智能优化算法-爱情进化算法 (Love Evolution Algorithm, LEA，含Matlab源代码） HR Zhou 算法 matlab 开发语言群体智能优化优化
摘要爱情进化算法（LEA）是一种基于心理学刺激-价值-角色理论（Stimulus-Value-RoleTheory）所提出的新型元启发式算法。该算法将“恋爱中的人”抽象为种群个体，通过对个体“幸福度（Happiness）”的定义和动态更新，模拟了从“相遇->价值交流->角色平衡”三个阶段不断逼近全局最优解的过程。LEA在高维连续优化与工程应用等场景下可实现对搜索空间的充分探索与精细开发。本文结合算
【江协STM32】11-2/3 W25Q64简介、软件SPI读写W25Q64 冰糖雪莲IO stm32 嵌入式硬件单片机
1.W25Q64简介W25Qxx系列是一种低成本、小型化、使用简单的非易失性存储器，常应用于数据存储、字库存储、固件程序存储等场景存储介质：NorFlash（闪存）时钟频率：80MHz/160MHz(DualSPI)/320MHz(QuadSPI)存储容量（24位地址）：W25Q40：4Mbit/512KByteW25Q80：8Mbit/1MByteW25Q16：16Mbit/2MByteW25Q
[网安工具] 网安工具库 —— 工具管理手册 Blue17 :: Hack3rX 安全工具 —网安工具手册安全内网安全网络安全 windows 网络
0x00：工具管理类—ToolsManagement0x01：信息收集类—InformationGathering自动化综合信息收集工具—ARL灯塔0x02：漏洞探测类—VulnerabilityIdentification浏览器渗透辅助插件——HackBarSQL注入漏洞——SqlMap0x03：漏洞利用类0x04：远程控制类0x05：权限提升类0x06：权限维持类0x07：隧道代理类0x08：
嵌入式系统的核心组成部分处理器、存储器、传感器和执行器 getapi 单片机嵌入式硬件信号处理
处理器、存储器、传感器和执行器是嵌入式系统的核心组成部分。它们共同协作，完成从数据采集到处理再到执行的完整流程。以下是对这些组件的详细解析：1.处理器（Processor）定义处理器是嵌入式系统的大脑，负责执行指令、处理数据和控制其他组件。主要功能执行程序代码。控制外设（如存储器、传感器、执行器）。处理数据输入和输出。分类微控制器（MCU）集成了处理器核心、存储器和外设的单芯片解决方案。适合低成本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
2953. 统计完全子字符串（将题目中给的信息进行分组循环）娇娇yyyyyy 每日一题算法
思路：根据题目中所给的第二个信息我们可以提取到至多相差2，说明相邻字母相减的绝对值小于等于2，一共有26个字母，因此我们可以枚举有多种不同的字母，因此每个窗口的大小为m*k,即在该窗口内有m个不同的字母，每一个均出现k次，暴力滑动窗口即可（tips:最后几个点实在过不去，可能是我用multiset的原因）classSolution{public:intcountCompleteSubstrings
软件架构设计关键点：平衡高可用、性能、扩展性及成本的系统化实践 yinhezhanshen 程序人生系统架构
在数字化转型的浪潮中，软件系统已成为企业运营的核心支撑。从电商平台的秒杀活动到金融系统的实时交易，从物联网设备的百万级连接到政务服务的全天候响应，软件架构的设计质量直接决定了系统能否在复杂环境中稳定运行。本文将从高可用性、高性能、可扩展性、安全性、成本控制、规模承载和弹性伸缩七个维度，剖析现代软件架构设计的核心要点。一、高可用性：构建业务连续性的基石‌冗余设计‌：采用主从复制、多活数据中心架构（如
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
Tenacity（Python的坚韧重试库） ftpeak Python python 开发语言网络爬虫
概述Tenacity是一个基于Apache2.0协议的通用重试库，用Python编写，旨在简化向任何代码添加重试逻辑的过程。它起源于已停止维护的retrying库的分叉版本。Tenacity不兼容retrying的API，但新增了大量功能并修复了长期存在的错误。文档：Tenacity—Tenacitydocumentation主页：https://github.com/jd/tenacity核心功
Pyhton安装PyQT6 三口一个桃 python pyqt
Windows系统使用CMD命令安装，对于系统中有多个版本python的，在安装pyqt6/pyqt5时需要针对每个python版本单独安装。安装准备过程：①Win+R打开CMD命令行窗口②输入命令：python--version查看当前python版本是否是自己需要安装pyqt6/5的的版本，若是则执行第③步，若不是则执行下述操作：打开电脑环境变量设置(自行百度)--点击系统变量中的Path项-
如何把master迁出的bug修改分支，合并、删除本地、删除远端软考真题app bug
要将fix/xxxxxx_20250319分支合并到master并删除本地及远程分支，请按以下步骤操作：1.切换到master分支并更新gitcheckoutmaster#切换到master分支gitpulloriginmaster#拉取远程master的最新代码2.合并分支到mastergitmergefix/xxxxxx_20250319#将fix/xxxxxx_20250319合并到当前分支
Windows Docker Desktop 无法启动报错 Docker Desktop is shutting down 的可能解决办法 Bruce-li__ Docker docker 容器运维
直接把整个AppData\Roaming\Docker目录删了，然后立刻就好了……这里还有一些其他的解决方案，Docker社区论坛也供参考：检查一下daemon.json配置文件是否有问题https://forums.docker.com/t/solved-docker-failed-to-start-docker-desktop-for-windows/106976
使用ssh-keygen命令生成密钥对无密码远程登陆linux主机哎哟喂我去 rhel6
我们在工作或试验中经常会需要登录多台linux主机进行操作，开启过多的ssh登陆界面，在不同的主机间切换时是非常让人的抓狂一件事情，只登陆一台linux主机然后通过此主机ssh登陆到其他主机这样是比较好的一种方式，但是在ssh登陆到其他主机时频繁的输入密码会让我们一直做重复的输入密码的工作，那有没有可以自动记住密码，或者不需要输入密码的工具呢？linux自带的ssh-kengen命令可以让我们轻松
Android Compose 框架基本状态管理（mutableStateOf、State 接口）深入剖析(十四) &有梦想的咸鱼& android
AndroidCompose框架基本状态管理（mutableStateOf、State接口）深入剖析一、引言在Android开发的历史长河中，UI开发模式经历了从传统的XML布局到动态视图操作，再到如今声明式UI框架的转变。AndroidCompose作为Google推出的新一代声明式UI工具包，为开发者带来了全新的UI开发体验。其中，状态管理是Compose框架的核心概念之一，它决定了UI如何根
PyQt6/PySide6 的 QSettings 类（配置管理）燃灯工作室 Pyside python 开发语言
一、QSettings核心机制存储原理：基于键值对的持久化存储Windows：注册表路径HKEY_CURRENT_USER\Software\[组织名]\[应用名]macOS：~/Library/Preferences/[组织名].[应用名].plistLinux：~/.config/[组织名]/[应用名].conf基础代码框架：fromPySide6.QtCoreimportQSettings#
FreeRTOS从入门到实战精通指南（一） niuTaylor RTOS学习与实战单片机嵌入式硬件 RTOS FREERTOS
FreeRTOS从入门到实战精通指南一、核心知识体系搭建1.FreeRTOS架构全景图硬件层FreeRTOS内核核心模块任务管理内存管理通信机制队列信号量事件组中断管理调度器二、关键概念深度解析1.抢占式调度vs中断特性抢占式调度中断触发机制软件触发（调度器决策）硬件触发（外设请求）响应速度微秒级（依赖任务切换时间）纳秒级（硬件直接响应）执行上下文任务上下文中断上下文典型应用场景任务优先级管理硬件
一文说清预训练与微调：AI的双重训练法则 TGITCIC AI-大模型的落地之道人工智能深度学习
什么是预训练？预训练是大型语言模型训练的第一步。它在资金和计算能力的支持下，通过深入分析大量的文本数据，使模型建立起语言的基本构架。在这一阶段，模型通过学习海量的书籍、文章和网页，识别出语言的语法、句法和词汇规律。这就如同一名学生接受通识教育，他并没有专注于某一门学科，而是获取了多方面的知识。自回归语言建模和掩码语言建模是预训练中常见的两种方法。前者在逐步构建文本的连贯性时，通过预测下一单词的方式
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
鸿蒙系统--搭建Ubuntu环境 ice_junjun ubuntu linux bash
搭建Ubuntu环境在嵌入式开发中，很多开发者习惯于使用Windows进行代码的编辑，比如使用Windows的VisualStudioCode进行OpenHarmony代码的开发。但当前阶段，大部分的开发板源码还不支持在Windows环境下进行编译，如Hi3861、Hi3516系列开发板。因此，建议使用Ubuntu的编译环境对源码进行编译。在以上的设备开发场景中，可以搭建一套Windows+Ubu
开发小型、专业、安全且可扩展的语言模型：Arcee的实用指南 fgayif 安全语言模型人工智能 python
技术背景介绍在现代企业中，利用语言模型提升效率和推动创新已成为趋势。然而，大型语言模型（LLMs）的高资源消耗和安全性问题，往往让企业望而却步。为解决这些问题，Arcee提供了一种全新的解决方案：小型、专业、安全且可扩展的语言模型（SLMs）。通过SLM适配系统和无缝、可靠的集成，Arcee使企业能够充分发挥领域适应型语言模型的潜力。核心原理解析Arcee的核心在于其SLM适配系统，允许用户根据特
JavaScript的函数拦截技术详解天天进步2015 前端开发 javascript 开发语言 ecmascript
引言在JavaScript的世界里，函数是一等公民。它们可以被赋值给变量，作为参数传递，甚至可以被动态修改。函数拦截（FunctionInterception）是一种强大的技术，允许开发者在不修改原始函数代码的情况下，拦截、监控和修改函数的行为。本文将深入探讨JavaScript函数拦截的各种技术、应用场景以及最佳实践。什么是函数拦截？函数拦截是指在函数执行前、执行中或执行后插入自定义逻辑的过程。
Maven插件学习（一）——生成可执行的 JAR 文件螺旋小蜗 maven jar maven插件学习
默认打包生成的jar是不能够直接运行的，因为带有main方法的类信息不回添加到manifest中（打开jar文件中META/MANIFEST.MF文件，将无法看到Main-Class行）maven-shade-plugin插件生成可运行的jar文件,该插件会自动将依赖包生成到jar包中。maven-assembly-plugin插件生成可运行的jar文件,需要配置属性jar-with-depend
基础实验3-2.4 出栈序列的合法性(栈和队列的运用c语言) Feliz.. 数据结构数据结构
题目:给定一个最大容量为m的堆栈，将n个数字按1,2,3,...,n的顺序入栈，允许按任何顺序出栈，则哪些数字序列是不可能得到的？例如给定m=5、n=7，则我们有可能得到{1,2,3,4,5,6,7}，但不可能得到{3,2,1,7,5,6,4}。输入格式：输入第一行给出3个不超过1000的正整数：m（堆栈最大容量）、n（入栈元素个数）、k（待检查的出栈序列个数）。最后k行，每行给出n个数字的出栈序
从注册到落地：Temu中亚首站瞄准乌兹别克斯坦消费潜力香菜9527 人工智能业界资讯经验分享
从注册到落地：Temu中亚首站瞄准乌兹别克斯坦消费潜力近年来，全球跨境电商市场格局加速演变，中国跨境电商平台正积极拓展海外市场。继在北美、欧洲、澳大利亚等地区取得显著成绩后，拼多多旗下跨境电商平台Temu正式开启中亚市场布局。乌兹别克斯坦成为Temu在中亚的首个重点市场，标志着其全球扩张战略进入新的阶段。乌兹别克斯坦市场潜力与政策环境乌兹别克斯坦作为中亚人口最多的国家（约3500万人），近年来消费
Golang可选参数实践 yzh_1346983557 golang 可选参数
背景：go不支持类似java的方法重载，但对于函数的可选参数和默认参数配置，通常要在不影响不破坏现有逻辑基础上进行参数的添加。实现：通过options选项，使用函数进行参数的初始化和可选值的设置。代码：packagemainimport"fmt"//go实现可选参数实践//背景：go不支持方法重载，但对于函数的可选参数和默认参数配置，通常要在不影响不破坏现有逻辑基础上进行参数的添加//实现：通过o
linux系统安全加固 xiejin007 linux运维 linux 运维
linux系统安全加固linux系统安全加固linux系统安全加固脚本系统加固脚本下载地址：https://download.csdn.net/download/hzgnet2021/63201374时间获取脚本开头先获取本机时间#Variablerq=`date+%Y%m%d`Linux禁用不使用的用户将passwd先复制一份备份，然后将以下不使用的用户都禁用，如后期有需要恢复可使用passwd
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
知识图谱系列文章——文物知识图谱 weixin_43407382 知识图谱
文章介绍背景1、文物可以提供创意，如哥窑面饰的照相机2、目前文物数字化工作非常少，没有纳入设计元素3、文物知识图谱建成后具有很多好处&#￥方法一、本体构建1、明确领域和目的——文物知识图谱&设计创意2、领域信息采集与分析——文物信息，３４０件文物实例，3、定义文物本体概念和结构层次4、定义概念属性和属性约束5、本体编码（建模语言和工具）6、本体评估——Jena的内嵌推理机，基于描述的逻辑7、本体实
Ubuntu新服务器安装流程整理 Sion木子 Linux 服务器 ubuntu linux 1024程序员节
Ubuntu新服务器安装流程整理1、修改计算机名2、设置时区与时间3、修改DNS4、更新软件包列表，升级软件包5、清理不再需要的软件包6、清理缓存7、更换内核8、设置SSH空闲超时时间9、设置SSH密码最小间隔天数10、配置GRUB引导加载程序文件权限11、处理具有SUID和SGID权限的文件以防止潜在的权限提升风险12、限制核心转储（coredumps）、禁Ping、开启TCP-SYNcooki
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户