Blackrosetian

R语言做线性回归

1.回归的多面性

回归类型	用途
简单线性	个量化的解释变量来预测一个量化的响应变量（一个因变量、一个自变量）
多项式	一个量化的解释变量预测一个量化的响应变量，模型的关系是 n阶多项式（一个预测变量，但同时包含变量的幂）
多元线性	用两个或多个量化的解释变量预测一个量化的响应变量（不止一个预测变量）
多变量	用一个或多个解释变量预测多个响应变量
Logistic	用一个或多个解释变量预测一个类别型变量
泊松	用一个或多个解释变量预测一个代表频数的响应变量
Cox比例风险	用一个或多个解释变量预测一个事件（死亡、失败或旧病复发）发生的时间时间序列对误差项相关的时间序列数据建模
非线性	用一个或多个量化的解释变量预测一个量化的响应变量，不过模型是非线性的
非参数	用一个或多个量化的解释变量预测一个量化的响应变量，模型的形式源自数据形式，不事先设定
稳健	用一个或多个量化的解释变量预测一个量化的响应变量，能抵御强影响点的干扰

2.OLS回归

OLS回归是通过预测变量的加权和来预测量化的因变量，其中权重是通过数据估计而得以的参数。

使残差平方和最小

为能够恰当地解释OLS模型的系数，数据必须满足以下统计假设：

（1）正态性对于固定的自变量，因变量值成正态分布

（2）独立性 Yi值之间相互独立

（3）线性因变量与自变量之间为线性相关

（4）同方差性因变量的方差不随自变量的水平不同而变化，即不变方差或同方差性

3. 用lm（）拟合回归模型

拟合线性模型最基本的函数就是lm（），格式为：

myfit<-lm(formula,data)

formula指要拟合的模型形式，data是一个数据框，包含了用于拟合模型的数据

formula形式如下：Y~X1+X2+……+Xk （~左边为响应变量，右边为各个预测变量，预测变量之间用+符号分隔）

R表达式中常用的符号
符号	用途
~	分隔符号，左边为响应变量，右边为解释变量，eg：要通过x、z和w预测y，代码为y~x+z+w
+	分隔预测变量
：	表示预测变量的交互项 eg：要通过x、z及x与z的交互项预测y，代码为y~x+z+x:z
*	表示所有可能交互项的简洁方式，代码y~xzw可展开为y~x+z+w+x:z+x:w+z:w+x:z:w
^	表示交互项达到某个次数，代码y~(x+z+w)^2可展开为y~x+z+w+x:z+x:w+z:w
.	表示包含除因变量外的所有变量，eg：若一个数据框包含变量x、y、z和w，代码y~.可展开为y~x+z+w
-	减号，表示从等式中移除某个变量，eg：y~(x+z+w)^2-x:w可展开为y~x+z+w+x:z+z:w
-1	删除截距项，eg：表示y~x-1拟合y在x上的回归，并强制直线通过原点
I（）	从算术的角度来解释括号中的元素。Eg：y~x+(z+w)^2将展开为y~x+z+w+z:w。相反，代码y~x+I((z+w)^2)将展开为y~x+h，h是一个由z和w的平方和创建的新变量
function	可以在表达式中用的数学函数，例如log(y)~x+z+w表示通过x、z和w来预测log(y)

对拟合线性模型非常有用的其他函数
函数	用途
Summary（）	展示拟合的详细结果
Coefficients（）	列出拟合模型的模型参数（截距项和斜率）
Cofint（）	提供模型参数的置信区间（默认95%）
Fitted（）	列出拟合模型的预测值
Residuals（）	列出拟合模型的残差值
Anova（）	生成一个拟合模型的方差分析，或者比较两个或更多拟合模型的方差分析表
Vcov（）	列出模型参数的协方差矩阵
AIC（）	输出赤池信息统计量
Plot（）	生成评价拟合模型的诊断图
Predict（）	用拟合模型对新的数据集预测响应变量值

4. 简单线性回归

eg：

[plain]  view plain  copy 
     
 fit<-lm(weight~height,data=women)  
 summary(fit)  

在Pr(>|t|)栏，可以看到回归系数（3.45）显著不为0（p<0.001），表明身高每增加1英寸，体重将预期地增加3.45磅

R平方项（0.991）表明模型可以解释体重99.1%的方差，它也是实际和预测值之间的相关系数（R^2=r^2）

残差的标准误（1.53lbs）则可认为模型用身高预测体重的平均误差

F统计量检验所有的预测变量预测响应变量是否都在某个几率水平之上

[plain]  view plain  copy 
     
 fitted(fit)#拟合模型的预测值  

[plain]  view plain  copy 
     
 residuals(fit)#拟合模型的残差值  

[plain]  view plain  copy 
     
 plot(women$height,women$weight,  
      xlab="Height （in inches）",  
      ylab="Weight（in pounds）")  
 abline(fit)  

5. 多项式回归

[plain]  view plain  copy 
     
 fit2<-lm(weight~height+I(height^2),data=women)  
 summary(fit2)  

[plain]  view plain  copy 
     
 plot(women$height,women$weight,  
      xlab="Height（in inches）",  
      ylab="Weight（in lbs）")  
 lines(women$height,fitted(fit2))  

一般来说，n次多项式生成一个n-1个弯曲的曲线

car包中的scatterplot（）函数，可以很容易、方便地绘制二元关系图

[plain]  view plain  copy 
     
 scatterplot(weight~height,  
             data=women,  
             spread=FALSE,  
             lty.smooth=2,  
             pch=19,  
             main="Women Age 30-39",  
             xlab="Height (inches)",  
             ylab="Weight(lbs.)")  

6.多元线性回归

采用的数据集：state.x77

[plain]  view plain  copy 
     
 states<-as.data.frame(state.x77[,c("Murder","Population","Illiteracy","Income","Frost")])  

检测二变量关系

[plain]  view plain  copy 
     
 cor(states)  

[plain]  view plain  copy 
     
 library(car)  
 scatterplotMatrix(states,spread=FALSE,lty.smooth=2,main="Scatter Plot Matrix")  

scatterplotMatrix（）函数默认在非对角线区域绘制变量间的散点图，并添加平滑（loess）和线性拟合曲线

多元线性回归

[plain]  view plain  copy 
     
 fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)  
 summary(fit)  

7.有交互项的多元线性回归

[plain]  view plain  copy 
     
 fit<-lm(mpg~hp+wt+hp:wt,data=mtcars)  
 summary(fit)  

通过effects包中的effect（）函数，可以用图形展示交互项的结果

[plain]  view plain  copy 
     
 fit<-lm(mpg~hp+wt+hp:wt,data=mtcars)  
 summary(fit)  
   
 install.packages("effects")  
 library(effects)  
 plot(effect("hp:wt",fit,  
             list(wt=c(2.2,3.2,4.2))),multiline=TRUE)  

8.回归诊断

（1）标准方法

[plain]  view plain  copy 
     
 简单线性回归  

[plain]  view plain  copy 
     
 fit<-lm(weight~height,data=women)  
 par(mfrow=c(2,2))  
 plot(fit)  

正态性：当预测变量值固定时，因变量成正态颁，则残差图也应是一个均值为0的正态颁。正态Q-Q图是在正态颁对应的值上，标准化残差的概率图，若满足正态假设，则图上的点应该落在吓45度角的直线上，若不是，则违反了正态性假设。

独立性：只能从收集的数据中来验证。

线性：若因变量与自变量线性相关，则残差值与预测（拟合）值就没有任务系统关联，若存在关系，则说明可能城要对回归模型进行调整。

同方差性：若满足不变方差假设，则在位置尺度图（Scale-Location Graph）中，水平线周围的点应随机分布。

二次拟合诊断图

[plain]  view plain  copy 
     
 fit2<-lm(weight~height+I(height^2),data=women)  
 par(mfrow=c(2,2))  
 plot(fit2)  

（2）改进的方法

（car包中的）回归诊断实用函数

函数	目的
qqPlot（）	分位数比较图
durbinWatsonTest（）	对误差自相关性做Durbin-Watson检验
crPlots（）	成分与残差图
ncvTest（）	对非恒定的误差方差做得分检验
spreadLevelPlot（）	分散水平检验
outlierTest（）	Bonferroni离群点检验
avPlots（）	添加的变量图形
inluencePlot（）	回归影响图
scatterplot（）	增强的散点图
scatterplotMatrix（）	增强的散点图矩阵
vif（）	方差膨胀因子

另gvlma包提供了对所有线性模型进行检验的方法

正态性：

与 plot（）函数相比，qqplot（）函数提供了更为精确的正态假设检验方法，画出了n-p-1个自由度的t分布下的学生化残差图形，n为样本大小，p是回归参数的数目（包括截距项）

eg：

[plain]  view plain  copy 
     
 library(car)  
 fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)  
 qqPlot(fit,labels=row.names(states),id.method="identify",simulate=TRUE,main="Q-Q Plot")  

绘制学生残差图的函数

[plain]  view plain  copy 
     
 residplot<-function(fit,nbreaks=10){  
   z<-rstudent(fit)  
   hist(z,breaks=nbreaks,freq=FALSE,  
        xlab="Studnetized Residual",  
        main="Distribution of Errors")  
   rug(jitter(z),col="brown")  
   curve(dnorm(x,mean=mean(z),sd=sd(z)),  
         add=TRUE,col="blue",lwd=2)  
   lines(density(z)$x,density(z)$y,  
         col="red",lwd=2,lty=2)  
   legend("topright",  
          legend=c("Normal Curve","Kernel Density Curve"),  
          lty=1:2,col=c("blue","red"),cex=0.7)}  
 residplot(fit)  

误差的独立性：

之前提到可依据收集数据判断因变量是否独立

car包中提供了一个可做Durbin-Watson检验的函数，可检测误差的序列相关性

[plain]  view plain  copy 
     
 durbinWatsonTest(fit)  

线性：

可通过成分残差图即偏残差图，判断因变量与自变量之间是否呈非线性关系，也可以看是否不同于已设定线性模型的系统偏差，图形可用car包中crPlots（）函数绘制

[plain]  view plain  copy 
     
 library(car)  
 crPlots(fit)  

若图形存在非线性，则说明可能对预测变量的函数形式建模不够充分

car包提供了两个有用的函数，可判断误差方差是否恒定

ncvTest（）函数生成一个计分检验，零假设为误差方差不变

spreadLevelPlot（）函数创建一个添加了最佳拟合曲线的散点图，展示标准化残差绝对值与拟合值的关系

检验同方差性：

[plain]  view plain  copy 
     
 library(car)  
 ncvTest(fit)  
 spreadLevelPlot(fit)  

（3）线性模型假设的综合验证

gvlma包中的gvlma（）函数

[plain]  view plain  copy 
     
 install.packages("gvlma")  
 library(gvlma)  
 gvmodel<-gvlma(fit)  
 summary(gvmodel)  

（4）多重共线性

VIF（Variance Inflation Factor，方差膨胀因子）进行检测

一般原则下，(VIF)^1/2 >2表明存在多重共线性问题

[plain]  view plain  copy 
     
 library(car)  
 vif(fit)  
 sqrt(vif(fit))>2  

9.异常观测值

（1）离群点

离群点指那些模型预测效果不佳的观测点，通常有很大的、或正或负的残差，正残差说明模型低估了响应值，负残差说明高佑了响应值

[plain]  view plain  copy 
     
 library(car)  
 outlierTest(fit)  

outlierTest（）函数是根据单个最大（或正或负）残差值的显著性来判断是否有离群点，若不显著，则说明数据集中没有离群点，若显著，则必须删除该离群点，然后再检验是否还有其他离群点存在。

（2）高杠杆值点

高杠杆值观测点，即是与其他预测变量有关的离群点，即它们是由许多异常的预测变量组合起来的，与响应变量值没有关系。

高杠杆值的观测点可通过帽子统计量（hat statistic）判断。对于一个给定的数据集，帽子均值为p/n，其中p是模型估计的参数数目（包含截距项），n是样本量。一般来说，若观测点的帽子值大于帽子均值的2或3倍，则可认定为高杠杆值点。

[plain]  view plain  copy 
     
 hat.plot<-function(fit){  
   p<-length(coefficients(fit))  
   n<-length(fitted(fit))  
   plot(hatvalues(fit),main="Index Plot of Hat Values")  
   abline(h=c(2,3)*p/n,col="red",lty=2)  
   identify(1:n,hatvalues(fit),names(hatvalues(fit)))  
 }  
 hat.plot(fit)  

（3）强影响点

强影响点，即对模型参数估计值影响有些比例失衡的点。例如，当移除模型的一个观测点时模型会发生巨大的改变，那么需要检测一下数据中是否存在强影响点。

检测方法

Cook距离，或称为D统计量 Cook's D值大于4/(n-k-1)，则表明它是强影响点，其中n为样本量大小，k是预测变量数目（有助于鉴别强影响点，但并不提供关于这些点如何影响模型的信息）

变量添加图（added variable plot）（弥补了该缺陷）（对于每个预测变量Xk，绘制Xk在其他k-1个预测变量上回归的残差值相对于响应变量在其他k-1个预测变量上回归的残差值的关系图）

[plain]  view plain  copy 
     
 cutoff<-4/(nrow(states)-length(fit$coefficients)-2)  
 plot(fit,which=4,cook.levels=cutoff)  
 abline(h=cutoff,lty=2,col="red")  

[plain]  view plain  copy 
     
 library(car)  
 avPlots(fit,ask=FALSE,onepage=TRUE,id.method="identify")  

car包中的influencePlot（）函数，可将离群点、杠杆点和强影响点的信息整合到一幅图形中

[plain]  view plain  copy 
     
 library(car)  
 influencePlot(fit,id.method="identify",main="Influence Plot",  
               sub="Circle size if proportional to Cook's distance")  

影响图。纵坐标超过2或小于-2的州可被认为是离群点，水平轴超过0.2或0.3的州有高杠杆值（通常为预测值的组合）。圆圈大小与影响成比例，圆圈很大的点可能是对模型估计造成的不成比例影响的强影响点。

10.改进的措施

（1）删除观测点

删除观测点可提高数据集对于正态假设的拟合度，而强影响点会干扰结果，通常也会被删除。删除最大的离群点或强影响点，模型需要重新拟合，若离群点或强影响点仍然存在，重复以上过程直到获得比较满意的拟合。

对删除观测点应持谨慎态度。

（2）变量变换

当模型不符合正态性、线性或同方差性假设时，一个或多个变量的变换通常可以改善或调整模型效果。

当模型违反了正态假设时，通常可以对响应变量尝试某种变换。

car包中的powerTransform（）函数

Box-Cox正态变换

[plain]  view plain  copy 
     
 library(car)  
 summary(powerTransform(states$Murder))  

（3）增删变量

改变模型的变量会影响模型的拟合度，增加或删除变量

多重共线问题：岭回归

11.选择“最佳”的回归模型

（1）模型比较

anova（）函数可比较两个嵌套模型的拟合优度

嵌套模型即指它的一个些项完全饮食在另一个模型中

用anova（）函数比较

[plain]  view plain  copy 
     
 fit1<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)  
 fit2<-lm(Murder~Population+Illiteracy,data=states)  
 anova(fit2,fit1)  

模型1嵌套在模型2中，检验不显著，基础知识不需要将Income和Frost添加到线性模型中，可将它们从模型中删除

AIC（Akaike Information Criterion，赤池信息准则）可用来比较模型，考虑了模型的统计拟合度及用来拟合的参数数目

AIC值越小的模型要优行选择，说明模型用较少的参数获得了足够的拟合度

[plain]  view plain  copy 
     
 fit1<-lm(Murder~Population+Illiteracy+Income+Frost,  
          data=states)  
 fit2<-lm(Murder~Population+Illiteracy,data=states)  
 AIC(fit1,fit2)  

（2）变量选择

逐步回归法（stepwise method）：

向前逐步回归（forward stepwise）每次添加一个预测变量到模型中，直到添加变量不会使模型有所改进为止。

向后逐步回归（backward stepwise）从模型包含所有预测变量开始，一次删除一个变量直到会降低模型质量为止。

向前向后逐步回归（stepwise stepwise 逐步回归）

MASS包中的steAIC（）函数可实现逐步回归模型，依据的是精确AIC准则

[plain]  view plain  copy 
     
 后向回归  
 library(MASS)  
 fit1<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)  
 stepAIC(fit,direction="backward")  

全子集回归（all-subsets regression）：

全子集回归，即所有可能的酣篮队支被检验，可选择展示所有可能的结果，也可展示n个不同子集大小（一个、两个或多个预测变量）的最佳模型

可用leaps包中的regsubsets（）函数实现

可通过R平方、调整R平方或Mallows Cp统计量等准则来选择“最佳”模型

R平方是预测变量解释响应变量的程度

调整R平方与之类似，但考虑了模型的参数数目

Mallows Cp统计量也用来作为逐步回归的判停规则，对于一个好的模型，它的Cp统计量非常迫近于模型的参数数目（包括截距项）

[plain]  view plain  copy 
     
 install.packages("leaps")  
 library(leaps)  
 leaps<-regsubsets(Murder~Population+Illiteracy+Income+Frost,data=states,nbest=4)  
 plot(leaps,scale="adjr2")  

[plain]  view plain  copy 
     
 library(car)  
 subsets(leaps,statistic="cp",main="Cp Plot for All Subsets Regression")  
 abline(1,1,lty=2,col="red")  

12. 深层次分析

（1）交叉验证

交叉验证即将一定比例的数据挑选出来作为训练样本，另外的样本作为保留样本，先在训练样本上获取回归方程，然后在保留样本上做预测。由于保留样本不涉及模型及参数的选择，该样本可获得比新数据更为精确的估计。

k重交叉难中，样本被分为k个子样本，轮流将k-1个子样本组合作为训练集，另外1个子样本作为保留集，这样会获得k个预测方程，记录k个保留样本的预测表现结果，然后求其平均值。【当n是观测总数目，k为n时，该方法又称作刀切法（jackknifing）】

bootstrap包中的crossval（）函数可实现k重交叉验证

[plain]  view plain  copy 
     
 install.packages("bootstrap")  
 library(bootstrap)  
 shrinkage<-function(fit,k=10){  
   require(bootstrap)  
   theta.fit<-function(x,y){lsfit(x,y)}  
   theta.predict<-function(fit,x){cbind(1,x)%*%fit$coef}  
   x<-fit$model[,2:ncol(fit$model)]  
   y<-fit$model[,1]  
   results<-crossval(x,y,theta.fit,theta.predict,ngroup=k)  
   r2<-cor(y,fit$fitted.values)^2  
   r2cv<-cor(y,results$cv.fit)^2  
   cat("Original R-square=",r2,"\n")  
   cat(k,"Fold Cross-Validated R-square=",r2cv,"\n")  
   cat("Change=",r2-r2cv,"\n")  
 }  
 fit<-lm(Murder~Population+Income+Illiteracy+Frost,data=states)  
 shrinkage(fit)  
 fit2<-lm(Murder~Population+Illiteracy,data=states)  
 shrinkage(fit2)  

（2）相对重要性

[plain]  view plain  copy 
     
 zstates<-as.data.frame(scale(states))  
 zfit<-lm(Murder~Population+Income+Illiteracy+Frost,data=zstates)  
 coef(zfit)  

相对权重：是对所有可能子模型添加一个预测变量引起的R平方均增加量的一个近似值。

[plain]  view plain  copy 
     
 relweights<-function(fit,……){  
   R<-cor(fit$model)  
   nvar<-ncol(R)  
   rxx<-R[2:nvar,2:nvar]  
   rxy<-R[2:nvar,1]  
   svd<-eigen(rxx)  
   evec<-svd$vectors  
   ev<-svd$values  
   delta<-diag(sqrt(ev))  
   lambda<-evec%*%delta%*%t(evec)  
   lambdasq<-lambda^2  
   beta<-solve(lambda)%*%rxy  
   rsqrare<-colSums(beta^2)  
   rawwgt<-lambdasq%*%beta^2  
   import<-(rawwgt/rsquare)*100  
   lbls<-names(fit$model[2:nvar])  
   rownames(import)<-lbls  
   colnames(import)<-"Weight"  
   barplot(t(import),names.arg=lbls,  
           ylab="% of R-Square",  
           xlab="Predictor Variables",  
           main="Relative Importance of Predictor Variables",  
           sub=paste("R-Square=",round(rsquare,digits=3)),……)  
   return(import)  
 }  
 fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=states)  
 relweights(fit,col="lightgrey")  

你可能感兴趣的:(R,机器学习)

用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
【证明】对极几何：本质矩阵内在性质 Powerful_QI slam 线性代数矩阵
--这是目录--1.本质矩阵内在性质表述2.预备知识2.1线性代数基础2.1.1奇异值与特征值的关系2.1.2矩阵加减单位阵后特征值的变化2.2引理：一个常用的矩阵变换3.证明1.本质矩阵内在性质表述本质矩阵(EssentialMatrix)EEE是一个3阶方阵，满足E=t∧RE=t^{\land}RE=t∧R其中RRR为旋转矩阵，ttt为平移量，t∧t^{\land}t∧运算定义如下（参考了
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
Ubuntu 服务器虚拟主机,ubuntu云服务器虚拟机 Gamer42 Ubuntu 服务器虚拟主机
ubuntu云服务器虚拟机内容精选换一换通过云服务器或者外部镜像文件创建私有镜像时，如果云服务器或镜像文件所在虚拟机的网络配置是静态IP地址时，您需要修改网卡属性为DHCP，以使私有镜像发放的新云服务器可以动态获取IP地址。本节以WindowsServer2008R2操作系统为例。其他操作系统配置方法略有区别，请参考对应操作系统的相关资料进行操作，文档中不对此进行详细说明后端虚拟机绑定EIP。登录
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
dpdk-testpmd 统计显示
背景最近在做测试的发现testpmdshowport统计的Tx-packets是个极大值，很不符合预期。硬件同学说，这个是软件统计，一定是软件问题。我大概知道它是个硬件统计，但是并不能确定，于是，做了一下代码的分析。testpmd>showportstats0########################NICstatisticsforport0########################R
php加密的是什么,看看下面这个php代码是使用什么加密的? xiao龟 php加密的是什么
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
php rad加密公钥过长,看看下面这个php代码是使用什么加密的? 范特嘻嘻 php rad加密公钥过长
加密的代码如下：!/usr/bin/php-qeNrtWWlTG1cW/SvY5Yqg4krevoSQuIUEiE0LYAwuijKbEGA2YbMk+TUOjEnyc976b+Y2pKZqpNcgz3gm46r5BpL69Ln3nnvved3PrrFyRhOJEAoySvT66ceoMFbS02BNEFE8XRsLRAmkHI7eKMxMHC7tnKOz+Ytuezt7SUrPS6TcOa0c6
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
访问远程共享文件时“连到系统上的设备没有发挥作用”错误解决方法 s_nshine 文件服务器
问题症状：在访问远程共享目录（比如Moabn）有时可能会遇到这个错误，提示“连到系统上的设备没有发挥作用”的错误。解决方法：1、按下Win+R组合键（Win是Alt旁边那个键），在“运行”里输入services.msc，点击确定。2、在打开的系统服务窗口中，检查下面三个系统服务项是否启动。如果没有启动，双击在属性里启动，另外“启动类型”也建议设置为自动。DHCPClientDNSClientRou
麒麟v10arm64自制nginx1.26.1的docker镜像包睡不醒的双眼皮 docker nginx
#基础镜像openeuler2203arm64#1.宿主机下载nginx对应版本编译./configure--prefix=/usr/local/nginx--conf-path=/etc/nginx/nginx.conf&&make&&makeinstall2.#创建构建镜像目录mkdir/opt/dockerfilecp-r/usr/local/nginx/opt/dockerfile/ngi
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
显示遇到一些临时服务器问题,大师为你细说win10系统登录office提示“遇到一些临时服务器问题”的学习... Love Snape 显示遇到一些临时服务器问题
我们在操作win10系统电脑的时候,常常会遇到win10系统登录office提示“遇到一些临时服务器问题”的情况，想必大家都遇到过win10系统登录office提示“遇到一些临时服务器问题”的情况吧，那么应该怎么处理win10系统登录office提示“遇到一些临时服务器问题”呢？我们依照按下win+R组合键打开运行，在框中输入regedit，打开”注册表辑器“；在注册表左侧菜单一次展开：HKEY_
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
添加行号（python版）
添加行号#打开PyCharm，新建一个新的py文件，取名demo，生成demo.py文件lines_maxlenth=0#定义新的变量，储存最长的代码长度line_numbers=1#每次加一，代表当前正在添行号的位置code_in=open("demo.py","r").readlines()#打开demo.py文件，读取所有内容code_out=open("demo_new.py","w")#
Django Rest Framework 视图和路由 Matrix 工作室从源代码学Python
DRF的视图APIView我们django中写CBV的时候继承的是View，rest_framework继承的是APIView，那么他们两个有什么不同呢urlpatterns=[url(r'^book$',BookView.as_view()),url(r'^book/(?P\d+)$'
SQL注入与防御-第六章-3：利用操作系统--巩固访问
一、核心逻辑与价值“巩固访问”是SQL注入攻击的持久化控制阶段，通过篡改数据库权限、植入隐蔽后门（如“数据库rootkit”）、利用系统组件（如SQLServerSOAP端点），实现对数据库及关联服务器的长期控制，绕过常规防御检测，扩大攻击影响。二、技术实现与典型场景（一）数据库Rootkit植入（以Oracle为例）1.原理通过篡改数据库元数据、系统视图，隐藏恶意用户、权限或操作，类似操作系统R
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
Linux面试问题-软件测试
1、你在上一家公司常用的Linux命令有哪些？答：使用vim/vi编辑文件，使用cat，more,less，head查看文件，使用grep过滤日志中的error,使用ps查看进程，使用top查看实时进程，netstat查看端口，（df查看磁盘使用情况，du统计目录使用的大小，使用vmstat查看虚拟内存，使用free查看内存），还有一些其他比如使用scp拷贝文件，mv重命名，mkdir创建目录，r
进制转换原理与实现详解
一、进制系统基础概念1.1位权计数法原理十进制系统：采用10ⁿ位权体系，每个数字的位置代表不同的权重。例如数字"365"表示为：3×10²+6×10¹+5×10⁰=300+60+5=365通用r进制系统：遵循rⁿ位权表达方式。对于r进制数"dₙdₙ₋₁...d₁d₀"，其十进制值为：∑dᵢ×rⁱ(i=0到n)。例如：二进制1011=1×2³+0×2²+1×2¹+1×2⁰=11八进制745=7×8²
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》