数据会说话

logistic的应用

当通过一系列连续型数据或类别性预测变量来预测二值型结果变量时，Logistic是一个非常常用的工具。
模型假设Y服从二项分布，线性模型的拟合形式为

其中， π 为给定一系列X值时Y=1的概率，（ π /1- π ）为Y=1时的优势比，log（ π /1- π ）为对数优势比。
我们以AER包中的数据框为例，通过研究婚外情的数据来阐述Logistic回归过程。本例基于R语言实现，请确保已经下载软件及AER 安装包。

install.packages("AER")
library(AER)

###数据背景
婚外情数据即著名的“Fair’s Affairs",取自1969年《今日心理》所做的一个非常有代表性的调查，该数据从601个参与者身上搜集了9个变量，包括一年来婚外私通频率，参与者性别，年龄，婚龄，是否有小孩，宗教信仰程度（5分制，1分表示反对，5分表示非常信仰
），学历，职业（逆向编号的戈登七种分类），对婚姻的自我评分（5分制，1分表示非常不幸福，5表示非常幸福）

###数据预处理

data(Affairs)
summary(Affairs)
attach(Affairs)#绑定数据集
table(affairs)

affairs
0 1 2 3 7 12
451 34 17 19 42 38

上面给出了婚姻轻率举动的次数，但是我们更感兴趣的是二值型结果（有过婚外情的和没有过的）所以我们需要将affairs转换为二值型因子ynaffair

Affairs$ynaffair[affairs>0]<-1#次数大于0的设为1
Affairs$ynaffair[affairs==0]<-0#次数为0的设为0
Affairs$ynaffair<-factor(Affairs$ynaffair,levels = c(0,1),labels=c("NO","Yes"))#次数为0的设为NO
table(Affairs$ynaffair)

NO Yes
451 150
以上就是我们想要的结果
###建立模型

m1<-glm(ynaffair~.,data=Affairs,family=binomial())
#因变量为ynaffair，自变量为其余变量

Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
这里出现了两个错误，让我们看一下这两个错误的意思：
第一个是说算法没有拟合；第二个是说拟合机率算出来是数值零或一
具体解决方法参考下方链接，给出了具体的分析过程
第一个问题的解决方法只需要增加迭代次数即可（默认为25）
第二个问题说明我们选取的变量是完全可分的，不适合用logistic进行拟合，但为了解释一下大致步骤，我们继续往下进行。
下面我们修改模型

m2<-glm(ynaffair~age+yearsmarried+religiousness+rating,data=Affairs,family = binomial())
summary(m2)
Call:
glm(formula = ynaffair ~ age + yearsmarried + religiousness + 
    rating, family = binomial(), data = Affairs)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.6278  -0.7550  -0.5701  -0.2624   2.3998  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)    1.93083    0.61032   3.164 0.001558 ** 
age           -0.03527    0.01736  -2.032 0.042127 *  
yearsmarried   0.10062    0.02921   3.445 0.000571 ***
religiousness -0.32902    0.08945  -3.678 0.000235 ***
rating        -0.46136    0.08884  -5.193 2.06e-07 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 675.38  on 600  degrees of freedom
Residual deviance: 615.36  on 596  degrees of freedom
AIC: 625.36

Number of Fisher Scoring iterations: 4

可以看出年龄，婚龄，宗教信仰程度，对婚姻的自我评分对方程的贡献都是显著的（原假设：参数为0；P<0.05,拒绝原假设）
###模型检验
新模型的每个回归系数都非常显著，由于两模型嵌套（m2是m1的一个子集，可以使用anova函数对他们进行比较，对于广义线性模型可以用卡方检验）

anova(m2,m1,test="Chisq")

###解释模型参数

〉coef(m2)
  (Intercept)           age  yearsmarried religiousness 
   1.93083017   -0.03527112    0.10062274   -0.32902386 
       rating 
  -0.46136144

在Logistic中，相应变量是Y=1的对数优势比（log）。回归系数的含义是当其他预测变量不变时，一单位预测变量的变化可引起的响应变量对数优势比的变化。

由于对数优势比的可解释性太差，可以对结果进行指数化

〉exp(coef(m2))
 (Intercept)           age  yearsmarried religiousness 
    6.8952321     0.9653437     1.1058594     0.7196258 
       rating 
    0.6304248

可看到婚龄增加一年，婚外情的优势比将乘以1.106（保持其他变量不变）,相反，年龄增加一岁，婚外情的优势比则乘以0.965.因此，随着婚龄的增加和年龄，宗教信仰与婚姻评分的降低，婚外情优势比将上升，因为预测变量不能等于0，截距项在这里没有特定意义。

下面给出了回归系数的置信区间

〉exp(confint(m2))
             2.5 %     97.5 %
(Intercept)   2.1255764 23.3506030
age           0.9323342  0.9981470
yearsmarried  1.0448584  1.1718250
religiousness 0.6026782  0.8562807
rating        0.5286586  0.7493370

最后预测变量一单位变化可能并不是我们最想关注的，对于二值型Logistic回归，某预测变量n单位的变化引起较高值上优势比的变化为exp(exp⁡⁡(β_j)^{n,它反映的信息更加重要。比如保持其他预测变量不变，婚龄增加一年，婚外情的优势比将乘以1.106，而如果婚龄增加10年，优势比将乘以1.106}10

-------------------------------------------------------------------------分割线--------------------------------

###预测泰坦尼克号生存人数(kaggle入门级）
###数据描述
泰坦尼克号是一次航船史上的大灾难，因为同名电影而广为人知。而在此次灾难中有多少人死亡，导致死亡的相关因素是什么？我们经过分析探寻结论.
由于灾难发生后场面及其混乱，加之文件管理不当、后世的种种说法又鱼龙混杂的因素，导致泰坦尼克号乘客与死难者的统计数据始终存疑。目前普遍认为罹难者人数可能在1490-1635人之间，其中可信度最高的数据是由英国贸易委员公布的：在灾难发生时，泰坦尼克号共搭载2224人，其中710人生还，1514人不幸罹难。这里我们选用kaggle上的数据，其中共计12个变量，分别是PassengerId，Survived ，Pclass ，Name ，Sex ，Age， SibSp， Parch ，Ticket ，Fare ，Cabin， Embarked。共计1309个观测，将其分为训练集和测试集，
训练集（train.csv）包含891个观测，测试集（test.csv）包含418个观测。
训练集被用来建立模型。对于训练集，提供了每个乘客的结果（也称为“地面实况”）。模型将基于乘客的性别和阶级等“特征”。
使用测试集来检验模型表现如何。对于测试组，不提供每个乘客的基本事实，使用训练的模型来预测他们是否在泰坦尼克号的沉没中幸免于难。
变量解释
Survived 生存 0 =否，1 =是
pclass 票类 1 = 1，2 = 2，3 = 3
sex 性别
age 年龄在几年
sibsp ＃泰坦尼克号上的兄弟姐妹/配偶
Parch ＃泰坦尼克号上的父母/孩子
Ticket 票号
Fare 乘客票价
Cabin 客舱号码
Embarked 开始登船港口 C =瑟堡，Q =皇后镇，S =南安普敦
可变注释
pclass：社会经济地位代表（SES）
1 =上
2 =中
3 =下

年龄：如果年龄小于1，年龄是分数。如果估计年龄，是xx.5

sibsp的形式：数据集定义这样的家庭关系…
兄弟姐妹=兄弟，姐妹，同父异母的弟弟，义妹
配偶=丈夫，妻子（包二奶和未婚夫被忽略）

Parch：将数据集定义这样的家庭关系…
父=母亲，父亲
儿童=女儿，儿子，继女，继子
有些孩子只带着保姆旅行，所以parch = 0。

###数据预处理

data.raw <- read.csv('train.csv',header=T,na.strings=c(""))#读取数据集
sapply(data.raw,function(x) sum(is.na(x)))#查看缺失值个数

PassengerId    Survived      Pclass        Name         Sex 
          0           0           0           0           0 
        Age       SibSp       Parch      Ticket        Fare 
        177           0           0           0           0 
      Cabin    Embarked 
        687           2

我们可以看出Age一栏又能177个缺失值，Cabin一栏有687个缺失值
这里我们用图表将缺失值画出来，可以更加直观的看出来

install.packages("Amelia")
library(Amelia)
missmap(training.data.raw, main = "Missing values vs observed")

对于缺失值怎么办？我们先判断与因变量无关的变量，也就是可以凭主观判断出来的，比如Name，Parch,Cabin,将其舍弃

data <- subset(data.raw,select=c(2,3,5,6,7,8,10,12))
head(data)
sapply(data,function(x) sum(is.na(x)))

Survived   Pclass      Sex      Age    SibSp    Parch     Fare 
       0        0        0        0        0        0        0 
Embarked 
       2

我们看到Embarked存在两个缺失值，一般对于数值型数据的缺失我们可以取其均值补充或者众数中位数，对于字符型数据取其众数，当然最快的方法是直接删除缺失数据所在的那一行，这只实用与缺失值较少的情况下

data$Age[is.na(data$Age)] <- mean(data$Age,na.rm=T)
data <- data[!is.na(data$Embarked),]#去掉缺失值
sapply(data,function(x) sum(is.na(x)))
dim(data)

查看一下确实删除了2行观测，现在我们有8个变量，889个观测
注意：建立模型是面向数据框进行操作，如果不是数据况，一定要先转换数据结构
下面我们基于训练集进行划分，同样分成两个组，以便于对模型进行检验。其中训练组800个观测，测试组89个观测

train <-data[c(1:800),]
test <- data[c(801:889),]
model <- glm(Survived~Pclass+Sex+Age+SibSp+Parch+Fare+Embarked,
             data=train,family=binomial())
summary(model)
Call:
glm(formula = Survived ~ Pclass + Sex + Age + SibSp + Parch + 
    Fare + Embarked, family = binomial(), data = train)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.6064  -0.5954  -0.4254   0.6220   2.4165  

Coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)  5.137627   0.594998   8.635  < 2e-16 ***
Pclass      -1.087156   0.151168  -7.192 6.40e-13 ***
Sexmale     -2.756819   0.212026 -13.002  < 2e-16 ***
Age         -0.037267   0.008195  -4.547 5.43e-06 ***
SibSp       -0.292920   0.114642  -2.555   0.0106 *  
Parch       -0.116576   0.128127  -0.910   0.3629    
Fare         0.001528   0.002353   0.649   0.5160    
EmbarkedQ   -0.002656   0.400882  -0.007   0.9947    
EmbarkedS   -0.318786   0.252960  -1.260   0.2076    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1065.39  on 799  degrees of freedom
Residual deviance:  709.39  on 791  degrees of freedom
AIC: 727.39

Number of Fisher Scoring iterations: 5

我们看到Pclass，Sex，Age，SibSp这几个变量所对应的P值小于0.05，即其参数显著不为0，由此修改模型

model2 <- glm(Survived~Pclass+Sex+Age+SibSp,
             data=train,family=binomial())
summary(model2)
Call:
glm(formula = Survived ~ Pclass + Sex + Age + SibSp, family = binomial(), 
    data = train)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.6595  -0.6125  -0.4247   0.6149   2.4302  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  5.05604    0.50130  10.086  < 2e-16 ***
Pclass      -1.14391    0.12585  -9.089  < 2e-16 ***
Sexmale     -2.75564    0.20471 -13.461  < 2e-16 ***
Age         -0.03725    0.00812  -4.588 4.48e-06 ***
SibSp       -0.33075    0.10892  -3.037  0.00239 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1065.39  on 799  degrees of freedom
Residual deviance:  713.43  on 795  degrees of freedom
AIC: 723.43

Number of Fisher Scoring iterations: 5

这几个变量的参数显著不为0，可以认定我们修改的模型是正确的，下面我们用方差分析进一步验证

anova(model2,model, test="Chisq")
Analysis of Deviance Table

Model 1: Survived ~ Pclass + Sex + Age + SibSp
Model 2: Survived ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked
  Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1       795     713.43                     
2       791     709.39  4   4.0446      0.4

我们可以看到其P值大于0.05，不拒绝原假设，即model2与model对预测变量的解释程度一样好。

###模型参数解释

现在，我们可以分析这个拟合的模型model2，对于那些比较重要的变量，其中sex的回归系数最低（绝对值最大），这说明sex与乘客的生存几率的关系是最强的。当其它变量都一样，这个负系数预测变量表明，男乘客生存的机率更低。逻辑模型的因变量是对数机率：ln(odds) = ln(p/(1-p)) = ax1 + bx2 + … + z*xn。male是一个优化变量，男性的生还机率下降2.76个对数机率，而年龄每增大一个单位，生存率则下降0.037个对数机率，等级上升一个单位，生存率下降1.14个对数单位。

接下来我们再检验样本上评估模型的预测能力
###评估模型的预测能力

head(test)
newdata<-subset(test,select=c(2,3,4,5,6,7,8))
m3<- predict(model,newdata,type='response')
#prdict(type="responce")#表示输出结果预测响应变量为1的概率
m3
m3<- ifelse(m3 > 0.5,1,0)
#如果响应量大于0.5，返回值为1否则返回0
Error <- mean(m3 != test$Survived)
#返回值（预测值）与真实值不一致的部分，即误差
print(paste('Accuracy',1-Error))#预测精度

[1] "Accuracy 0.842696629213483"

由上面可以看出model的预测精度为84.27%

newdata<-subset(test,select=c(2,3,4,5))
m4<- predict(model2,newdata,type='response')

m4<- ifelse(m4 > 0.5,1,0)#决策边界为0.5
misClasificError <- mean(m4 != test$Survived)
print(paste('Accuracy',1-misClasificError))
[1] "Accuracy 0.786516853932584"

可以看到model2的精度为78.65%，虽然我们的变量减少了，而且都显著，但是精度也随之降低了。
我们有没有什么修正的方法呢？

newdata<-subset(test,select=c(2,3,4,5))
m4<- predict(model2,newdata,type='response')
m4<- ifelse(m4 > 0.6,1,0)#决策边界为0.6
misClasificError <- mean(m4 != test$Survived)
print(paste('Accuracy',1-misClasificError))

[1] "Accuracy 0.820224719101124"

可以看到精度提升到了82.02%，这又是为什么呢？
首先我们要明白变动了什么，上面我们将决策边界由0.5变为了0.6，
R可以输出形如P(Y=1|X）的概率。如果我们的预测边界就是0.5。如果P(Y=1|X)>0.5，y=1或y=0.上面将0.5变动为0.6，表明只有当预测为1的概率大于0.6时，才能将预测值设为1，由此我们的精度也提高了。那么是不是决策边界越高越好？

newdata<-subset(test,select=c(2,3,4,5))
m4<- predict(model2,newdata,type='response')
m4<- ifelse(m4 > 0.7,1,0)#决策边界为0.7
misClasificError <- mean(m4 != test$Survived)
print(paste('Accuracy',1-misClasificError))

[1] "Accuracy 0.808988764044944"

可以看到在决策边界为0.7的情况下，预测精度反而下降为80.90%，可见并非是决策边界越高预测精度越高。当决策边界过高时，一些预测值也会被误判，所以最优决策边界并不一定是0.5。

一个一个找决策边界太麻烦了，有什么更好的办法吗？当然有，目前最被广泛应用的是K重交叉验证（k-fold CrossValidation）

###更精确的k重交叉验证
####交叉验证(CrossValidation)方法思想

以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标.常见CV的方法如下:

1).Hold-Out Method
将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此Hold-OutMethod下分类器的性能指标.此种方法的好处的处理简单,只需随机把原始数据分为两组即可,其实严格意义来说Hold-Out Method并不能算是CV,因为这种方法没有达到交叉的思想,由于是随机的将原始数据分组,所以最后验证集分类准确率的高低与原始数据的分组有很大的关系,所以这种方法得到的结果其实并不具有说服性.

2).K-fold Cross Validation(记为K-CV)

将原始数据分成K组(一般是均分),将其中一个子集数据做为测试集,其余的K-1组子集数据作为训练集；将K个子集轮流作为测试集，重复上述过程，这样得到了K个分类器或模型，并利用测试集得到了K个分类器或模型的分类准确率。用K个分类准确率的平均值作为分类器或模型的性能指标.K一般大于等于2,实际操作时一般从3开始取,常常取10，只有在原始数据集合数据量小的时候才会尝试取2.K-CV可以有效的避免过学习以及欠学习状态的发生,最后得到的结果也比较具有说服性.

3).Leave-One-Out Cross Validation(记为LOO-CV)

如果设原始数据有N个样本,那么LOO-CV就是N-CV,即每个样本单独作为测试集,其余的N-1个样本作为训练集,所以LOO-CV会得到N个模型,用这N个模型最终的验证集的分类准确率的平均数作为此下LOO-CV分类器的性能指标.相比于前面的K-CV,LOO-CV有两个明显的优点:

①每一回合中几乎所有的样本皆用于训练模型,因此最接近原始样本的分布,这样评估所得的结果比较可靠。

②实验过程中没有随机因素会影响实验数据,确保实验过程是可以被复制的。

但LOO-CV的缺点则是计算成本高,因为需要建立的模型数量与原始数据样本数量相同,当原始数据样本数量相当多时,LOO-CV在实作上便有困难几乎就是不显示,除非每次训练分类器得到模型的速度很快,或是可以用并行化计算减少计算所需的时间.

其中，拟合不同的模型需要进行不同的交叉验证，也就需要根据自己的需要来编写相应函数，这里给出广义线性模型的交叉验证方法

install.packages("boot")
library(boot)
model <- glm(Survived~Pclass+Sex+Age+SibSp+Parch+Fare+Embarked,
              data=data,family=binomial())
a<-cv.glm(data,model,K=10)#广义线性回归的10重交叉验证
a
 
 $call
cv.glm(data = data, glmfit = model, K = 10)

$K
[1] 10

$delta
[1] 0.1433601 0.1431568

$delta
长度为2的一个矢量值。第一部分是交叉验证的预计误差,第二部分是调整的交叉验证估差，调整值是用于填补通过弃一法交叉验证引入的偏差。

可见由model的调整后的预计误差为14.32%

model2 <- glm(Survived~Pclass+Sex+Age+SibSp,
+               data=data,family=binomial())
a<-cv.glm(data,model2,K=10)
a

$call
cv.glm(data = data, glmfit = model2, K = 10)

$K
[1] 10

$delta
[1] 0.1429763 0.1428592

可见由model2交叉验证的调整后的预计误差为14.29%

作为最后一步，我们会做ROC曲线并计算AUC（曲线下的面积），它常用于预测二元分类器的模型表现。

####ROC AUC
ROC曲线是一种曲线，它可以通过设定各种极值来让正例律（TPR)来抵消反正例律(FPR)，它就在ROC曲线之下。通常来说，一个预测能力强的模型应当能让ROC接近1（1是理想的）而不是0.5。

install.packages("ROCR")
library(ROCR)
p <-predict(model,newdata=subset(test,select=c(2,3,4,5,6,7,8)), type="response")
pr <- prediction(p, test$Survived)
prf <- performance(pr, measure = "tpr", x.measure = "fpr")
plot(prf)
auc <- performance(pr, measure = "auc")
auc <- [email protected][[1]]
auc

[1] 0.870671

p <- predict(model2, newdata=subset(test,select=c(2,3,4,5)), type="response")
pr <- prediction(p, test$Survived)
prf <- performance(pr, measure = "tpr", x.measure = "fpr")
plot(prf)
auc <- performance(pr, measure = "auc")
auc <- [email protected][[1]]
auc

[1] 0.8652597

参考资料：
logistic回归报错问题

如何在R语言中使用Logistic回归模型

R语言逻辑回归、ROC曲线和十折交叉验证

《R语言实战》

扫码关注更多的分享内容，祝好呀~~

TCP 通信流程图 U_p_ 计算机网络知识网络服务器 windows
下面给出一个详细的TCP通信流程图，演示客户端（Client）与服务器（Server）之间通过TCP协议进行通信时的各个步骤。这里假设：服务器IP：192.168.1.100，监听80端口客户端IP：192.168.1.200，使用随机分配的端口（示例中为50000）下面的流程图按三次握手、数据交互、四次挥手的顺序展示。为便于阅读，采用ASCII画出大致示意。┌──────────────────
机器视觉中图像的腐蚀和膨胀是什么意思？它能用来做什么？ yuanpan 机器学习人工智能计算机视觉图像处理
腐蚀（Erosion）和膨胀（Dilation）是两种基本的形态学操作，通常用于二值图像（黑白图像）的处理。它们是形态学图像处理的基础，广泛应用于图像分割、边缘检测、噪声去除等任务。1.腐蚀（Erosion）腐蚀操作通过对图像中的前景区域（通常为白色像素）进行“收缩”来去除边界上的像素。具体来说，腐蚀操作使用一个结构元素（通常是一个小的矩阵或核）在图像上滑动，只有当结构元素完全覆盖前景区域时，中心
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
matsim开发教程若木胡大数据信息可视化
以下是基于MATSim的二次开发教程指南，结合交通仿真框架的核心功能和开发实践，提供从环境搭建到高级开发的完整路径：一、MATSim简介MATSim（Multi-AgentTransportSimulation）是一个基于Java的开源交通仿真框架，专注于大规模多智能体（Agent）交通行为模拟，支持动态需求建模、路径规划优化、政策评估等应用场景。二、开发环境搭建1.基础依赖JavaJDK11+：
Transformers模型版本和lm_eval老版本冲突问题ImportError: cannot import name ‘initialize_tasks‘ from ‘lm_eval.task neverwin6 llama python 服务器
Transformers模型版本和lm_eval老版本冲突问题1问题背景在LLM评测的时候，要用lm_eval模型，而对于像是llama3/Mistrual等比较新的模型，较低的Transformers不能适配，所以要升级到0.40.0以上才行，但是如果升级的话，那么直接在沿用老版本的lm_eval评测就会出现：Traceback(mostrecentcalllast):File"main.py"
Tree of Thought Prompting（思维树提示）大数据追光猿大模型人工智能大数据深度学习语言模型计算机视觉
TreeofThoughtPrompting（思维树提示）是一种新兴的提示工程技术，旨在通过模拟人类解决问题时的多步推理过程，提升大型语言模型（LLM）在复杂任务中的表现。与传统的线性提示方法不同，思维树提示将问题分解为多个可能的推理路径，并以树状结构探索这些路径，从而找到最优解或生成更高质量的结果。这种方法特别适用于需要多步推理的任务，例如数学问题求解、逻辑推理、规划和创造性写作等场景。它结合了
Spring Boot 核心知识点深度详解：自动化配置 (Auto-configuration) - 解锁 Spring Boot 的 “魔法” 无眠_ spring boot 自动化后端
SpringBoot核心知识点深度详解：自动化配置(Auto-configuration)-解锁SpringBoot的“魔法”✨自动化配置(Auto-configuration)是SpringBoot最核心的特性之一，也是它能够大幅简化Spring应用开发的关键所在。它让SpringBoot应用能够“零配置”启动，极大地提升了开发效率和便捷性。本文将深入剖析SpringBoot的自动化配置机制，让
95% 向量资源节省，火山引擎云搜索 RAG 技术体系演进字节跳动云原生计算火山引擎搜索引擎算法
采访嘉宾|火山引擎云搜索团队鲁蕴铖、李杰辉、余炜强编辑|TinaInfoQ2023年，大模型惊艳了世界。2024年，RAG技术如日中天。RAG使得大模型能够在不更新模型参数的情况下，获得必要的上下文信息，从而减少大模型的幻觉。随着大型语言模型技术的不断成熟和行业应用的深入，人们对RAG系统的期望已经超越了对其“酷炫”效果的追求。企业和组织开始寻找更可靠、可扩展的RAG解决方案，以满足实际业务需求。
【Leetcode】11. 盛最多水的容器 Leuanghing leetcode 算法 python
一、题目描述给定一个长度为n的整数数组height。有n条垂线，第i条线的两个端点是(i,0)和(i,height[i])。找出其中的两条线，使得它们与x轴共同构成的容器可以容纳最多的水。返回容器可以储存的最大水量。说明：你不能倾斜容器。示例1：输入：[1,8,6,2,5,4,8,3,7]输出：49解释：图中垂直线代表输入数组[1,8,6,2,5,4,8,3,7]。在此情况下，容器能够容纳水（表示
【Leetcode】12. 整数转罗马数字 Leuanghing leetcode 算法 python
一、题目描述七个不同的符号代表罗马数字，其值如下：罗马数字是通过添加从最高到最低的小数位值的转换而形成的。将小数位值转换为罗马数字有以下规则：如果该值不是以4或9开头，请选择可以从输入中减去的最大值的符号，将该符号附加到结果，减去其值，然后将其余部分转换为罗马数字。如果该值以4或9开头，使用减法形式，表示从以下符号中减去一个符号，例如4是5(V)减1(I):IV，9是10(X)减1(I)：IX。仅
清晰易懂的Python安装与配置教程 Tee xm python 开发语言
初学者也能看懂的Python安装与配置教程本教程将手把手教你安装Python，并配置国内镜像源和自定义依赖包缓存位置，即使你是零基础小白，也能轻松完成！一、准备工作操作系统：Windows10/11、macOS或Linux。下载工具：浏览器（推荐Chrome或Edge）。存储空间：至少预留500MB可用空间。二、安装Python1.下载Python访问Python官网下载页面：https://ww
S32K144外设实验（二）：ADC单通道单次采样（软件触发）上层精灵的赞美诗 #S32K144的外设基础实验单片机嵌入式硬件 eclipse mcu 笔记
文章目录1.概述1.1理论回顾1.1.1时钟系统1.1.2采样通道1.2实验目的2.配置与代码编写1.概述1.1理论回顾S32K144的ADC应该说是特别灵活，笔者采用循序渐进的方式来学习使用这个很重要的外设。在《入门笔记系列》专栏中对用户手册进行了翻译和解读，这里在回顾一下ADC的基本功能，第一次实验我们不使用过于复杂的触发方式。只使用一个通道来理解S32K144的ADC。1.1.1时钟系统首先
halcon里3d平面度检测程序_激光三角测量法在工业视觉检测上的应用 jiago 王佳东fr
点击上方“3D视觉工坊”，选择“星标”干货第一时间送达激光三角测量法，是工业视觉领域较为常用也是比较容易理解的一种3D检测算法。本文主要从应用层次来阐述，包括相机和激光选型、搭接方式的优劣点分析、软件开发过程中的注意事项等。1.原理及演示将一条单线细激光光线投射到物体表面，由于物体表面高度发生变化，使得激光线发生了弯曲，根据这个线的变形，可以计算出精确的物体表面三维轮廓。如下图所示，基本组成结构有
go面向对象编程三大特性，封装、继承和多态平谷一勺 Golang基础篇 golang 开发语言后端 go封装继承多态封装多态继承
1.简介go具有面向对象编程的封装、继承和多态的特性，只是实现的方式和其它OOP语言不一样，下面看下go的三大特性是如何实现的。2.封装2.1基本介绍封装就是把抽象出的字段和对字段的操作封装在一起，数据被保护在内部，程序的其它包只能通过被授权的操作（方法），才能对字段进行操作。优点：隐藏细节。可以对数据进行验证，保证安全合理。2.2封装的实现步骤将结构体、字段（属性）的首字母小写（不能导出了，其他
Centos7 Jenkins的部署 shgh_2004 配置管理 jenkins linux 运维
1.下载rpm安装包wgethttps://mirrors.tuna.tsinghua.edu.cn/jenkins/redhat/jenkins-2.275-1.1.noarch.rpm--no-check-certificate2.yum安装rpm-ivhjenkins-2.275-1.1.noarch.rpm安装完以后重要的目录说明：/usr/lib/jenkins/jenkins.war
并查集实现算法 C嘎嘎嵌入式开发算法算法服务器 c++
畅通工程2题目描述：某省调查城镇交通状况，得到现有城镇道路统计表，表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通（但不一定有直接的道路相连，只要互相间接通过道路可达即可）。问最少还需要建设多少条道路？输入描述：测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数，分别是城镇数目N(#include#include#include#includ
双均线量化策略实战指南：基于 iTick 外汇API、股票API报价源的 Python 实现算法pythonai开发
在量化交易领域，iTick报价API凭借其强大的多市场覆盖能力，已成为专业交易员的首选数据解决方案。其外汇API支持全球主要货币对（如EURUSD、GBPUSD）的毫秒级行情推送，包含Bid/Ask深度报价和实时波动率数据；股票API则覆盖A股、港股及美股市场，提供Level-2逐笔成交和十档盘口信息。通过统一的RESTful接口，开发者可轻松获取标准化的OHLCV数据，实现外汇、股票等多资产策略
Pydantic模型继承解析：从字段继承到多态模型
title:Pydantic模型继承解析：从字段继承到多态模型date:2025/3/19updated:2025/3/19author:cmdragonexcerpt:涵盖字段继承、属性覆盖、多态模型等关键机制。将掌握类型安全的继承体系构建方法，实现企业级数据校验方案，避免传统面向对象继承的常见陷阱。categories:后端开发FastAPItags:Pydantic模型继承字段覆盖机制多态数
在Ubuntu上安装MEAN Stack的4个步骤 ubuntu
在Ubuntu上安装MEANStack的4个步骤为：1.安装MEAN；2.安装MongoDB；3.安装NodeJS，Git和NPM；4.安装剩余的依赖项。什么是MEANStack？平均堆栈一直在很大程度上升高为基于稳健的基于JavaScript的开发堆栈。名称的意思是指其组件;MongoDB，ExpressJS，Angularjs和NodeJS。第1步：安装MEAN对于此安装，我们将在本指南中使用
书籍-《自然语言理解解析》
书籍：UnderstandingNaturalLanguageUnderstanding作者：ErikCambria出版：Springer编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《自然语言理解解析》01书籍介绍大约半个世纪前，AI先驱们如MarvinMinsky开始了一项雄心勃勃的项目：模拟人类大脑如何编码和解码意义。虽然现在我们借助神经科学对大脑有了更多的了解，但距离揭开大脑的秘密，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
ESP8266 与 ARM7 接口-LPC2148 创建 Web 服务器以控制 LED David WangYang ESP8266项目服务器运维
ESP8266与ARM7接口-LPC2148创建Web服务器以控制LEDESP8266Wi-Fi收发器提供了一种将微控制器连接到网络的方法。它被广泛用于物联网项目，因为它便宜、体积小且易于使用。在本教程中，我们将ESP8266Wi-Fi模块与ARM7-LPC2148微控制器连接，并创建一个Web服务器来控制连接到LPC2148的LED。工作流程将如下所示：从LPC2148向ESP8266发送AT命
Spring Boot 应用的接口访问从 HTTP 改为 HTTPS day day day ... http spring boot https
LINUX1.生成SSL证书使用工具（如`keytool`或`openssl`）生成SSL证书。以下以`keytool`为例：keytool-genkeypair-aliasmydomain-keyalgRSA-keysize2048-storetypePKCS12-keystorekeystore.p12-validity3650-输入密码并填写证书信息。-生成的`keystore.p12`文件
AttributeError: partially initialized module ‘cv2‘ has no attribute ‘_registerMatType‘ (most likely hunter206206 python pyopencv python
这个错误表明在导入cv2（OpenCV）模块时，发生了循环导入问题，导致模块未能正确初始化。具体来说，cv2模块在初始化过程中尝试调用_registerMatType方法，但由于循环导入，该方法尚未定义。以下是可能的原因和解决方法：1.OpenCV安装问题可能是OpenCV安装不完整或损坏。可以尝试重新安装OpenCV。解决方法：使用pip重新安装OpenCV：pipuninstallopencv
docker实现Nginx
在Ubuntu上使用Docker搭建Nginx服务器是一种高效、灵活的方式。以下将详细介绍从安装Docker到配置和运行Nginx容器的全过程，帮助你快速实现Nginx服务的部署与管理。目录安装Docker获取Nginx镜像运行Nginx容器访问Nginx配置Nginx持久化数据工作流程总结️注意事项⚠️1.安装Docker在开始之前，确保你的系统是最新的，并且安装了必要的依赖包。sudoapt-
如何创建自定义回调处理器 bBADAS python 开发语言
在现代AI开发中，回调是一个强大的工具，它允许我们在特定事件触发时执行自定义逻辑。本文将深入探讨如何为LangChain创建自定义的回调处理器，从而实现更加灵活的模型交互。技术背景介绍在使用AI模型时，尤其是在处理自然语言生成任务时，可能需要对生成的每个标记（token）进行处理。LangChain提供了一些内置的回调处理器，但为了满足特定的需求，创建自定义回调处理器是非常有必要的。核心原理解析创
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
深入解析：React中的信号组件与细粒度更新
引言在主流的前端开发框架中，无论是React、Vue还是Svelte，核心都是围绕着更高效地进行UI渲染展开的。为了实现高性能，基于DOM总是比较慢这个假设前提，其最核心的要解决的问题有两个：响应式更新细粒度更新为了将响应式更新、细粒度更新优化到极致，各种框架是八仙过海，各显神通。以最流行的React和Vue为例，首先两者均引入了VirtualDOM的概念。Vue的静态模板编译，通过编译时的静态分
再聊 Reducer Context 和 Redux
原文链接这是一次突发奇想的感悟，感觉还挺神奇的，遂记录一下。前言作为一个React的开发者已经蛮久的了，大大小小的应用也开发了不少，除了一开始学习React时用过Redux以外，后来基本都不碰了，不管多么复杂的应用，我也简单的觉得使用Context就能够解决我所有的问题。说来惭愧，我基本没有思考过Redux存在的原因，可能是React真的做的太好了，又或者是我们现在的设备性能已经严重过剩了，让我完
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

logistic的应用

你可能感兴趣的:(logistic的应用)