weixin_47922824

“泰迪杯”挑战赛 - 通过 Logistic Lasso模型预测肝癌手术预后影响及因素

研究目标
分析方法与过程
2.1. 总体流程
2.2. 具体步骤
2.3. 结果分析
结论
参考文献

1. 研究目标

本文目标为建立数据挖掘模型,研究肝癌手术预后影响(Y) （有或无）与食道静脉曲
张 $X_1 )$ ，门脉癌栓 $X_2 )$ ，HbsAg $X_3 )$ , Anti-HCV $X_4 )$ ，肿瘤部位 $X_5 )$ ，肿瘤大小 $X_6 )$ ，肿瘤生长方式 $X_7 )$ ，肿瘤包膜 $X_8 )$ ，肿瘤旁的微小子灶 $X_9 )$ ,术后腹水 $X_{10} )$ (部分或全部)的关系，对病人的预后影响(Y) 预测，从而为病人规划最佳的手术和治疗方案。

2. 分析方法与过程

2.1 总体流程

步骤一：数据预处理：
题中所给数据已经过预处理。数据均为分类数据和有序数据，为了便于分析，将其转化为数值型数据。

步骤二：相关性检验：
由于模型需要，计算两两指标之间的相关性，相关性强的两个变量我们只选其中一个。

步骤三：模型建立：
建立 Logistic 二分类模型，进行拟合和预测。

步骤四；模型改进：
本问题由于样本数量过少，基于经典方法处理其预测能力往往比较差，我们利用最新稀疏正则化方法[1,2.3] ，开展此问题研究。稀疏正则化是指对解空间施以某种先验约束来使解具有稀疏性。我们基于 Logistic Lasso 方法研究上述问题，可有效克
服因为样本量过少而引起的弱预测能力。

步骤五：模型评价：
运用 ROC 曲线对分类器的分类效果做评价，并对模型的拟合效果和预测效果及可解释性进行评价。

步骤六：问题与思考。

2.2 具体步骤

步骤一：数据预处理
给定数据的因变量（预后影响）正负平衡，故无需删减。如下表 1 所示，变量X1到 X10 均为分类变量和有序变量，为了便于分析，将其转化为数值型变量，将 P分类数据用 P -1 维向量表示。如：将二分类变量用 0,1 表示，三分类变量用（0,1）（1,0），（0,0）表示，四分类变量用（0,0,1），（0,1,0），（1,0,0），（0,0,0）表示。

在表 2 中，说明如下：
$X_1$ (V1,V2,V3)：（0,0,0）表示 no；（1,0,0）表示 light；（0,1,0）表示 mid; (0,0,1)表示 serious.

$X_2$ (V4,V5): (0,0）表示 no; (1,0)表示 branch; (0,1)表示 trunk.

$X_3$ (V6): 0 表示 negative; 1 表示 positive.

$X_4$ (V7): 0 表示 negative; 1 表示 positive.

$X_5$ (V8,V9): (0,0）表示 leftliver; (1,0)表示 rightliver; (0,1)表示 allliver.

$X_6$ (V10,V11,V12):（0,0,0）表示 small;（1,0,0）表示 middle;（0,1,0）表示 big; (0,0,1) 表示 verybig.

$X_7$ (V13): 0 表示 dilation; 1 表示 infiltration.

$X_8$ (V14,V15): (0,0）表示 intergrate; (1,0)表示 part; (0,1)表示 no.

$X_9$ (V16): 0 表示 no; 1 表示 have.

$X_{10}$ (V17,V18): (0,0）表示 no; (1,0)表示 less; (0,1)表示 much.

Y (V19): 0 表示 N; 1 表示 Y

步骤二：相关性检验

由于 Logistic 回归要求各变量独立，所以对预处理后的数据进行两两相关性检验，当两两相关系数高时，适当的变量变换是可行的[3]，结果显示任何两个变量均无显著的线性相关性，故不需剔除变量，也不需要进行变量变换。结果部分如图 1所示。

步骤三：建立模型
在本文中,我们选择 Logistic 函数进行拟合和预测, 选择前 16 组数据作为训练集,后 4 组为预测集. Logistic 可以将实数轴上问题转化为[0,1]区间的问题，

$h(x)=\frac{1}{1+e^{- \eta ^{r}x}}$

其中 $\eta$ 为待估参数从而 h(x)>0.5 的预测为 1，h(x)<=0.5 的预测为 0。Logistic 回归是一种广义线性模型,在特征到结果的映射中加入一层函数映射，即先把特征线性求和，然后用函数 h(x)来预测。

下面介绍广义线性模型：
(1) 假设 $\theta$ 来自参数为 η 的指数分布族（典则形式），即为

$\eta)= b(y)exp(\eta^T T(y)-a(\eta))$

(2)给定 x ，目标要确定T(y) ,(通常为 y )，由于 y 的随机性，转化为确定h(x)，

$h (x) = E (y ∣ x)$

（3） $\eta = \theta^T x$

图 1 相关性分析

本文研究的是二分类问题，故Y 服从伯努利分布.伯努利分布的概率可以表示为指数分布的典则形式（其中φ 为参数），

$p(y;\phi)=\phi^y(1-\phi)^{1-y}\\ =exp(y\ log \phi+(1-y)log(1- \phi))\\ =exp(log(\frac{\phi}{1-\phi}))y+log(1-\phi)$

$\eta = log(\phi/(1-\phi))$

从而得到：伯努利分布 $h(x)=E(y|x)=\phi$ ,
$\phi=\frac{1}{1+e^\eta}$

其中 $\eta=\theta^Tx$ 。

在 R 中调用 glm2 程序包（glm2 为 R 中一程序包，用来处理广义线性模型）进行拟合和预测，选取前 16 个为训练集，后 4 个为测试集，结果为训练集上准确率为16/16=100%,测试集上准确率为 2/4=50%。

步骤四：模型改进：
之前建立的 Logistic 回归模型没有对变量进行选择，由于样本量仅仅为 20，预理之后变量个数也达到了 18 个，样本量和变量个数接近。上段中模型存在以下几个题：

(1)过度拟合。由于样本数量过少，造成过度拟合。此时，模型在训练集上拟合率高，但在预测集上预测结果较差。因此，需要对模型施以某种限制,从而降低模型的拟合能力,并最终提高模型预测能力,而这种思想正是回到主流的正则化方法的基本思想[1,2,3] 。

(2)模型的可解释性差。可解释性揭示的是事物本身的客观规律，是科学研究的根本目标，也是进一步提高泛化性的途径。

在医学中,经常地,简单模型往往更利于医生快捷判别病人病症,因此有必要进一步简化相应影响因素,从而为医生提供一种简单易判别方法。

针对上述问题，我们对模型进行改进，建立 Logistic Lasso 正则化模型。

其中 $l (.)$ 为损失函数, $\lambda\sum_{i=1}^{18}|\beta_i|$ 为罚函数。损失函数项度量学习结果在训练集上的误差损失，而正则化项包含先验信息。正则化主要通过对解空间施以某种先验约束来达到某种正则解的目的。上述模型的损失函数即为 Logistic 函数的相反数，事实上为 y 的极大似然函数的相反数，正则化项 $l_1$ 。显然，本文中正则化是为了变量选择，提高模型的可解释性，进而提高机器泛化能力。上述模型中 λ 控制机器的复杂度，通常用交叉验证(Cross-Validation)方法选择。由于我们已经将数据进行预处理，故原有 10 个变量增加为 18 个，借鉴 Group lasso 的思想，我们对变量进行分组。由于新变量间自然的形成了某种分组关系，比如 $X_1,X_2,X_3$ 分别为食道静脉曲张（轻），食道静脉曲张（中），食道静脉曲张（重）。显然这三个变量应该为一组。具体分组如下：

组 1：食道静脉曲张
组 2：门脉癌栓
组 3： HbsAg
组 4： Anti-HCV
组 5：肿瘤部位
组 6：肿瘤大小
组 7：肿瘤生长方式
组 8：肿瘤包膜
组 9：肿瘤旁的微小子灶
组 10：术后腹水

由于上述分组都是自然形成的，所以可以使拟合更准确。此时，同组中将以组形式一起影响模型。

在 R 中调用 grpreg 程序包（grpreg 为 Penalized Logistic Group Lasso Regression 的程序包），进行拟合和预测，选取前 16 个为训练集，后 4 个为测试集，结果显示训练集上准确率为 14/16=87.5%,测试集上准确率为 3/4=75%。对预后影响（Y）有影响的变量按重要程度排序为食道静脉曲张，Anti-HCV，肿瘤包膜，肿瘤旁的微小子灶。

步骤五：模型评价

（1）ROC 曲线
二分类问题，即将实例分成正类（Positive）或负类（Negative）。对一个二分类问题来说，会出现四种情况。如果一个实例是正类并且也被预测成正类，即为真正类（True positive）,如果实例是负类被预测成正类，称之为假正类（False positive）。相应地，如果实例是负类被预测成负类，称之为真负类（True negative）,正类被预测成负类则为假负类（False negative）。列联表如下表所示，1 代表正类，0 代表负类。从列联表引入

其中，每个单元格中元素表示属于相应类别的个数。注:两个新名词。其一是真正类率(true positive rate ,TPR), 计算公式为 TPR=TP/ (TP+ FN)，刻画的是分类器所识别出的正实例占所有正实例的比例。另外一个是负正类率(false positive rate, FPR),计算公式为 FPR= FP / (FP + TN)，计算的是分类器错认为负类的正实例占所有负实例的比例。还有一个真负类率（True Negative Rate，TNR），也称为 specificity,计算公式为 TNR=TN/ (FP+ TN) = 1 - FPR。

在一个二分类模型中，对于所得到的连续结果，假设已确定一个阀值，比如说 0.6，大于这个值的实例划归为正类，小于这个值则划到负类中。如果减小阀值，减到 0.5，固然能识别出更多的正类，也就是提高了识别出的正例占所有正例的比类，即 TPR,但类似于假设检验中第一类错误和第二类错误的关系，同时也将更多的负实例当作了正实例，即提高了 FPR。为了形象化这一变化，在此引入 ROC。上述模型的结果对应的 ROC曲线如下图：

图 2 ROC 曲线图

研究表明，AUC（Aera under the curve）（ROC 曲线下方的面积）可以反应分类器性能的好坏,AUC 越大，表示分类器的性能越好。如图 2 显示，我们的分类器性能较好。

(2)改进后的模型对变量进行了选择和排序，同时拟合精度为 14/16= 87.5% ,预测精度为 3/4=75% ,较改进前的模型均有显著提高。可以看出通过加罚项，改善了模型的拟合精度，泛化性和可解释性。指标个数由之前的 10 个减少为 4 个，按重要程度排序为食道静脉曲张，Anti-HCV，肿瘤包膜，肿瘤旁的微小子灶，而且选择的变量从医学角度来说也符合常规。当病人的各项指标已知时，我们可以根据我们的模型来对病人进行分类，预测术后是否有预后影响，从而可以对病人的手术方案进行设计和调整。

步骤六：问题与思考
（1）我们利用支持向量机（Support Vector Machine）对本问题做了研究。SVM 是一种高效分类方法，是基于最大化几何间隔的算法。结果显示，SVM 的拟合准确率为16/16=100%,预测准确率为 2/4=50%,所以 SVM 也存在过度拟合的问题。SVM 和 Logistic 回归相比拟合与预测精度均一致，但与 Logistic Lasso 相比，SVM 的预测较差，且 SVM无变量选择作用。

(2)为了提高预测精度，可以研究与问题相关的罚函数，比如借鉴SCAD[2,3], LI /2[4]的思想，同时考虑医学方面的先验信息，建立模型，从而有效提高模型的解释和预测能力。

2.3程序与结果分析程序与结果分析

(1)相关性分析的 R 程序如下：

library(grpreg) 
data <- read.csv("C:/Documents and Settings/Administrator/桌面/数据挖掘/新建
Microsoft Excel 工作表 (2).csv", head = FALSE) 
data1<-as.matrix(data) 
cor(data1)

结果如图 3 所示

图 3 相关性分析程序结果

(2) 使用 logistic 回归的 R 程序如下：

library(glm2) 
mydata <- read.csv("C:/Documents and Settings/xyzx/桌面/16.csv", head = FALSE) 
beta<-glm(V19~V1+V2+V3+V4+V5+V6+V7+V8+V9+V10+V11+V12+V13+V14+
V15+V16+V17+V18,mydata,family='binomial') 
label13<-(predict(beta,mydata)>0.5) 
sum(label13==mydata$V19) 
summary(beta) 
newdata<-read.csv("C:/Documents and Settings/xyzx/桌面/4.csv", head = FALSE) 
newdata$rankP <- predict(beta, newdata = newdata, type = "response") 
newdata

结果如图 4 所示。
结果显示：训练集上准确率为 16/16=100%,测试集上准确率为 2/4=50%。
说明模型拟合非常好，预测不太好。具体原因如前文所述。

(3)使用 Logistic Lasso 回归的 R 程序如下：

library(grpreg) 
data <- read.csv("C:/Documents and Settings/xyzx/桌面/新建 Microsoft Excel 工作表
(2).csv", head = FALSE) 
group1<-cbind(data[,1],data[,2],data[,3]) 
group2<-cbind(data[,4],data[,5]) 
group3<-cbind(data[,6]) 
group4<-cbind(data[,7]) 
group5<-cbind(data[,8],data[,9]) 
group6<-cbind(data[,10],data[,11],data[,12]) 
group7<-cbind(data[,13]) 
group8<-cbind(data[,14],data[,15]) 
group9<-cbind(data[,16]) 
group10<-cbind(data[,17],data[,18]) 
testset<-c(17,18,19,20) 
x_sub<- cbind(group1,group2,group3,group4,group5,group6,group7,group8,group9,group10) 
x_sub1 <- x_sub[-testset, ] 
x_pre <- x_sub[testset, ] 
y_sub<- as.numeric(data[,19]) 
y_sub[which(y_sub>0)]<-1 
y_sub1 <- y_sub[-testset] 
y_pre <- y_sub[testset] 
group<-c(1,1,1,2,2,3,4,5,5,6,6,6,7,8,8,9,10,10) 
fit1<- grpreg(x_sub1,y_sub1,group,penalty="grLasso",family="binomial") 
lambda<- select(fit1,"AIC")$lambda # choose the regularization parameter 
beta<- select(fit1,"AIC")$beta # output fitted coeficients 
beta 
y_fit<- predict(fit1, x_sub1, type="class", lambda) 
sum(y_fit==y_sub1) 
y_fit_pre <- predict(fit1, x_pre, type="class", lambda) 
sum(y_fit_pre==y_pre)

执行结果如下图 5 所示：

图 5 Logistic Lasso 回归程序结果

结果显示：训练集上准确率为 14/16=87.5%,测试集上准确率为3/4=75%。对预影响(Y)有影响的变量按重要程度排序为食道静脉曲张，Anti-HCV，肿瘤包膜，肿瘤旁的微小子灶。

可以看出，改进之后的模型对变量进行了选择和排序，选出了对Y 影响较大的四个指标，且这四个指标也符合医学经验，从而提高的模型的可解释性。此外，虽然拟合精度较改进前的模型下降，但预测精度显著提高。正好说明了样本误差与逼近误差的关系，即样本误差增大导致逼近误差减小。

（4）支撑向量机（SVM）的 R 程序如下：

library(e1071) 
library(rpart) 
mydata <- read.csv("C:/Documents and Settings/xyzx/桌面/新建 Microsoft Excel 工作表
(2).csv", head = FALSE) 
index <- 1:20 
testindex <- c(17,18,19,20) 
testset <- mydata[testindex,] 
trainset <- mydata[-testindex,] 
svm.model <- svm(V19~ ., data = trainset, cost = 100, gamma = 1) 
svm.pred <- predict(svm.model, testset[,-19]) 
label13<-(predict(svm.model,trainset[,-19])>0.5) 
sum(label13==mydata[-testindex,19]) 
table(pred = svm.pred, true = testset[,19]) 
summary( svm.pred) 
summary( svm.model )
print(svm.pred)

结果如下图 6 所示：

图 6 SVM 程序结果

结果显示：训练集上准确率为 16/16=100%,测试集上准确率为 2/4=50%。

(5)ROC 曲线的 R 程序如下：

library(ROCR) 
y_fit3<- predict(fit1, x_sub1, type="response", lambda) 
pred <- prediction(y_fit3, y_sub1) 
perf <- performance(pred, measure = "tpr", x.measure = "fpr") 
plot(perf, col=rainbow(10))

结果如下图 7 所示：

图 7 ROC 曲线

AUC 图显示，本文提出方法是高效的。

3. 结论

对肝癌病影响的主要因素问题,临床表明,影响肝癌预后影响的因素为食道静脉曲张、门脉癌栓、HbsAg、 Anti-HCV 、肿瘤部位、肿瘤大小、肿瘤生长方式、肿瘤包膜、肿瘤旁的微小子灶、术后腹水 10 个。本文研究上述因素在肝癌病影响中的重要性，并通过建立新的模型，研究肝癌病人的预测问题。

对于上述问题，我们先检验肝癌手术预后影响的主要因素之间的线性相关性，通过相关性强弱对某些指标进行适当的删减。然后基于 Logistic 回归对预处理后的数据进行拟合和预测，进一步，我们基于最新的稀疏正则化方法改进模型。我们基于 Logistic Lasso回归模型再次研究肝癌手术预后影响的主要因素及预测。通过对系数施以稀疏约束，研究了肝癌手术预后影响的主要因素并排序。

选择前 16 组数据作为训练集，后 4 组数据作为测试集，新模型在训练集上拟合准确率为 14/16=87.5%,在测试集上准确率为 3/4=75%。结果显示：食道静脉曲张，Anti-HCV，肿瘤包膜，肿瘤旁的微小子灶为主要因素。同时 ROC 曲线说明我们的分类器性能良好，且上述结果符合医学先验。

针对肝癌手术预后影响因素问题,我们做了相关性检验，Logistic Lasso 回归,以及用 ROC 曲线进行检验。最终结果显示分类效果较好，但不足之处是未能与医学先验信息结合。因此进一步开展结合先验信息的新模型新方法研究是一项有意义的工作。

4. 参考文献

[1] Robert Tibshirani. Regression Shrinkage and Selection via the Lasso. Robert Tibshirani Journal of the Royal Statistical Society. Series B (Methodological), Vol. 58, No. 1,2011,05,01

[2] 张海,王尧,常象宇,徐宗本. L1/2正则化.中国科学信息科学,2010,40:412-422

[3]Jianqing Fan and Jinchi Lv . A Selective overview of Variable Selection in High Dimensional Feature Space.2009,arXiv:0910.1122.

[4]Van de Geer,S…High-dimensional generalized linear models and the LASSO.Ann. Statist.2008,36,614-645 .

【TypeScript教程】 - 小白也能秒懂的TypeScript入门指南一个水瓶座程序猿. TypeScript JavaScript 系列文章 typescript javascript 前端
一、TS是什么？TypeScript（简称TS）是JavaScript的一个超集，由微软开发。简单来说，它就是在JavaScript的基础上增加了静态类型检查。那静态类型检查有啥好处呢？举个例子，在JavaScript里，我们写代码时可能会不小心把一个变量的类型用错，像这样：//JavaScript代码letnum=10;num="hello";//这里把数字类型的变量赋值为字符串，运行时可能会出
vue在ios手机上的一些问题（这次写的h5公众号）和后面补充的小程序问题摆烂兔小程序 uniapp vue营地 html5 vue.js 小程序 uni-app
坑一：使用定位fixed，底部导航不显示，代码我就不写，总结就是定位套定位，心累代码太多不想贴；坑二：禁止页面放大缩小，解决：Vue移动端禁止页面放大缩小_fuf_xyxnxss的博客-CSDN博客_移动端禁止放大缩小坑三：移动端h5页面禁止长按选择复制，解决：移动端h5页面禁止长按选择复制_艾欢欢的博客-CSDN博客坑四：苹果手机IOS点击输入框弹出键盘后，所有按钮点击位置上移，解决：苹果手机I
【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等十小大超分辨率重建（理论+实战科研+应用）超分辨率重建人工智能图像处理深度学习计算机视觉图像超分 pytorch
文章目录专栏简介专栏亮点适配人群相关说明关于答疑环境配置超分理解实现流程文章目录基础知识三个常用的SR框架数据集相关可解释性（论文中的可视化说明）图像超分（ImageSuper-Resolution）经典超分（ClassicalSR）任意尺度超分（Arbitrary-ScaleSR）高效/轻量化超分（Efficient/LightweightSR，ESR）盲超分/真实世界图像超分辨率（Blind/
【图像超分】论文复现：密集残差链接Transformer！DRCT的Pytorch源码复现，跑通超分源码，获得指标、模型复杂度、结果可视化，核心模块拆解与源码对应，注释详细！十小大超分辨率重建（理论+实战科研+应用）pytorch 深度学习超分辨率重建图像处理计算机视觉 python transformer
请先看【专栏介绍文章】：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通DRCT源码，获得与论文一致的PSNR/SSIM、Params、超分可视化结果，修正论文中FLOPs的计
系统架构设计师论文分享-论软件架构复用
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该项目为国内纱线工厂提供SAAS服务，旨在提升纱线工厂的数字化和智能化水平。我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件架构复用的实现过程。软件架构复用可以有效降低成本，提高开发速度和质量属性，架构复用方法的步骤分为三个过程：可复用资产的获取、架构复用的管理、架构复用的使
系统架构设计师论文分享-论软件体系结构的演化
我的软考历程摘要2023年2月，我所在的公司通过了研发纱线MES系统的立项，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的数字化和智能化水平，我在该项目中担任架构设计师，负责该项目的架构设计工作。本文结合我在该项目中的实践，详细论述了软件体系结构的演化。系统上线后，为了满足新需求和适应新场景，就必须修改原有软件架构。在软件架构演化过程中遵循以下原则：演化适应新技术、有利于重构和重用、影响
系统架构设计师论文分享-论单元测试方法及其应用码农卿哥系统架构设计师系统架构单元测试
我的软考历程摘要2023年2月，我所在的公司做了开发纱线MES系统的决定，该系统为国内纱线工厂提供SAAS服务，旨在提高纱线工厂的智能化和数字化水平。我在该项目中被任命为系统架构设计师，全面掌管该项目的架构设计工作。本文将结合我在该项目中的架构设计工作经验，详细介绍如何把单元测试方法应用在项目中。在该项目中，我们采用了多种单元测试方法，包括静态测试和动态测试。静态测试在不运行程序的情况下，通过代码
解读国密非对称加密算法SM2 云水木石详解国密算法数据安全
本文先介绍非对称加密算法，然后聊一聊椭圆曲线密码算法（EllipticCurveCryptography，ECC），最后才是本文的主题国密非对称加密算法SM2。因为我的数学知识有限，对于算法涉及的一些复杂的理论知识，也是不懂，所以本文不会涉及理论，仅仅从编程的角度解读一下SM2。在进行国密算法开发的这段时间，我主要参考的书籍是《深入浅出HTTPS：从原理到实战》，微信读书上也有电子版，如果你也是进
前端常见面试题黄马小配件前端 css html
sass语言的特点？1.可以减少重复代码：Sass可以通过使用变量、混合、继承等方式来减少代码的重复性，提高代码的可维护性。2.支持嵌套：Sass支持CSS样式的嵌套，可以更方便地控制样式的层级关系。3.支持模块化：Sass支持模块化开发，可以将样式分成多个模块进行开发，提高代码的可读性和可维护性。4.支持函数和运算符：Sass支持函数和运算符，可以完成更复杂的样式计算。5.支持导入其他文件：Sa
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
【归纳】C++入门算法模版总结（超级详细！！！）（包括高精度，排序，枚举，二分，搜索，动态规划等）
0.前言本文针对有一定算法基础的选手制作，收录了大部分算法的模板，详细解说可以点进去我提供的链接了解。或者进入我的主页给一点支持！本人也是一名新手，如果这篇文章有不严谨的地方或者不懂的地方可以在评论区留言，我会为你们一一解答的。【归纳】C++入门算法模版总结（包括高精度，排序，枚举，二分，搜索，动态规划等）（超级详细！！！）0.前言1.高精度1.1.单独实现1.1.1.高精度加法1.1.2.高精度
（C++）学生管理系统（正式版）（map数组的应用）（string应用）（引用）（文件储存的应用）（C++教学）（C++项目）
目录源代码：代码详解：学生成绩管理系统实现详解一、系统整体设计思路1.数据结构选择2.功能模块划分二、关键函数实现原理1.文件存储与加载save_file函数load_file函数2.核心数据操作add函数mod函数find和del函数3.数据展示display函数statistics函数三、核心技术详解1.字符串分割技术2.map的使用技巧3.文件格式设计4.错误处理机制源代码：/**头文件部分
【基础】C++中的关键词小熊猫爱编程重新学编程 c++开发语言
一、关键词的概念C++中的关键词是语言保留用来表示特定语法结构的单词，不能作为变量名、函数名或标识符使用。二、关键词有哪些在C++中有63个关键字，如下：关键词关键词关键词关键词关键词asmdoifreturntypedefautodoubleinlineshorttypeidbooldynamic_castintsignedtypenamebreakelselongsizeofunioncase
（阳：算法霸权 / 阴：数据确权）→当GDPR类法规覆盖53%经济体量时，催生出隐私计算新范式百态老人人工智能机器学习深度学习算法
当GDPR类法规覆盖53%经济体量时，隐私计算新范式的兴起可归因于以下多维度因素的相互作用：一、算法霸权与数据确权的矛盾激化算法霸权的危害大型科技公司通过算法歧视、大数据杀熟等手段形成垄断优势，利用数据优势操控用户行为，导致消费者权益受损。这种"算法黑箱"不仅加剧市场不公平，还阻碍数据要素的自由流动。例如，算法框架的底层逻辑掌握在少数企业手中，产生"数据黑箱"问题。数据确权的立法需求数据权属不明确
java 静态变量声明_java静态变量怎么声明？柚酱 java 静态变量声明
展开全部个人的总结1静态变量e69da5e6ba9062616964757a686964616f31333337616564只有一份被类的所有实例共享2静态变量的声明在编译时已经明确了内存的位置3延迟初始化是改变静态变量的值引用Java静态变量的初始化(static块的本质)在网上看到了下面的一段代码：1.publicclassTest{2.static{3._i=20;4.}5.publicst
扒开嵌入式硬件的底裤（上）！从 PCB 到 FPGA/IC 设计，小白到 CTO 的必学秘籍硬核知识点全揭秘！从c语言入门到mcu与arm架构及外设相关 small_wh1te_coder 嵌入式内核嵌入式开发嵌入式硬件算法 c 汇编面试驱动开发单片机
【硬核揭秘】嵌入式硬件工程师的“底裤”：从入门到牛逼，你必须知道的一切！第一部分：破冰与认知——嵌入式硬件工程师的“世界观”嘿，各位C语言老铁，以及所有对“让硬件听你话”充满好奇的朋友们！我是你们的老朋友，一个常年“折腾”在代码和电路板之间的码农。今天，咱们要聊一个真正能让你“硬”起来的话题——如何成为一个合格、优秀、牛逼的嵌入式硬件工程师！你可能正坐在电脑前，敲着C语言代码，刷着力扣算法题，心里
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
Python|Pyppeteer规避反自动化检测方法【最新方案】(33) 写python的鑫哥 Pyppeteer从入门到精通 python pyppeteer puppeteer 规避反自动化检测反爬虫
前言本文是该专栏的第33篇，结合优质项目案例持续分享Pyppeteer的干货知识，记得关注。相信有些同学在使用Pyppeteer框架进行某个自动化操作的时候，会触发平台的检测机制，让目标平台识别出当前是机器人在操作，而非人为操作，导致让你的程序无法继续进行下一步。对于上述这种情况，你是不是有很大的疑惑呢？别担心，本文笔者专门针对上述问题，来详细介绍在使用Pyppeteer的过程中，出现反自动化机制
基于条件风险价值CVaR的微网动态定价与调度策略（Matlab代码实现） Ps.729 matlab 开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、CVaR的理论基础及其在微网中的适用性1.CVaR的定义与优势2.微网应用场景适配性二、动态定价与调度模型的联合优化框架1.目标函数设计2.动态定价机制3.不确定性处理方法三、关键算法与求解策略1.随机规划与CVaR集成2.智能优化算法对比四、实证
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
最长回文子串-leetCode-005
针对这个问题，共有四种解法，分别是暴力法，中心拓展法，动态规划，Manacher算法解法一：暴力法思路：枚举所有可能的子串，然后判断每个子串是否是回文串，最后找出最长的回文子串。classSolution{publicStringlongestPalindrome(Strings){intn=s.length();if(n==0){return"";}StringmaxPalindrome=s.s
QtitanRibbon打造现代办公软件新体验：提升效率的专业界面解决方案界面开发小八哥 QtitanRibbon qt ribbon 界面控件 UI开发 c++
在现代办公环境中，无论是日常公文处理、文档编辑、任务协同还是数据分析，桌面办公软件仍扮演着不可替代的角色。然而，许多传统系统依旧使用菜单繁杂、图标混乱、交互老旧的界面，用户操作效率低、上手慢、满意度差。QtitanRibbon是一款基于Qt构建、全面实现MicrosoftOffice风格的Ribbon控件组件，旨在帮助开发者为办公类桌面应用打造现代化、高可用、可拓展的用户界面，提升软件体验的同时，
JavaScript与原生开发的较量：为何高性能可视化应用更适合选用SciChart？界面开发小八哥 javascript 开发语言 SciChart 图表工具数据可视化
SciChart是高性能数据可视化领域的优秀图表产品，深受数据密度和精度至关重要行业的信赖，包括航空航天、石油和天然气、科学研究和赛车运动等。作为F1中使用的解决方案，SciChart被NASA所依赖，并受到90%的顶级医疗技术公司青睐，它提供实时、跨平台的可视化，提供无与伦比的灵活性和定制性。立即获取SciChart正式版在为iOS和Android打造高性能数据可视化应用时，选择合适的开发方式至
R 语言安装使用教程小奇JAVA面试安装使用教程 r语言开发语言
一、R语言简介R是一种用于统计分析、数据挖掘和可视化的编程语言和环境。它在学术界和数据分析领域中广泛使用，拥有丰富的统计函数库和绘图功能。二、安装R语言2.1下载R安装包前往CRAN官网下载适合你操作系统的安装程序：官网地址：https://cran.r-project.org/2.2Windows安装下载.exe安装包；双击安装程序，按默认选项一路安装即可；安装完成后，可通过RGUI或命令行启动
【Qt6.3 基础教程 11】深入探索列表型控件：QListWidget和QComboBox 是阿牛啊 C++编程设计编程语言 qt6.3 开发语言人工智能 qt 数据库
文章目录前言QListWidget：便捷的项目列表主要特性示例：使用QListWidgetQComboBox：下拉选择的高效实现主要特性示例：使用QComboBox结合Model/View架构使用总结前言在任何现代用户界面中，列表是展示项目集合的重要组件。Qt框架提供了多种列表型控件，其中QListWidget和QComboBox是最常用的两种。在本篇博客中，我们将深入了解这两种控件的特点和用法，
[贪心算法]BM96 主持人调度（二） lanbing 多语言LeeCode的题解贪心算法算法
一、题目牛客题目链接：主持人调度（二）_牛客题霸_牛客网题目描述：有n个活动即将举办，每个活动都有开始时间与活动的结束时间，第i个活动的开始时间是startistart_istarti，第i个活动的结束时间是endiend_iendi,举办某个活动就需要为该活动准备一个活动主持人。一位活动主持人在同一时间只能参与一个活动。并且活动主持人需要全程参与活动，换句话说，一个主持人参与了第i个活动，那么该
reveiw of test --welcome www.1maitao.com 从0到1的技术进阶数据结构算法出版网络生活
--welcomewww.1maitao.comA数学的复习：1.最好能在7月前开始，如果你基础不是很好，又想在数学多拿分的话。2.课本很重要，08和09的题已经充分说明了基础的重要性，最好在5——6月把两册高数书及例题过两遍，有个宏观的把握，拿到题，就知道是在考什么。3.参考书的选择：个人觉得李永乐那本复习全书更注重基础，更贴近这2年的考研风格。全书中线性代数那100多页讲得超好。4.复习进度：
算法理论知识 Victor Zhong AI 框架算法
算法理论知识排序二分查找冒泡排序插入排序选择排序快速排序堆排序希尔排序归并排序基数排序动态规划排序二分查找start=0end=len(list)mid=(start+end)//2冒泡排序每次都是相邻元素两两比较并交换位置。插入排序就好比扑克牌（分左边排好序，右边待排序），每次都是从右边拿一张牌去左边排好序的序列中找插入的位置。选择排序从后面找最小的和前面那个元素进行交换快速排序从中找一个元素作
时间复杂度高斯林.神犇数据结构
一、算法的目的：解决一个问题，所需执行代码的效率时间评价法：有很大缺陷，由于硬件CPU结构不同导致时间绝对差异性太大（有可能CPU好一点运行速度块，但算法可能很烂）纯时间法不行，后来人们提出：二、数据增长性来评价耗时间增长性和耗空间增长性比如当我们数据增长十倍，所耗空间或者所耗时间是否增长十倍，在此基础上提出两个概念时间复杂度空间复杂度三、那怎么计算时间复杂度呢1.找核心语句2.看核心语句执行的频
271万+学术论文数据集 (2007-2025.4) .Android安卓科研室. 数据引用数据分析
文章目录数据下载地址数据指标说明一、数据介绍二、数据指标三、数据概览项目备注数据下载地址数据下载地址点击这里下载数据数据指标说明arXiv是一个向所有人开放的学术资源共享平台，创立于1991年，是开放获取运动的先驱。该平台由全球志愿者团队维护，目前已收录超过200万篇学术论文，涵盖物理学、计算机科学、数学等八大核心学科领域。通过近30年的发展，arXiv不仅为科研人员提供了免费的知识共享渠道，也成
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f