Vinyyu

Cox模型中的时间依存协变量和时间依存系数（R语言）第二部分

4. 时间依存系数

时间依存协变量(covariates)和时间依存系数(coefficients)是两种不同的扩展Cox模型，如下面的两个等式所示。
$\lambda(t)=\lambda_0(t) e^{\beta X(t)}$ (1)
$\lambda(t)=\lambda_0(t) e^{\beta (t)X}$ (2)

等式（1）是时间依存协变量，是一种常用且易于理解的用法。等式（2）具有时间相关系数，这种模型不太常见，但代表了一种处理非比例风险的方法。而通常比例风险假设恰恰是不随时间变化的系数： $\beta (t)=c$ 。cox.zph函数将绘制研究的 $\beta (t)$ 的估计值，用于诊断和理解非比例危险。以下是一个使用退伍军人癌症数据veteran的测试案例。

library(survival)
options(show.signif.stars=FALSE)
vfit<-coxph(Surv(time,status)~trt+prior+karno, veteran)
vfit

quantile(veteran$karno)

zp<-cox.zph(vfit, transform=function(time) log(time+20))
zp

plot(zp[3])
abline(0,0, col=2)
abline(h=vfit$coef[3], col=3, lwd=2, lty=2)

Karnofsky得分是一个非常重要的预测因子，但它的效果随着时间的推移并不是恒定的，如测试结果和绘图所示。在早期它有一个很大的负面效果：在第一个四分位值的病人，风险大约是在第三个四分位数值的病人的exp(35 * .03377)=3.2倍；但到了200天，这种关系已经减少到并没有多少，和零差不多了。一种解释是，在这种非常严重的疾病中，任何超过6个月之前的措施都不再适用。

比例风险模型估计的是随时间的平均危险，其值由虚线水平线表示。使用平均危险通常是合理的，比例风险假设毕竟不是那么精确的。然而，在这种情况下，与均线的背离是如此之大，这时依赖于时间的系数是对实际状态则是一种更有用的总结。 cox.zph图非常适合诊断，但不能产生一个合适的 $\beta (t)$ ，那么我们如何来建立这个模型呢？

4.1 阶梯函数

一种最简单的扩展是 $\beta (t)$ 的阶梯函数，例如，不同时间间隔采用不同系数。一种简单的方法是使用survSplit函数将数据集分解为时间相关的部分。我们会将上述veteran数据任意划分为前3个月，3-6个月和6个月以上的3个时期。

vet2 <- survSplit(Surv(time, status) ~ ., data= veteran, cut=c(90, 180),
episode= "tgroup", id="id")
vet2[1:7, c("id", "tstart", "time", "status", "tgroup", "age", "karno")]

vfit2 <- coxph(Surv(tstart, time, status) ~ trt + prior + karno:strata(tgroup), data=vet2)
vfit2

cox.zph(vfit2)

修正后的数据显示，基线Karnofsky评分的效果基本上限于前两个月。 cox.zph函数没有显示Karnofsky评分进一步的时间依赖效应了。后面一点当然不足为奇，因为我们使用了原始图表来选择切割点。三个区间的系数将会不同，会受到序列过程影响产生偏差，必须谨慎查看。
后期的生存曲线拟合则需要更多的关注。默认曲线使用协变量的平均值，在这种情况下总会有问题且完全无用。查看模型的均值如下：

vfit2$means

默认曲线将针对治疗组1.47上的某人，这适用于任何人，以及Karnofsky评分的单组“混合”值，每次都是三个Karnofsky系数。这个可以通过创建具有时间间隔的新数据集来进行纠正。我们创建了两个标记为“曲线1”和“曲线2”的假设受试者。无论是在治疗1还是没有事先治疗的情况下，一个人的Karnofsky为40，另一个人为75。每个都具有时间依赖性协变量tgroup的适当值，分别在0-90,90-180和180+天为1,2,3。我们将绘制第一年的曲线。

cdata <- data.frame(tstart= rep(c(0,90,180), 2),
	time = rep(c(90,180, 365), 2),
	status= rep(0,6), #necessary, but ignored
	tgroup= rep(1:3, 2),
	trt = rep(1,6),
	prior= rep(0,6),
	karno= rep(c(40, 75), each=3),
	curve= rep(1:2, each=3))
cdata

sfit <- survfit(vfit2, newdata=cdata, id=curve)
km <- survfit(Surv(time, status) ~ I(karno>60), veteran)
plot(km, xmax= 365, col=1:2, lwd=2,xlab="Days from enrollment", ylab="Survival")
lines(sfit, col=1:2, lty=2, lwd=2)

基于coxph模型的生存曲线的默认行为是为输入数据中的每一行创建一条曲线; id选项使它为每条曲线使用一组线。在第25和第75百分位数处的Karnofsky值大致分别代表受试者的下半部分和上半部分的平均分数，并且在低于和高于中值的Kaplan-Meier曲线的顶部。

4.2 连续的时间依存系数

如果假定 $\beta (t)$ 具有简单的函数形式，我们可以欺骗一个普通的Cox模型程序来进行拟合。例如， $\beta (t)$ = a + b log(t)是一种经常被假设的特定形式。然后 $\beta (t)$ x = ax + b log(t)x = ax + bz，被用于特殊时间相关协变量z = log(t)x。选择在log(t+20)之上用cox.zph图的时间尺度，使得该图的前200天大致呈线性。根据这个简单的线性模型并不适合整个范围，但我们将继续前进并将其作为一个简单的例子。一个明显但不正确的方法是：

vfit3 <- coxph(Surv(time, status) ~ trt + prior + karno + 
		I(karno * log(time + 20)), data=veteran)

这实在是个常犯错误，以致于更新的coxph例程会输出这种尝试的错误提示信息。这个错误的问题在于，上面的代码实际上并没有创建一个时间相关的协变量，而是根据协变量的时间为每个受试者创建一个时间静态值; 与我们在coxph调用之外构造变量没有什么不同。这个变量非常明确地打破了关于不能展望未来的规则，人们很快就会发现循环性：大的时间值似乎可以预测长期生存，因为长期生存导致了大量的时间价值。

一个正确的连续型时间依存协变量可以被time-transform函数构造，如下：

vfit3 <- coxph(Surv(time, status) ~ trt + prior + karno + tt(karno), 
		data=veteran,			
		tt = function(x, t, ...) x * log(t+20))
vfit3

plot(zp[3])
abline(coef(vfit3)[3:4], col=2)

时间相关系数估计为 $\beta (t)$ = -0.125 + 0.021 * log(t + 20)。我们可以将该拟合线添加到cox.zph图中。毫不奇怪，结果对于时间> 200来说太高而且低估了初始斜率。但是，这个拟合仍然优于vfit中的常数为水平线的拟合，正如vfit3中斜率项的p值所证实的那样。（来自cox.zph的该项的p值几乎相同，正如它必须是几乎一致的，因为cox.zph中的测试是针对所选时间尺度上的线性效应。）

顺便提一下，这种相同的编码二分法同样存在于SAS phreg中。将时间添加到模型语句的右侧将创建时间固定变量（这是不正确的），而phreg中使用time作为变量的编程语句将生成时间相关对象。这种错误的可能性较小，因为phreg的模型语句比R更不灵活，也就是说，在SAS中你不能简单地在右侧写"log(time)"。

5.1 时间依存协变量

延续上章节 $\beta (t)$ 的例子，值得额外注意的是，使用编程语句来创建是/否变量可能会出现另一种常见的错误。假设有一个数据集有两个时间变量：从登记到最后一次随访的时间（lfu）和到糖尿病发生的时间（diabetes）；然后比如说，我们希望使用糖尿病的出现作为时间依存协变量。以下是一个自建的小例子：

data1 <- read.table(col.names=c("id", "diabetes", "lfu", "status"),
	header=FALSE, text="
	1 5 30 1
	2 10 15 1
	3 NA 60 0
	4 NA 80 1
	5 10 80 0
	6 NA 90 1
	7 30 95 1
	")
data1$d2 <- pmin(data1$diabetes, 300, na.rm=TRUE) #replace NA with 300
fit1 <- coxph(Surv(lfu, status) ~ tt(d2), data=data1,
	tt = function(d2, t, ...) ifelse(t > d2, 1, 0))
fit2 <- coxph(Surv(lfu, status) ~ tt(d2), data=data1,
	tt = function(d2, t, ...) ifelse(t < d2, 0, 1))
c(coef(fit1), coef(fit2))

人们可能期望拟合fit1和拟合fit2给出相同的系数，但从上述结果看，它们完全不同。问题出在7号受试者，他的糖尿病发生时间正好落在一个事件发生时间内。在fit1中，他们的糖尿病协变量在事件时间为30后有效地改变，在fit2中它在事件时间为30之前发生变化，因此第二个是不正确的。举个例子说，比如赌博时，所有赌注必须放在轮盘球落地之前。

当使用tmerge函数将数据集扩展为start, stop格式时，则将被正确处理。

data2 <- tmerge(data1, data1, id=id, dstat=event(lfu, status),
		diab = tdc(diabetes))
subset(data2, id %in% c(1,7), c(id, tstart:diab))
fit3 <- coxph(Surv(tstart, tstop, dstat) ~ diab, data2)
c(coef(fit1), coef(fit2), coef(fit3))

5.2 可预测时间依存协变量

偶尔会有一个时间依存协变量，其未来的值是可预测的。其中最明显的是患者年龄，偶尔对于药物的累积剂量可能是正确的。由于部分似然（partial likelihood）的结构，如果在模型中输入年龄作为线性项，那么在Cox模型将忽略年龄变化造成的效应。假设i号受试者在时间 $t_i$ 处具有一个事件；而其他受试者 $j\in R_i$ 在该时间处于一个累计年龄贡献的风险中。那么其部分似然项定义为：
$\cfrac{e^{\beta*a_i}}{\Sigma_{j\in R_i} e^{\beta *a_j}}=\cfrac{e^{\beta*(a_i+t_i)}}{\Sigma_{j\in R_i} e^{\beta *(a_j+t_j)}}$

我们看到使用时间相关的年龄（等式右边）或基线时年龄（等式左边），其部分似然项是相同的，因为 $e^{\beta t_i}$ 在分式中被取消了。但是，如果年龄对风险的影响是非线性的，那么不能这样简单消去。

因为年龄是连续变化的，我们从理论上说需要一个非常大的数据集以捕捉这种效应，以每天为间隔直至死亡。但实际使用中并不需要这样做，因为尽管我们在变老，但是风险一般不会以天数为单位增加的那么快。

一种方法是使用coxph的time-transform创建时变协变量。下面是使用pbc数据集的示例。该数据集中最长的跟进时间超过13年，后续时间以天为单位，我们可能会担心中间数据集会很大。然而，程序在事件发生时仅需要每个主题的时间相关协变量的值，因此中间数据集中的最大行数是受试者数量乘以事件次数。

pfit1 <- coxph(Surv(time, status==2) ~ log(bili) + ascites + age, pbc)
pfit2 <- coxph(Surv(time, status==2) ~ log(bili) + ascites + tt(age),
	data=pbc,
	tt=function(x, t, ...) {
	age <- x + t/365.25
	cbind(age=age, age2= (age-50)^2, age3= (age-50)^3)
	})
pfit2
anova(pfit2)

2*(pfit2$loglik - pfit1$loglik)[2]			
#result: 10.80621

由于初始年龄是以年为单位而时间以天为单位，因此在tt函数内进行缩放非常重要。在自由度为2时似然比为10.8，表明附加的定义比较显著。

如果在等式右侧有一个或多个项作为tt()运算操作符，则程序将为每个唯一的事件时间预先计算该变量的值。一个用户自定义函数的参数可以是：

协变量：tt()调用内的任何内容
事件时间
事件编号：如果有多个层次并且在相同时间段内两个层级同时发生，则可以分别处理它们
观察值的权重，如果调用函数使用了权重系数

底层代码单次调用函数，它使用一个巨大的x向量，包含的元素是每个受试者在每个事件时的风险。如果公式中有多个tt()项，则tt的参数应该是具有必需元素数的函数列表。然而需要注意的是，你不能将公式列为：log（bili）+ tt（age）+ tt（age）。原因是R公式解析器在结果未到达coxph函数之前即删除了冗余项。（这对用户来说是一种很方便的操作，如y=x1 + x2 + x1不会在X矩阵中生成冗余列。）

适合上述模型的一种解决方法是直接创建扩展数据集，然后对扩展数据执行普通的coxph调用。当然，这样做的缺点是数据集非常大，但它不会大于tt调用后创建的内部数据集。优点是可以进一步处理模型，例如残差或生存曲线。以下例子重述了tt函数的调用。

dtimes <- sort(unique(with(pbc, time[status==2])))
tdata <- survSplit(Surv(time, status==2) ~., pbc, cut=dtimes)
tdata$c.age <- tdata$age + tdata$time/365.25 -50 #current age, centered at 50
pfit3 <- coxph(Surv(tstart, time, event) ~ log(bili) + ascites + c.age +
	I(c.age^2) + I(c.age^3), data=tdata)
rbind(coef(pfit2), coef(pfit3))

与起始pbc数据的418次观察相比，上述扩展产生了42401个观测值的数据集。通常可以通过更粗略的时间网格获得合理的拟合：在pbc数据中，在第41天和第43天有一个事件，是否真的有必要在第二个中更新所有主题年龄2/365以反映增加风险？因此替换为max(dtimes)/365.25 = 11.5年，将11年作为总跟进年数。

dtime2 <- 1:11 * 365.25
tdata2 <-survSplit(Surv(time, status==2) ~., pbc, cut=dtime2)
tdata2$c.age <- tdata2$age + tdata2$time/365.25 -50 #current age, centered at 50
pfit4 <- coxph(Surv(tstart, time, event) ~ log(bili) + ascites + c.age +
	I(c.age^2) + I(c.age^3), data=tdata2)
rbind('1 day grid'= coef(pfit3), '1 year grid'= coef(pfit4))
c(tdata=nrow(tdata), tdata2=nrow(tdata2))
#results:   tdata  42401; tdata2  2393

可以看到在结果几乎相同的情况下，新数据集大小为原来的1/20。这使得大数据集的计算时间有很大差异。确切地说，如何“缩减”切割点主要基于对受试对象的特定认知，可以基于cox.zph图选择选定的点，或者从非常粗略的时间网格开始然后逐步精细计算。在这个数据集中，我们有理由说尽管风险随着年龄的增长而增加，但是年龄变化小于一年的影响其实很小。

Cox模型需要计算每个事件时间的协变量的加权平均值和方差，该过程本质上就是 $O(ndp^2)$ ，其中n =样本大小，d =事件数量，p =协变量数量。底层代码中的大部分算法工作用于更新均值和方差矩阵，将计算时间减少到 $O((n+d)p^2)$ 。在时间分割中不可能进行更新，并且计算重新开始，因为tt术语我们根本不会更新；甚至对于中等大小的数据集，nd与n + d对计算时间的影响都有可能是令人惊讶的。

tt函数还有其他有趣的用途。一个例子是O’Brien的logit-rank测试程序[6]。他提议在每个事件时间用其队列排名的logit变换替换协变量。这消除了预测器x中任何异常值的影响。对于这种情况，我们忽略事件时间参数并专注于分组以创建以下tt函数。

function(x, t, riskset, weights){
	obrien <- function(x) {
		r <- rank(x)
		(r-.5)/(.5+length(r)-r)
	}
	unlist(tapply(x, riskset, obrien))
}

这依赖于tt()的输入参数按事件编号或风险集排序的事实。如果在coxph调用中不存在tt参数，则此函数用作默认值，但模型公式中有tt项。

另一个有趣的用法是用简单的等级替换数据，而不是重新调整为0~1。

function(x, t, riskset, weights)
	unlist(tapply(x, riskset, rank))

此模型的得分统计量为 $(C - D) / 2$ ，其中C和D是一致配对和不一致配对的数量，请参阅survConcordance函数。然后这种拟合的得分统计量是对于一致性统计的重要性测试，实际上是survConcordance报告的标准错误的基础。 O’Brien测试可以被视为一致性统计，其给予每个事件时间相同的权重，而标准的一致性将对每个事件与风险集的大小成比例地加权。

参考文献
[1] Anderson JR, Cain KC, and Gelber RD. Analysis of survival by tumor response. J Clinical Oncology 1:710~719, 1983.
[2] M Buyse and P Piedbois. The relationship between response to treatment and survival time. Stat in Med 15:2797~2812, 1996.
[3] J Crowley and M Hu. Covariance analysis of heart transplant survival data. J American Statistical Assoc, 72:27~36, 1977.
[4] M H Gail. Does cardiac transplantation prolong life? A reassessment. Annals Int Medicine 76:815-17, 1972.
[5] J Kalbfleisch and R Prentice. The statistical analysis of failure time data, second edition. Wiley, 2002.
[6] O’Brien, Peter. A non-parametric test for association with censored data, Biometrics 34:243~250, 1978.
[7] Redmond C, Fisher B, Wieand HS. The methodologic dilemma in retrospectively correlating the amount of chemotherapy received in adjuvant therapy protocols with disease free survival: a commentary. Cancer Treatment Reports 67:519~526, 1983.
[8] S Suissa. Immortal time bias in pharmacoepidemiology. Am J Epi, 167:492-499, 2008.

本文译自Terry Therneau, Cynthia Crowson, Elizabeth Atkinson. Using Time Dependent Covariates and Time Dependent Coecients in the Cox Model. November 26, 2018.

未经同意请勿转载

C#实现24种数据校验算法的综合指南及工具包.zip 语嫣凝冰
本文还有配套的精品资源，点击获取简介：在数据通信和网络编程中，数据的完整性和准确性是至关重要的。C#作为一种流行的开发语言，提供了强大的工具来实现各类数据校验算法。本压缩包包含了一个名为“WindowsFormsApp”的C#应用程序，用于展示和实验24种数据校验方法，涵盖从简单到复杂的各种算法。这包括CRC校验、MD5、SHA系列、Adler32、Checksum、ParityBit、LRC、H
声控灯设计与Protus仿真语嫣凝冰
本文还有配套的精品资源，点击获取简介：声控灯是智能家居系统中关键的智能设备，通过声音信号控制灯光的开关。本文深入分析了声控灯的设计原理、工作流程，并探讨了如何利用Protus软件进行声控灯的仿真，以及电位器在灵敏度调节中的应用。学生将学习声控模块的组成和阈值设定，以及如何使用Protus软件来模拟声控灯的实际运作，优化其性能。1.声控灯设计原理声控灯技术是一种利用声音信号来控制灯具开关的现代照明技
新版进销存管理系统完整教程：PB9.0与SQL Server 2000的实战应用语嫣凝冰
本文还有配套的精品资源，点击获取简介：本文档提供了一个基于PowerBuilder9.0和SQLServer2000开发的进销存管理系统的全面教程。系统涵盖了企业管理中的采购、销售和库存管理环节，通过强大的数据窗口组件和三层架构设计，实现了业务逻辑和数据库的有效交互。文章详细解释了系统的技术栈、核心功能、系统架构、数据窗口组件、数据库设计、报表分析及权限安全管理等关键点，旨在帮助用户深入理解进销存
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
大语言模型：人像摄影的“达芬奇转世”？——从算法解析到光影重塑的智能摄影革命黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
导言在摄影术诞生之初，达芬奇或许无法想象，他对于光影、比例和解剖的严谨研究，会在数百年后以另一种形式重生。今天，当摄影师面对复杂的光线环境或苦苦寻找最佳构图时，一位由代码构筑的“光影军师”正悄然降临——大语言模型（LLM）正以前所未有的方式，重塑人像摄影的创作边界。解构经典：大语言模型如何“消化”百年摄影智慧大语言模型并非凭空创造建议，其根基在于对海量摄影知识体系的深度理解与结构化重组。理论内化：
集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
【数据结构】详解堆排序当中的topk问题（leetcode例题） ylfxw 数据结构 leetcode 算法
文章目录前言如何理解topk问题代码逻辑代码实现前言Leetcode相关题目：215.数组中的第K个最大元素如何理解topk问题**TopK问题是一个经典的问题，在计算机科学中，它的目标是在一组数据中找到前K个最大或最小的元素。**这个问题在许多场景下都很重要，比如搜索引擎的搜索结果排名、数据分析中的热门元素筛选等。.在最简单的形式中，给定一个数组（或列表）和一个整数K，TopK问题要求返回数组中
LVS调度算法等风来也chen 随笔 lvs lvs调度算法
LVS的十种调度算法一）静态调度：①RR（RoundRobin）:轮询调度轮询调度算法的原理是每一次把来自用户的请求轮流分配给内部中的服务器，从1开始，直到N(内部服务器个数)，然后重新开始循环。算法的优点是其简洁性，它无需记录当前所有连接的状态，所以它是一种无状态调度。【提示：这里是不考虑每台服务器的处理能力】②WRR：weight,加权轮询（以权重之间的比例实现在各主机之间进行调度）由于每台服
LVS调度算法+防火墙解决轮询调度问题+会话解决甜辣小悦羊 lvs 服务器运维
lvs的调度算法类型分配：依据负载状态静态方法：仅根据算法本身进行调度，不考虑RS的负载情况动态方法：主要根据每RS当前的负载状态及调度算法进行调度Overhead=value较小的RS将被调度静态调度方法：RR（roundrobin）：轮询RS分别被调度，当RS配置有差别时不推荐WRR（WeightedRR）：加权轮询根据RS的配置进行加权调度，性能差的RS被调度的次数少SH（SourceHas
LVS的10种调度算法蜡笔晓心其他
1.1静态算法:1.1.1rr(roundrobin):轮询调度算法:轮询调度算法的原理就是依次将用户的访问请求,平均的分配到每一台web服务节点上,从1开始,到最后一台服务器节点结束,然后在开始新一轮的循环,这种算法简单,但是没有考虑到每台节点服务器的具体性能1.1.2wrr(weight):权重调度算法由于每台服务器的性能会高低不同,wrr将会根据管理员设定的权重值来分配访问请求,权重值越大的
算法工程师必备：数据结构10大经典算法详解数据结构与算法学习数据结构与算法宝典算法数据结构 ai
算法工程师必备：数据结构10大经典算法详解关键词：数据结构、经典算法、时间复杂度、应用场景、代码实现摘要：本文是算法工程师的“算法工具箱”指南，系统讲解数据结构领域最核心的10大经典算法（快速排序、归并排序、二分查找、深度优先搜索DFS、广度优先搜索BFS、动态规划、贪心算法、KMP字符串匹配、哈希算法、并查集）。通过生活案例、代码示例、复杂度分析和实战场景，帮你彻底掌握这些算法的原理与应用，真正
听听自己的声音绿色番茄
刚准备洗漱，手机发来提示音，原来是方老师提交了作业忽然想起今天某人第一次提交作业，抓耳挠腮，像憋着大的……最近几天其实都有在写，只是每每满腹的话，却不能一吐为快，为啥呢，写了一半，实在写不下去的有三篇，哎呀，写着写着，就觉得没有了写的必要思来想去，我分析，应该是我自愈能力太强了，上一秒被hans气得要吐血，发誓要好好写一篇，记录他的恶行，下一秒心底又有了一个声音在说：亲生的…亲生的…是不是我的方式
lvs调度算法（10种） beyoundout lvs 算法
一、静态算法（不考虑后端真实服务器的负载情况，按算法该谁就分配给谁）1.rr（RoundRobin）轮询算法算法原理：将外部请求按顺序轮流分配到集群中的真实服务器上，它均等地对待每一台服务器，而不管服务器上实际的连接数和系统负载举例：就像在食堂打饭，有三个打饭窗口。学生们排成一队从餐厅门口进入食堂，依次到第一个窗口、第二个窗口、第三个窗口打饭，后面的学生再从第一个窗口循环，每个窗口平等地接待学生，
拼多多官方返利新动向，高省App引领购物省钱新趋势古楼
电商行业的快速发展带来了无数的新趋势和新机遇，而拼多多官方返利的新趋势无疑是其中的一大亮点。高省App作为这一趋势的敏锐洞察者和积极参与者，致力于帮助用户精准把握这些新机遇。通过高省App，用户可以及时了解拼多多官方返利的最新政策和活动信息，从而做出更加明智的购物决策。同时，高省App还提供了专业的数据分析工具，帮助用户分析自己的消费行为和省钱效果，让省钱之路更加清晰和明确。我们在开始讲今天的文章
2020-11-09 风知我意
来的路上在背书，没有心思看外面的风景。回去的路上似乎又没了心情。每次跟他在一起的时候，感觉时间被暂停，不用去思考很多乱七八糟的事。不用着急，不用焦虑。我一直都还挺害怕北京的，还有上海。嗯，是害怕。觉得它庞大，深不可测，光怪陆离，我会生存不下去。这次来，所有虚幻的想法都落了地。这里有我爱的男生，有我喜欢的子鱼，还有好多我喜欢的博主，大晴，斯斯，听话…很多事情变的具体。北大医学部也好，天安门也好，就静
【Tomcat】Tomcat线程池深度调优手册（终极版）夜雨hiyeyu.com java tomcat java jvm spring spring boot nginx apache
Tomcat线程池深度调优手册（终极版）一、Tomcat线程池架构全解析二、精准参数计算公式（带场景适配）三、线程池溢出故障树分析四、生产环境全链路调优五、极限性能压测方案六、特殊场景应对策略七、调优禁忌清单八、调优效果验证一、Tomcat线程池架构全解析三层处理模型accept队列任务分发响应TCP层NIO线程业务线程池网络层TCP层：内核维护的SYN队列（受net.core.somaxconn
Springboot + MyBatis-Plus + PageHelper 分页性能混合优化方案夜雨hiyeyu.com java spring boot mybatis 后端 database spring java spring cloud
springboot+MyBatis-Plus+PageHelper分页性能混合优化方案一、传统分页性能瓶颈分析1.1深度分页问题1.2性能对比测试二、混合优化方案架构三、完整实现代码3.1依赖配置3.2配置类3.3混合分页工具类3.4Service层实现四、深度优化策略4.1游标分页优化4.2覆盖索引极致优化4.3分页缓存策略五、性能对比测试5.1测试环境5.2测试结果5.3内存消耗对比六、生产
Spring Boot+Redis+Caffeine 二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）夜雨hiyeyu.com java spring boot redis 架构后端 java spring cloud spring
SpringBoot+Redis+Caffeine二级缓存架构的终极实现方案、包含万级QPS下的黄金配置参数、全文超过2500字（博君一赞）一、架构设计原理（10万QPS基石）设计优势：二、Caffeine本地缓存原子级配置1.高性能缓存构造器2.容量智能计算算法3.动态TTL策略三、Redis集群极致优化（支撑百万OPS）1.Lettuce连接池配置2.Redis服务端关键配置3.Pipelin
单体VS微服务：如何选择最适合的架构？
目录一、什么是单体架构和微服务架构？1.单体架构（MonolithicArchitecture）2.微服务架构（MicroservicesArchitecture）二、单体架构的优缺点优点：缺点：三、微服务架构的优缺点优点：缺点：四、如何选择？适用场景对比五、实际案例分析1.单体架构的成功场景2.微服务的典型应用3.混合模式六、面试与职场建议七、总结在Java开发中，单体架构和微服务架构是两种核心
python 密码学模块_Python加密与解密 No module named 'Crypto' weixin_39827304 python 密码学模块
DES加密全称为DataEncryptionStandard，即数据加密标准，是一种使用密钥加密的块算法入口参数有三个：Key、Data、ModeKey为7个字节共56位，是DES算法的工作密钥；Data为8个字节64位，是要被加密或被解密的数据；Mode为DES的工作方式,有两种:加密或解密3DES(即TripleDES)是DES向AES过渡的加密算法使用两个密钥，执行三次DES算法加密的过程是
No module named "Crypto"，如何安装Python三方模块Crypto weixin_30342827 python 操作系统
前两天公司公司老总让我研究怎么用企业微信第三方应用进行官网对接，完成URL回调验证问题。具体如何进行Python的Django网站与企业微信第三方应用进行回调验证的博客地址为：https://www.cnblogs.com/ws17345067708/p/10522472.html这里讲讲，如何在win10下，安装一个非常坑爹的加密算法库，名字叫"Crypto"看了好多博客，没有一个管用的，要么就
Python 报错：ModuleNotFoundError: No module named ‘Crypto‘
Crypto报错解决方案Python报错：ModuleNotFoundError:Nomodulenamed'Crypto'前言问题解决方案Python报错：ModuleNotFoundError:Nomodulenamed‘Crypto’前言Crypto是一个加密模块，它包含了多种加密算法，如AES、DES、RSA等。它不是Python标准库的一部分，需要使用pip安装。pycrypto和Cry
广州最全亲子鉴定收费费用标准大全(附2024年最新报价）中量国鉴
广州亲子鉴定收费多少钱？在广州办理亲子鉴定时，费用是一个重要的因素，广州市亲子鉴定费用在2000-4500元左右。然而，亲子鉴定的费用因地区、鉴定机构、鉴定类型、参与人数及是否需要加急等多种因素而有所不同。因此，了解这些影响因素对估算费用至关重要。以下是对亲子鉴定费用的详细分析。广州亲子鉴定中心：182-1818-9078(点击预约)广州亲子鉴定多少钱?广州市亲子鉴定费用在2000-4500元左右
历史悬疑之阿房宫是不是项羽烧的叶之林
大家好我是叶之林，今天为大家，了解，分析，阿房宫是不是项羽烧的，喜欢的话点点关注，谢谢史书记载，西楚霸王项羽进入咸阳后，看到如此奢华的秦朝暴君享乐之所，心中大怒，一把火烧了阿房宫。从此人们一直认为阿房宫是项羽烧的，但现在不断有人指出，项羽烧的是秦始皇在咸阳的宫室建筑，而不是阿房宫，项羽究竟有没有烧阿房宫呢，如果没有烧过，那规模宏大的阿房宫又到那里去了，为何消失了呢？唐代著名诗人杜牧在(阿房宫赋)中
非对称加密算法（RSA、ECC、SM2）——密码学基础
对称加密算法（AES、ChaCha20和SM4）Python实现——密码学基础(Python出现Nomodulenamed“Crypto”解决方案)这篇的续篇，因此实践部分少些；文章目录一、非对称加密算法基础二、RSA算法2.1RSA原理与数学基础2.2RSA密钥长度与安全性2.3RSA实现工具与库2.4RSA的局限性三、椭圆曲线密码学(ECC)3.1ECC原理与数学基础3.2常用椭圆曲线标准3.
JetBrains IntelliJ IDEA插件推荐 Someone_sky intellij-idea java ide
在IntelliJIDEA可以安装一些插件，让工作更有效率，好的插件可以满足从新手到资深开发者的各种需求。ApifoxHelper:ApifoxHelper是一个免费的、专为Java和Kotlin开发者设计的高效API调试插件。它能够自动分析项目中的接口，并允许你直接在IDEA中发送请求，无需在IDE和其他工具之间来回切换。这个插件还能自动填充请求参数，解析各种响应体，并记录请求历史，方便你实时编
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
2019-07-27文献阅读记录一行白鹭上青天
题目：城市群视角下空间联系与城市扩张的关联分析期刊：地理科学进展ProgressinGeography作者：焦利民，唐欣,刘小平摘要：在城市群发展的不同阶段，城市扩张表现出不同的时空特征。从城市群视角研究城市扩张的时空规律，对于理解城市扩张与城市群网络化组织结构之间的复杂耦合关系具有重要意义。本文以长江三角洲城市群为例，基于交通网络、引力模型和空间句法模型，结合1980、1990、2000和201
2023-04-12 王松奇
京心❤️达理想城店：王松奇2023年4月12日日精进落地真经严格就是爱，放纵既是害正能量语录每一颗螺丝都有标准每一颗螺丝都是标准产值目标：13万台次目标:80台油卡目标：13张今日体验今天开数据分析会台次少保养预存一定要盯紧中间10天要努力冲刺一下
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开