拓端研究室

R语言混合效应逻辑回归（mixed effects logistic）模型分析肺癌数据

原文链接：http://tecdat.cn/?p=22302

混合效应逻辑回归用于建立二元结果变量的模型，其中，当数据被分组或同时存在固定和随机效应时，结果的对数几率被建模为预测变量的线性组合。

混合效应逻辑回归的例子

例1：一个研究人员对40所不同大学的申请进行抽样调查，以研究预测大学录取的因素。预测因素包括学生的高中GPA、课外活动和SAT分数。一些学校的选择性较多或较少，所以每所学校的基准录取概率是不同的。学校层面的预测因素包括学校是公立还是私立，目前学生与教师的比例，以及学校的排名。

例2：一家大型HMO想知道哪些病人和医生的因素与病人的肺癌在治疗后是否得到缓解最相关，这是一项关于肺癌病人的治疗效果和生活质量的研究的一部分。

例3：一家电视台想知道时间和广告活动如何影响人们是否观看电视节目。他们对四个城市的人进行了为期六个月的抽样调查。每个月，他们都会询问人们在过去一周是否观看了某个节目。三个月后，他们在四个城市中的两个城市推出了一个新的广告活动，并继续监测人们是否观看了该节目。

数据描述

在这个例子中，我们将使用一个数据集来探讨关于肺癌的例子。我们收集了病人的各种结果，他们被包含在医生身上，而医生又被包含在医院里。还有一些医生层面的变量，比如我们将在例子中使用的 "医生经验"。

within(hp, {
  已婚 <- factor(已婚, levels = 0:1, labels = c("否", "是"))
  DID <- factor(DID)
  HID <- factor(HID)
  癌症阶段 <- factor(癌症阶段)

现在我们要对我们的连续预测变量进行绘图。数据的可视化可以帮助我们理解分布情况，发现编码错误（例如，我们知道一个变量的取值范围是0到7，但我们在图中看到了999），并让我们了解变量之间的关系。例如，我们可能看到两个预测因子高度相关，于是决定只在模型中包括一个，或者我们可能注意到两个变量之间有曲线关系。数据可视化是一种快速、直观的方式，可以一次性检查所有这些情况。如果你的大多数预测因子看起来都是相互独立的，数据很好。例如，如果它们是独立的，当你输入另一个预测因子时，一个预测因子的估计值不应该有太大变化（尽管标准误差和显著性检验可能会有）。我们可以通过简单地查看数据来了解所有这些信息以及判断如何建模。

ggpairs(hp[, c("IL6", "CRP", "住院时间", "医生经验")],

我们的连续预测因子之间似乎没有强的线性关系。让我们看看我们的变量在癌症阶段中的分布情况。因为住院时间是以天为单位的，我们可以用气泡图来研究癌症阶段与它的关系。每个气泡的面积与具有这些数值的观察值的数量成正比。对于连续的预测因子，我们使用小提琴图。所有的原始数据都按癌症阶段分开显示。

我们增加了小提琴图。小提琴图只是围绕绘图轴反映的核密度图。我们将小提琴图绘制在具有透明度的抖动点之上，这样就可以看到原始数据。

因为IL6和CRP都有偏斜分布的倾向，所以我们在Y轴上使用了平方根刻度。分布看起来相当正常和对称，你仍然可以看到长的右尾，即使使用了平方根刻度（注意，只有刻度被转移，数值本身没有被转换，这很重要，因为这让你看到并解释实际的分数，而不是分数的平方根）。

ggplot(    stat_sum(aes(size = ..n.., group = 1)) +
  scale_size_area(max_size=10)

ggplot(tp,  +
  geom_jitter(alpha = .1) +
  geom_violin(alpha = .75) +

因为很难看到二元变量在连续变量的水平上如何变化，我们可以反过来看看二元结果的每个水平上的连续变量的分布。

ggplot(tmp, 
  geom_boxplot() +
  facet_wrap(~variable, scales="free_y")

分析方法

下面是一个分析方法的列表：

混合效应逻辑回归，是本页面的重点。

混合效应probit回归与混合效应logistic回归非常相似，但它使用的是正态CDF而不是logistic CDF。两者都对二元结果进行建模，可以包括固定和随机效应。
固定效应逻辑回归在这种情况下是有限的，因为它可能忽略了必要的随机效应和/或数据中的非独立性。
固定效应的probit回归在这种情况下是有限的，因为它可能忽略了必要的随机效应或数据中的非独立性。
有聚类稳健标准差的Logistic回归。这些可以调整非独立性，但不允许有随机效应。
有聚类稳健标准差的Probit回归。这些可以调整非独立性，但不允许有随机效应。

混合效应逻辑回归

下面我们使用glmer命令估计混合效应逻辑回归模型，Il6、CRP和住院时间为患者水平的连续预测因素，癌症阶段为患者水平的分类预测因素（I、II、III或IV），经验为医生水平的连续预测因素，还有DID的随机截距，医生ID。

#估计模型并将结果存储在m中
# 输出结果，固定效果之间不相关
print(m, corr = FALSE)

第一部分告诉我们，估计值是基于自适应高斯-赫米特的似然性近似。为了避免出现不收敛的警告，我们用参数control=glmerControl(optimizer="bobyqa")指定不同的优化器。

下一节给我们提供了可用于比较模型的基本信息，接着是随机效应估计值。这表示对数尺度上截距的估计变化。如果有其他随机效应，比如随机斜率，它们也会出现在这里。最上面的部分最后是观察值的总数和第2级观察值的数量。在我们的案例中，这包括病人（8,525）和医生（407）的总数。

最后一节是固定效应估计值的表格。这些估计值代表回归系数。这些是未标准化的，而且是在对数尺度上。估计值后面是它们的标准误差（SE）。系数估计的近似值可能比SEs的近似值稳定得更快。Wald检验，（frac{Estimate}{SE}），依赖于渐进理论，这里指的是当最高级别的单位大小收敛到无穷大时，这些检验将呈正态分布，并由此得出p值（鉴于真实估计值为0，获得观察估计值或更极端的概率）。

获得置信区间（CI）。我们可以使用SE来获得粗略的区间估计。

# 带有95％CI的估计表
 cbind(Est = fixef(m), LL = fixef(m) - 1.96 * se, UL = fixef(m) + 1.96 *
    se))

如果我们需要比值比而不是对数刻度上的系数，则可以对估计值和CI求幂。

多层bootstrapping（自助法）

从GLMMs进行推断是很复杂的。除了在每个层次（尤其是最高层次）有很多观测值的情况下，假设（frac{Estimate}{SE}）是正态分布可能不准确。人们提出了各种替代方法，包括蒙特卡洛模拟、贝叶斯估计和bootstrapping。每种方法的实施都可能很复杂。我们将重点讨论一个小的bootstrapping例子。

Bootstrapping是一种重抽样方法，就是利用有限的样本资料经由多次重复抽样，重新建立起足以代表母体样本分布的新样本。它决不是完美的，但它在概念上是直接易懂的，而且容易在代码中实现。一个缺点是，它对计算要求很高。对于大型数据集或复杂的模型，每个模型的运行需要几分钟，在成千上万的样本上进行估计，很容易需要几个小时或几天。在本页的例子中，我们使用了非常少的样本，但在实践中你会使用更多的样本。

对于单层次模型，我们可以实现简单的随机抽样，并进行替换，以进行bootstrapping。对于多层次数据，我们希望以与数据生成机制相同的方式重新取样。我们从最高级别开始重新取样，然后逐级向下。在我们的案例中，我们首先将从医生那里取样，然后在每个取样的医生中，我们将从他们的病人那里取样。要做到这一点，我们首先需要写一个函数，在每个层次上重新取样。

sample <- function(dat, cluvar) {
    id <- sample(cid, size =  cid * reps, replace = TRUE)
    if (replace) {
       lapply(seq_along(cid), function(i) {
            cbind( ID = i, RowID = sample( (dat[, cluvar] == recid[i]),
                size = length( (dat[, cluvar] == recid[i]) )
        })
    } else {
       lapply(seq_along(cid), function(i) {
            cbind( ID = i, RowID =  (dat[, cluvar] == recid[i]))
       )
    } )

现在，我们将重新对数据进行取样，并采取100次重复。同样在实践中，你可能会采取数千次。我们设置种子，以便我们的结果可以重复。你也很可能需要比你最终想要的更多的重复样本，因为许多样本可能不收敛，所以你不能从它们那里得到估计。

tmp <- sample(hdp, "DID", reps = 100)

接下来，我们在重新取样的数据上重新拟合模型。首先，我们存储原始模型的估计值，我们将用它作为自助模型的起始值。然后，我们建立一个有4个节点的本地集群。接下来，我们导出数据并在集群上加载。最后，我们写一个函数来拟合模型并返回估计值。对glmer()的调用被封装在try中，因为不是所有的模型都能在重新采样的数据上收敛。这样可以捕捉到错误并返回，而不是停止处理。

makeCluster(4)
clusterEvalQ(cl, require(lme4))

boot <- function(i) {
    object <- try(glmer(缓解 ~ IL6 + CRP + 癌症阶段 + 住院时间  subset = Replicate == i, family = binomial,
     if (class(object) == "try-error")
        return(object)
}

现在我们已经有了数据、本地集群和拟合函数的设置，我们准备实际进行bootstrapping了。来自所有节点的结果被汇总回一个单一的列表，存储在对象res中。一旦完成，我们就可以关闭本地集群，终止额外的R实例并释放了内存。

 parLapplyLB(cl, X = levels(data$Replicate), fun = boot)

# 关闭集群
stopCluster(cl)

现在我们有了bootstrapping法的结果，我们可以对其进行总结。首先，我们计算成功收敛的模型的数量。我们可以计算成功的平均数，以看到收敛的比例。

# 计算成功收敛的模型的比例
succ  <- sapply(res, is.numeric)
mean(succ  )

## [1] 1

接下来我们把引导结果列表转换成矩阵，然后计算每个参数的2.5和97.5百分位。最后，我们可以将结果制成表格，包括原始估计值和标准误差、平均引导估计值，以及bootstrap 的置信区间。

# 合并成功的结果
 do.call(cbind, res[success])

# 计算出95%CI的2.5和97.5百分位数。
 apply( res, 1，quantile, probs = c(0.025, 0.975)

##                       2.5%     97.5%
## (Intercept)       -3.61982 -0.985404
## IL6               -0.08812 -0.029664
## CRP               -0.04897  0.006824
## 癌症阶段II     -0.60754 -0.228019
## 癌症阶段III    -1.30217 -0.754609
## 癌症阶段IV     -2.91414 -2.002643
## 住院时间      -0.21596 -0.046420
## 医生经验         0.06819  0.207223
## NewID.(Intercept)  2.03868  2.476366

# 所有结果取整输出
round( able, 3)

##                    Est    SE BootMean   2.5%  97.5%
## (Intercept)     -2.053 0.531   -2.205 -3.620 -0.985
## IL6             -0.057 0.012   -0.059 -0.088 -0.030
## CRP             -0.021 0.010   -0.022 -0.049  0.007
## 癌症阶段II   -0.414 0.076   -0.417 -0.608 -0.228
## 癌症阶段III  -1.003 0.098   -1.043 -1.302 -0.755
## 癌症阶段IV   -2.337 0.158   -2.460 -2.914 -2.003
## 住院时间    -0.121 0.034   -0.142 -0.216 -0.046
## 医生经验       0.120 0.027    0.128  0.068  0.207
## DID.(Intercept)  2.015    NA    2.263  2.039  2.476

预测的概率和绘图

这些结果很适合放在表格中或研究文本中；但是，数字的解释可能很麻烦。图形展示有助于解释，也有助于演讲。
在一个逻辑模型中，结果通常是

对数几率（也叫对数），这是线性化
指数化的对数几率，不在线性尺度上
概率

对于表格来说，人们经常呈现的是几率比。对于可视化来说，对数或概率比例是最常见的。每种方法都有一些优点和缺点。对数表很方便，因为它是线性化的，这意味着一个预测因素增加1个单位，结果就会增加一个系数单位，而且无论其他预测因素的水平如何。缺点是这个量表的可解释性不强。读者很难对对数有一个直观的理解。相反，概率是一个很好的尺度，可以直观地理解结果；但是，它们不是线性的。这意味着预测因子增加一个单位，不等于概率的恒定增加--概率的变化取决于为其他预测因子选择的值。在普通逻辑回归中，你可以保持所有预测因子不变，只改变你感兴趣的预测因子。然而，在混合效应逻辑模型中，随机效应也对结果产生影响。因此，如果你保持一切不变，那么只有当所有协变量保持不变，并且你在同一组或具有相同随机效应的一组时，结果的概率变化才是真的。

我们将探讨一个平均边际概率的例子。这比条件概率需要更多的工作，因为你必须为每一组计算单独的条件概率，然后将其平均化。

首先，让我们使用这里的符号来定义一般程序。我们通过获取并将感兴趣的特定预测因子，比如说在j列，设置为常数来创建。如果我们只关心预测器的一个值，那就是。然而，更常见的是，我们希望预测因子有一定的取值范围，以便绘制预测概率在其范围内的变化情况。我们可以通过获取预测模型的观察范围，并在该范围内均匀地抽取k个样本。例如，假设我们的预测模型的范围是5到10，我们想要6个样本，，所以每个样本将与前一个样本相隔1，它们将是. 然后我们创建不同的k个不同的Xi，其中，在每种情况下，第j列被设置为某个常数。然后我们计算：

这些是所有不同的线性预测因子。最后，我们采取，这就得到，这是原始尺度上的条件期望，在我们的例子中是概率。然后我们可以取每个的期望值，并将其与我们感兴趣的预测因子的值作对比。我们还可以绘制图表，不仅显示平均边际预测概率，而且还显示预测概率的分布。

你可能已经注意到，这些估计值中有很多变数。我们在使用时，只将我们感兴趣的预测因子保持在一个常数，这使得所有其他预测因子都能在原始数据中取值。另外，我们把留在我们的样本中，这意味着有些组的代表性比其他组要高或低。如果我们想的话，我们可以对所有的群体进行重新加权，使其具有同等的权重。在这个例子中，我们选择让所有这些东西保持原样，是基于这样的假设：我们的样本确实是我们感兴趣的人群的良好代表。我们没有试图挑选有意义的值来保持协变量（，而是使用了我们样本的值。这也表明，如果我们的样本能很好地代表总体，那么平均边际预测概率就能很好地代表我们总体中新的随机样本的概率。

现在我们有了一些背景和理论，我们看看如何实际去计算这些东西。我们得到一个住院时间（我们感兴趣的预测因子）的摘要，然后在其范围内得到100个值，用于预测。我们复制一份数据，这样我们就可以固定其中一个预测因子的值，然后使用预测函数来计算预测值。默认情况下，所有的随机效应都被包括在内。

 
# 计算预测的概率并存储在列表中
 lapply(jvalues, function(j) {
    predict(m, newdata = tmpdat, type = "response")

现在我们有了所有的预测概率，可以可视化它们。例如，我们可以看一下少数不同停留时间的平均边际预测概率。

#几种不同时间的平均边际预测概率

 t(sapply(pp, function(x) {
    c(M = mean(x), quantile(x, c(0.25, 0.75)))
 

# 加入时间的数值并转换为数据框
  as.data.frame(cbind(plotdat,  values))

# 显示前几行
head(plotdat

# 绘制平均边际预测概率
ggplot(plotdat) + geom_line() +

我们还可以加上下限和四分位数。可以看到50%的预测概率所处的范围。

ggplot(plotdat) + geom_linerange( ) + geom_line(size = 2)

除了改变住院时间之外，我们还可以对癌症阶段的每一级做同样的平均边际预测概率。

# 计算预测的概率并存储在一个列表中
 lapply( 癌症阶段, function(stage) {

    predict(m, newdata = tmpdat, type = "response")
  })
 

# 获得每个级别的癌症阶段的所有j值的平均值和四分位数
 lapply( probs, function(X) {
 
    c(M=mean(x), quantile(x, c(.25, .75)))
 
   

# 放到一个数据框
  do.call(rbind, plotdat2)

# 添加癌症阶段
 factor(rep(levels(癌症阶段 ))

# 显示前几行数据
head(plotdat2)

# 绘制
ggplot(plotdat2 ) +
  geom_ribbon(aes(ymin = Lower, ymax = Upper, fill = 癌症阶段), alpha = .15) +

对于一个住院10天的第四期肺癌患者，其癌症得到缓解的机会看起来相当小。看起来分布也是偏斜的。我们可以检查一下仅针对该组的预测概率分布。

ggplot(  aes(Probs)) + geom_histogram() +

即使使用平方根尺度，将较低的数值拉长，它仍然是极其偏斜的。据估计，绝大多数人的病情缓解的概率不到0.1。

三层混合效应逻辑回归

我们已经深入研究了一个带有随机截距的两级逻辑模型。这是最简单的混合效应逻辑模型。现在我们要简要地看一下如何增加第三层次和随机斜率效应以及随机截距。

下面我们估计一个三层逻辑模型，医生有一个随机截距，医院有一个随机截距。在这个例子中，医生被嵌套在医院内，也就是说，每个医生属于一家而且只有一家医院。另一种情况有时被称为 "交叉分类"，意思是一个医生可能属于多家医院，比如该医生的一些病人来自A医院，另一些来自B医院。在glmer中，你不需要指定组是嵌套还是交叉分类，R可以根据数据计算出来。

# 输出没有固定效应之间相关性的mod结果
print(m3a, corr=FALSE)

输出告诉我们族（二元结果的二项式）和链接函数（logit）。接着是通常的拟合指数和随机效应的方差。在这种情况下，医生之间和医院之间的截距（在对数赔率尺度上）的变化。还显示了标准差（只是方差的平方根，而不是估计方差的标准误差）。我们还得到了每个层次上的单位的数量。最后是固定效应。

看一下条件模型的分布也是很有用的，下面我们用“毛毛虫图”来做。蓝点是带有误差条的条件模型。我们对医生和医院都是这样做的。例如，对于医生来说，我们可以看到一个有点长的右尾，即极端的正值比负值多。

lattice::dotplot( (m) ))

## $DID

## $HID

我们也可以在模型中加入随机斜率。我们只是要为 "住院时间 "增加一个随机斜率，这个斜率在不同的医生之间变化。就像在常规的R公式中一样，我们使用+运算符来 "添加 "一个效应。

# 输出没有固定效应之间相关性的mod结果
print(m3b, corr = FALSE)

## $DID

## $HID

最受欢迎的见解

1.基于R语言的lmer混合线性回归模型

2.R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

3.R语言线性混合效应模型实战案例

4.R语言线性混合效应模型实战案例2

5.R语言线性混合效应模型实战案例

6.线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样

7.R语言LME4混合效应模型研究教师的受欢迎程度

8.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

9.使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

你可能感兴趣的:(数理统计,R语言,线性模型,R语言,混合效应,逻辑回归,肺癌数据)

【PostgreSQL】【第1章】入门&安装 cherry5230 数据库专栏 postgresql 数据库
1-PostgreSQL入门&安装1.今日安排核心内容：PostgreSQL简介与适用场景PostgreSQLvsMySQL核心差异Linux环境安装（非Docker）远程连接与日志配置基本操作：用户、数据库、权限管理2.PostgreSQL介绍2.1核心特性开源协议：基于BSD/MIT协议，支持二次封装商业化。版本选择：稳定版：12.x新特性版：14.x社区活跃：版本迭代快（约3个月一次），Bu
Doris实战——拈花云科的数据中台实践吵吵叭火大数据 #Doris 数据仓库大数据
目录前言一、业务背景二、数据中台1.0—Lambda三、新架构的设计目标四、数据中台2.0—ApacheDoris4.1新架构数据流转4.2新架构收益五、新架构的落地实践5.1模型选择5.1.1Unique模型5.1.2Aggregate模型5.2资源管理5.3批量建表5.4计算实现5.4.1实时计算5.4.2准实时计算通过JavaUDF生成增量/全量数据基于Doris的大表优化DorisBork
分辨率、帧率、平均码率、视点数之间的区别与联系 Dream Algorithm 信息与通信视频编解码计算机视觉
这四项参数共同决定了视频内容的清晰度、流畅度、数据量以及3D/VR体验，但它们各自的作用和计算方式不同。以下是详细对比：1.分辨率（Resolution）定义表示视频画面的像素数量，通常以宽度×高度（如1920×1080）表示。例如：4K=3840×2160（约830万像素）16K=15360×14400（约2.2亿像素）影响✅清晰度：分辨率越高，画面越细腻（但受屏幕尺寸影响）。❌数据量：分辨率越
谷歌搜索的 AI 防守战，透露了什么新趋势？在美的苦命程序员人工智能
在AI搜索这一轮激烈竞逐中，谷歌这位“搜索一哥”正面临新旧对手的夹击：ChatGPT、Perplexity、Claude、Gemini……每一个看上去都野心勃勃、来势汹汹。但即便如此，数据显示，谷歌在全球搜索领域依然维持了89.5%的市场份额，网络访问量环比小幅增长1%。Gemini的月度用户增长更是达到了27%。这不仅是一场份额保卫战，更是谷歌对“搜索形态重塑”的深度试验。透过这场战役，我们也可
3篇5章2节：绘制临床研究中的趋势图与ROC曲线 MD分析用R探索医药数据科学信息可视化 r语言 r语言-4.2.1 数据分析趋势变化图模型性能评估
在医学统计分析与数据科学实践中，趋势图与ROC曲线不仅是可视化的“门面担当”，更是揭示数据背后规律与诊断性能的核心工具。无论是观察血压、血糖等临床指标随时间或干预手段的变化，还是评估模型的判别能力与诊断准确性，一幅设计得当的图表，往往胜过千言万语。本文围绕R语言中两个功能强大的可视化函数展开，深入剖析它们在实际科研中的应用技巧与美化策略。通过案例演示与参数讲解，你将学会如何绘制清晰、美观、信息量丰
潍柴雷沃拟登创业板募50亿，逆变器供应商古瑞瓦特再次递表港交所洞察IPO
作者：周绘出品：洞察IPO上交所&深交所新股上市3月20日-3月26日，上交所主板有1家公司上市；深交所创业板有3家公司上市。数据来源：公开信息；图表制作：洞察IPO1.宿迁联盛：主要业务为高分子材料防老化助剂及其中间体的研发、生产与销售，主要产品包括受阻胺光稳定剂、复配助剂、中间体、阻聚剂等，上市首日收涨43.98%。数据来源：公开信息；图表制作：洞察IPO1.宏源药业：主要从事有机化学原料、医
FastAPI 中，数据库模型（通常使用 SQLAlchemy 定义）和接口模型（使用 Pydantic 定义的 schemas）的差异
在FastAPI中，数据库模型（通常使用SQLAlchemy定义）和接口模型（使用Pydantic定义的schemas）虽然都用于表示数据结构，但它们有明确的职责区分。以下是它们的核心区别和协作方式：1.数据库模型(Models)位置：通常在models.py中定义技术：使用SQLAlchemyORM目的：直接映射数据库表结构，处理数据库操作特点：fromsqlalchemyimportColum
摩根士丹利：到2028年，AI投资将推动科技巨头新增1.5万亿美元债务——信贷市场如何填补这一缺口？在美的苦命程序员人工智能科技
在AI技术快速发展与全球数字化转型的推动下，AI基础设施建设正成为一项巨大的资本需求。摩根士丹利最新的报告指出，到2028年，全球数据中心建设的投资将需要接近2.9万亿美元，其中大部分资金将集中在AI计算与云基础设施的建设上。而最引人注目的是，尽管超大规模云服务商（如亚马逊AWS、微软Azure等）已将大部分资金投入到AI技术基础设施中，但依然存在1.5万亿美元的融资缺口。1️⃣全球AI基础设施的
物化书月之餮鶯
起社区的阴雨连续下了整整一周。亚洲，中国，河北，一个不起眼的小型社区，在寒流中沉寂，同时，也无法庇护那些无家可归的星火。黑豆踩着因为降雨而变得光滑的青苔石砖，三步两步跳上了墙沿，然后缓慢地行进着，在淅淅沥沥的细雨中前进着。背景里，社区的楼房重叠着被摆放，沉浸在因为气温骤降而升起的薄雾中，有时候仅有的几棵歪脖子树上传来几声鸟叫，混合着雨下落的声音被吹入骨髓的西北风带走。黑豆可能是到达了目的地，它靠着
【华为OD机试真题 Python语言】135、采样过滤 | 机试真题+思路参考+代码解析 KFickle 华为od python 华为华为OD机试真题采样过滤
文章目录一、题目题目描述输入输出样例1二、思路参考三、代码参考作者：鲨鱼狼臧个人博客首页：鲨鱼狼臧专栏介绍：2024华为OD机试真题，使用Python进行解答，专栏每篇文章都包括真题，思路参考，代码分析，思路参考超过百字，欢迎大家订阅学习一、题目题目描述在做物理实验时，为了计算物体移动的速率，通过相机等工具周期性的采样物体移动距离。由于工具故障，采样数据存在误差甚至相误的情况。需要通过一个算法过滤
Vue3 + WebSocket 穆罕周 websocket 网络协议网络
Vue3与WebSocket结合能够很好地满足实时通讯的需求。通过合理设计和管理WebSocket连接的生命周期，以及实现必要的重连逻辑和心跳检测机制，可以构建出响应迅速且稳定的实时应用。WebSocketWebSocket允许服务端主动向客户端发送数据，无需客户端发起请求，从而实现了低延迟、高效率的数据交换。它通过HTTP升级协议握手来建立持久性的连接，并使用帧（frame）的形式传输数据。Vu
足不出户在家就能赚钱的六个线上兼职平台分享给大家，电脑手机可操作氧惠佣金真的高
今天给大家分享六个正规靠谱的线上兼职副业平台，现在线上兼职已经成为越来越多人赚钱的新选择。这些平台可以提供了许多不同种类的工作，包括调查、写作、设计、数据输入等等。这些工作都可以在家中完成，同时，平台也为那些想要自由工作和拥有灵活工作时间的人提供了机会。毕竟，任何人都可以选择自己想要的工作，而不是被迫接受固定的工作时间和地点。有的平台也有助于提高人们的技能和专业知识。通过平台的研究学习，人们可以学
深入区块链技术：平台、协议与未来展望
背景简介区块链技术的兴起与发展不仅改变了金融行业的游戏规则，更在技术领域内引发了广泛的关注和探讨。本篇博文将深入探讨《PATHFINDERS》一书中关于区块链技术平台和协议、去中心化应用(dApps)、生态系统与市场、代币化以及与其他技术的协同效应等关键主题。平台与协议的前沿区块链技术的协议层和平台正不断演进，其中比特币和以太坊作为市场上的主导者，正在逐步巩固其地位。PoW（工作量证明）机制虽有其
新一轮黑产打击：上亿简历大数据公司被警方一锅端大数据的时代
近日，中国的简历大数据公司、曾获李开复旗下创新工场投资的“巧达科技”被警方一锅端，所有员工都被带走。随后，有部分员工被陆续放出。据悉，该公司被查可能缘起在没有获得授权下抓取用户简历。该公司此前曾获得天使轮、A轮和B轮融资，资方包括李开复的创新工场、中信产业基金等。有迹象显示，监管部门正在掀起对大数据灰产和黑产的新一轮打击。传公司被警方一锅端，网站已无法打开。3月23日，有网友在工商信息查询网站“天
【源码交付】一站式自助数据分析解决方案（jvs-bi）愤怒的小青春 java
简历咨询听说Java简历上写外卖，头条，商城项目没用，到底真的假的。不写这些还能写什么#简历中的项目经历要美团实习体验～❤️入职流程和体验入职先领工牌，电脑（可提前在网上申请入职电脑版本，技术岗应该是mac）还可以申请显24offer帮选个人情况:本硕末流211科班光大银行总行科技研发中心入职:总包24w最高:涨幅两三年普调一级，涨一级简历咨询听说项目写外卖，头条，商城项目没用。有一说一，真的没有
数据分析全攻略：从基础概念到实战应用的完整指南 SickeyLee 产品经理人工智能大数据信息可视化
数据分析全攻略：从基础概念到实战应用的完整指南数据分析已成为现代商业决策的核心驱动力，但很多人在面对数据时，常常陷入“不知道看什么、怎么分析、如何应用”的困境。本文将系统梳理数据分析的核心知识，从数据的本质到分析流程，从方法工具到实战指标，帮你搭建一套完整的数据分析思维框架，让数据真正为业务服务。一、数据是什么？不止于数字的“信息载体”提到数据，很多人会首先想到数字，但实际上数据的范畴远更广阔。数
数据呈现进阶：漏斗图与雷达图的实战指南 SickeyLee 信息可视化 python 数据分析
数据可视化的魅力在于，不同的图表能解锁不同的业务洞察。当你需要分析用户转化路径，或对比多维度性能差异时，基础的柱状图、折线图往往力不从心。本文将聚焦两种进阶图表——漏斗图和雷达图，详解它们的适用场景、分析逻辑和实战案例，帮你掌握“用图表解决复杂问题”的技能。一、漏斗图：追踪转化路径，定位流失“重灾区”漏斗图以“上宽下窄”的形状，直观展示了用户在固定流程中的转化与流失情况。它就像业务流程的“X光片”
10、区块链技术及其应用吃瓜不吐籽595 解密《质量4.0与数字化转型》区块链比特币去中心化
区块链技术及其应用1.区块链简介区块链技术作为一种分布式账本，近年来受到了广泛关注。它不仅仅是一种技术革新，更是一种思维模式的转变。区块链的核心在于其去中心化、不可篡改和透明的特性，使得它在多个领域都有广泛的应用前景。区块链的基本概念区块链本质上是一个共享的、不可变的数字账本，记录了所有参与者之间的交易。每个区块包含了一系列交易记录，并通过加密算法与前一个区块相连，形成一条链。这种结构确保了数据的
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
Python Pandas 实践学习笔记（1）
PythonPandas教程Pandas是一个开源的、BSD许可证的Python库，为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。Python与Pandas在学术和商业领域都被广泛应用，包括金融、经济、统计学、分析等领域。在本教程中，我们将学习PythonPandas的各种特性以及如何在实践中使用它们。教程对象本教程适用于那些想要学习Pandas基础知识和各种函数的人。对于从
iOS开发者模式自带弱网测试工具 ejkhjd 随手弱网
弱网测试的思路弱网功能测试：2G/3G/4G、高延时、高丢包无网状态测试：断网功能测试、本地数据存储用户体验关注：响应时间、页面呈现、超时文案、超时重连、安全及大流量风险网络切换测试：WIFI→4G/3G/2G→网多状态切换iOS手机的开发者自带了弱网模拟工具，打开网络链接调节器（NETWORKLINKCONDITIONER）。1、准备环境，设置中调出：开发者选项（如果没有，需要真机联xcode）
防止应用调试分析IP被扫描加固实战教程咕噜企业签名分发-大圣 tcp/ip 网络协议网络
防止应用调试分析IP被扫描加固实战教程主要包括以下几个方面的措施：一、应用层面的加固措施1.确保通信加密：使用HTTPS协议进行所有网络通信，加密传输的数据，防止中间人攻击（MITM）。在Android应用中，可以通过NetworkSecurityConfiguration强制使用HTTPS。创建network_security_config.xml文件，并在AndroidManifest.xml
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
首席数据官CDO：企业数据资产的“首席架构师
一、CDO岗位的重要性解读：从数据爆炸到企业战略核心总的来说，CDO的诞生是技术、商业与监管三重驱动的结果。技术方面：21世纪初，随着互联网、移动设备和物联网（IoT）的普及，企业数据呈现爆炸式增长。传统IT部门难以兼顾基础设施运维与数据价值挖掘，企业开始意识到需要专职角色统筹数据管理，确保数据从“成本负担”变为“战略资产”。商业方面：2010年代，企业加速数字化转型，但数据孤岛、低质量数据等问题
JAVA反序列化深入学习（三）：CommonsCollections1 Neolock 漏洞原理 JAVA反序列化 java 网络安全反序列化
ApacheCommonsCollections是一个扩展了Java标准库里的Collection结构的第三方基础库，它提供了很多强有力的数据结构类型并实现了各种集合工具类。作为Apache开源项目的重要组件，被广泛运用于各种Java应用的开发。目录JAVA环境依赖版本检查依赖配置资源下载前置知识AbstractMapDecoratorTransformedMapdecoratetransform
数据可视化——折线图殇城碎梦. python基础学习 python
#导入所需要的包importmatplotlib.pyplotasplt#设置图表样式plt.style.use('seaborn-v0_8')#增强中文字体配置-添加更多系统字体确保兼容性#增强中文字体配置-优先Windows系统常用字体plt.rcParams["font.family"]=["sans-serif"]plt.rcParams["font.sans-serif"]=["SimH
C++之constexpr和常量表达式掘根 c++开发语言
常量表达式常量表达式(constexpression)是指值不会改变并且在编译过程就能得到计算结果的表达式。显然，字面值属于常量表达式，用常量表达式初始化的const对象也是常量表达式。后面将会提到，C++语言中有几种情况下是要用到常量表达式的。一个对象(或表达式)是不是常量表达式由它的数据类型和初始值共同决定，例如：constintmax_files=20;//max_files是常量表达式co
网络大提速，RDMA，IB，iWrap 数据存储张存储技术从入门到精通 php 服务器开发语言
本章第一节介绍的存储设备方面的创新解决了CPU访问存储设备的性能问题。但在实际的业务当中，数据的传输除了在节点内部的CPU与存储设备间外，节点之间也存在数据传输的需求。本节我们就介绍在网络传输方面是如何提速的。在介绍新的网络技术之前，我们看看传统网络是如何传输数据的，比如我们常见的以太网。当节点0向节点1发送数据时，其整个数据处理的流程如下图所示，可以看到其过程还是比较复杂的。在节点0，应用程序首
数据呈现高阶技巧：散点图与桑基图的独特价值
在数据可视化的工具箱中，有些图表看似小众，却能解决特定场景的分析难题。当你需要探索两个变量的关联，或追踪复杂的流量路径时，散点图和桑基图会成为强大的武器。本文将深入解析这两种图表的适用场景、分析逻辑和实战案例，帮你突破传统图表的局限，挖掘更深入的业务洞察。一、散点图：探索变量关系，发现群体特征散点图的核心价值在于展示大样本中两个变量的分布关系。它不像柱状图那样聚焦分类对比，也不像折线图那样追踪时间
实时数据可视化的“心跳”设计：毫秒级延迟下的动态图表抗闪烁优化方案大美工控设计师信息可视化数据分析数据挖掘
内容摘要在实时数据可视化中，动态图表的抗闪烁优化是一个关键问题。毫秒级的数据更新频率虽然能提供极高的实时性，但也容易导致图表闪烁，严重影响用户体验。这种闪烁不仅让人眼花缭乱，还可能掩盖重要的数据变化。那么，如何在保持毫秒级更新的同时，有效减少图表闪烁呢？本文将深入探讨动态图表抗闪烁的优化方案，从技术原理到实际应用，为你揭示如何打造平滑、流畅的实时数据可视化效果。第一章：实时数据可视化的“心跳”现象
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri