桓峰基因

Topic 15. 临床预测模型之决策曲线 (DCA)

点击关注，桓峰基因

桓峰基因

前言

DCA (Decision Curve Analysis) 是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如：敏感性，特异性和ROC曲线下面积仅测量预测模型的诊断准确性，未能考虑特定模型的临床效用，而 DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要，在临床分析中的应用日益广泛。

2006年，MSKCC（纪念斯隆凯特琳癌症研究所）的AndrewVickers博士等人研究出另一种评价方法，叫决策曲线分析法（Decision Curve Analysis，DCA）。相对于二战时期诞生的ROC曲线，DCA还很年轻，也一直在完善之中，不过2012-2020年间，Ann InternMed.、JAMA、BMJ、J Clin Oncol等杂志都已陆续发文，推荐使用决策曲线分析法。

我们在pubmed 中搜索一篇文章，结直肠癌预测临床转移的概率，这篇文章 IF 26分，利用Lasso 回归筛选变量，并且构建模型。

我们看到其中就是分析了模型的DCA决策曲线，可见，模型评估的一些分析在建模类文章中是必不可少的一部分，所以学会了这类文章不用愁，如下：

我们发现临床模型预测之后的评估都需要做决策曲线，基本上临床类分析还是需要做一下，我们看到pubmed上的文章基本上都有，如下：

DCA算法原理

我们先来理解简单的几个概念，只有理解了这些专有词汇，才能够把大数据分析与临床的实际应用结合起来，毕竟发文章只是一种展示科学的一种方式，更高的目标是实施到临床中，挽救更多人的性命，这是一种使命，也是一种责任吧。看定义，如下：

P：给真阳性患者施加干预的受益值（比如用某生化指标预测某患者有癌症，实际也有，予活检，达到了确诊的目的）；

L：给假阳性患者施加干预的损失值（比如预测有癌症，给做了活检，原来只是个增生，白白受了一刀）；

Pi：患者i有癌症的概率，当Pi > Pt时为阳性，给予干预。

所以较为合理的干预的时机是，当且仅当Pi × P >(1 – Pi) × L，即预期的受益高于预期的损失。推导一下可得，Pi > L / ( P + L )即为合理的干预时机，于是把L / ( P + L )定义为Pi的阈值，即Pt。

但对二元的预测指标来说，如果结果是阳性，则强制Pi=1，阴性则Pi = 0。这样，二元和其他类型的指标就有了可比性。

然后我们还可用这些参数来定义真阳性（A）、假阳性（B）、假阴性（C）、真阴性（D），即：

A：Pi ≥ Pt，实际患病；

B：Pi ≥ Pt，实际不患病；

C：Pi < Pt，实际患病；

D：Pi < Pt，实际不患病。

我们有一个随机抽样的样本，A、B、C、D分别为这四类个体在样本中的比例，则A+B+C+D = 1。那么，患病率（π）就是A + C了。

实例解析

我们这里使用三种方法实现决策曲线的绘制，无论方法有几种，最终的结果应该是一致的，这里调用 rmda 和 ggDCA 两个程序包来实现，过程非常详细，仔细运行代码，总会实现的，我发现好多同学都是卡在数据读取，调取，整理数据上，后期也会增加一些此类方法的总结。

1. 软件安装

主要是讲解rmda 和 ggDCA软件包的使用，附加还有rms和caret，程序包安装并加载，这里要注意一下ggDCA安装的时候需要通过git进行安装，否则后面做生存模型时就会不停的报错，如下：

Error in findrow(fit, times, extend) : no points selected for one or more curves, consider using the extend argument

if (!require(rmda)) {
    install.packages("rmda")
}
## Warning: 程辑包'rmda'是用R版本4.1.3 来建造的

if (!require(ggDCA)) {
    devtools::install_github("yikeshu0611/ggDCA")
}
if (!require(rms)) {
    install.packages("rms")
}
if (!require(caret)) {
    install.packages("caret")
}
library(rmda)
library(ggDCA)
library(ggplot2)
library(rms)
library(caret)

2. DCA 曲线绘制

1. plot_decision_curve {rmda}

a.数据读取

我们仍然采用软件包自带的肺癌数据库 NCCTG Lung Cancer Data 作为输入数据，如下：

data(dcaData)
head(dcaData)
## # A tibble: 6 x 6
##     Age Female Smokes Marker1  Marker2 Cancer
##                
## 1    33      1 FALSE    0.245  1.02         0
## 2    29      1 FALSE    0.943 -0.256        0
## 3    28      1 FALSE    0.774  0.332        0
## 4    27      0 FALSE    0.406 -0.00569      0
## 5    23      1 FALSE    0.508  0.208        0
## 6    35      1 FALSE    0.186  1.41         0

b. 模型构建

rmda 软件包自带模型构建函数decision_curve ，构建Logistic 回归模型，

Description

This function calculates decision curves, which are estimates of the standardized net benefit by the probability threshold used to categorize observations as ‘high risk.’ Curves can be estimated using data from an observational cohort (default), or from case-control studies when an estimate of the population outcome prevalence is available. Confidence intervals calculated using the bootstrap are calculated as well.

我们再看下整个函数合适分析哪种模型，很明显，因变量为二分类的数据，1为case，0为controls的数据才可以使用，自变量属性可以是多样性的。

formula | an object of class ‘formula’ of the form outcome ~ predictors, giving the prediction model to be fitted using glm. The outcome must be a binary variable thatequals ‘1’ for cases and ‘0’ for controls.

我们根据数据情况，构建一个基本的二分类模型，如下：

set.seed(123)
baseline.model <- decision_curve(Cancer ~ Age + Female + Smokes, data = dcaData,
    thresholds = seq(0, 0.4, by = 0.005), bootstraps = 10)

c.DCA曲线绘制

单个模型绘制DCA决策曲线，如下：

plot_decision_curve(baseline.model,  
                    curve.names = "Baseline Model",
                    cost.benefit.axis =FALSE,
                    #col= c('red','blue'),
                    confidence.intervals=FALSE,
                    standardize = FALSE)

Figure 1: Decision Curve Analysis of Baseline Model

在构造一个全变量模型，及将其他剩余的变量都加入模型中，构建预测模型并做图，如下：

set.seed(123)
full.model <- decision_curve(Cancer~Age + Female + Smokes + Marker1 + Marker2,
                             data = dcaData,
                             thresholds = seq(0, .4, by = .005),
                             bootstraps = 10)
plot_decision_curve(full.model,  
                    curve.names = "Full Model",
                    cost.benefit.axis =FALSE,
                    #col= c('red','blue'),
                    confidence.intervals=FALSE,
                    standardize = FALSE)

Figure 2: Decision Curve Analysis of Full Model

d.多模型同图

那么我们需要将两个构建好的模型放在一张图上，以此来比较两个模型的性能，如下：

plot_decision_curve(list(baseline.model, full.model), curve.names = c("Baseline model",
    "Full model"), col = c("blue", "red"), lty = c(1, 2), lwd = c(3, 2, 2, 1), legend.position = "bottomright")

‍

‍p‍‍

Figure 3: Decision Curve Analysis of two Models

我们不需要那么复杂，只需要显示两个模型的预测曲线即可，如下：

plot_decision_curve( list(baseline.model, full.model),
                    curve.names = c("Baseline model", "Full model"),
                    col = c("blue", "red"),
                    confidence.intervals = FALSE,  #remove confidence intervals
                    cost.benefit.axis = FALSE, #remove cost benefit axis
                    legend.position = "topright") #add the legend

Figure 4: Decision Curve Analysis of Two Models

2. dca {ggDCA}

a.数据读取

我们调取ggDCA程序包里面数据，为肝癌数据，并且里面含有四个关键基因(ANLN，CENPA，GPR182，BCO2及生存信息(结局变量(status)，生存时间(time))，共232个患者，我们利用这套数据构建 Cox 回归模型，并绘制DCA决策曲线。

ICGC Liver Data from Japan

Description

This data is a liver cancer data from Japan Data released in ICGC database (Link). It cantains time, event and four genes.

Format

An object of class data.frame with 232 rows and 6 columns.

将数据切分成测试集和验证集，以方便我们做验证，如下：

data(LIRI)
head(LIRI)
##        time status      ANLN     CENPA     GPR182      BCO2
## 1 3.0410959      1  6.821354 3.0366550 0.00000000 0.2248344
## 2 2.5479452      0  1.073527 0.4654169 0.17895040 5.8924860
## 3 4.0273973      0  2.579530 0.7732644 0.06809686 3.5994330
## 4 0.1643836      1 14.183630 7.7239000 0.03749626 1.1194870
## 5 0.8219178      0  3.588320 2.3237710 0.16762610 2.6660850
## 6 2.8767123      0  6.079665 3.6674980 0.21788230 0.7691067
ddist <- datadist(LIRI)  ###打包数据
options(datadist = "ddist")

b.模型构建

程序包ggDCA 中dca可以单个或多个模型的DCA曲线绘制，模型对象包括四个：

coxph (Cox 比例风险回归模型,Fit Proportional Hazards Regression Model)
cph (Cox 比例风险回归模型,Cox Proportional Hazards Model and Extensions)
glm (广义线型模型,Fitting Generalized Linear Models）
lrm (逻辑回归模型,Logistic Regression Model)

同时还可以设置不同时期的预测效果，也可以在验证集里面进行验证。

one or more results of logistic or cox regression

c.DCA绘制

构建Logistic回归模型

根据不同情况，添加变量即为基因的个数，构建四个不同变量的Logistic 回归模型。

构建4个logstic模型lrm1,lrm2,lrm3,lrm4,模型的变量一次递加基因个数，如下：

lrm1 <- lrm(status ~ ANLN, LIRI)
lrm2 <- lrm(status ~ ANLN + CENPA, LIRI)
lrm3 <- lrm(status ~ ANLN + CENPA + GPR182, LIRI)
lrm4 <- lrm(status ~ ANLN + CENPA + GPR182 + BCO2, LIRI)

我们看一下结果，包括阈值，真阳性，假阳性，净收益，模型名称，如下：

dca_lrm <- dca(lrm1, lrm2, lrm3, lrm4, model.names = c("ANLN", "ANLN+CENPA", "ANLN+CENPA+GPR182",
    "ANLN+CENPA+GPR182+BCO2"))
head(dca_lrm)
##   thresholds       TPR       FPR        NB model
## 1 0.07825978 0.1853448 0.8146552 0.1161770  ANLN
## 2 0.08070249 0.1853448 0.8103448 0.1142070  ANLN
## 3 0.08080998 0.1853448 0.8060345 0.1144828  ANLN
## 4 0.08132494 0.1810345 0.8060345 0.1096810  ANLN
## 5 0.08191934 0.1810345 0.8017241 0.1094975  ANLN
## 6 0.08240994 0.1810345 0.7974138 0.1094177  ANLN

绘制DCA曲线，如下：

ggplot(dca_lrm, lwd = 0.5)

Figure 5: Decision Curve Analysis of Multi Logistic Models

构建Cox回归模型

根据不同情况，添加变量即为基因的个数，构建四个不同变量的Cox回归模型。

构建4个Cox回归模型cph1,cph2,cph3,cph4,模型的变量一次递加基因个数，如下：

cph1 <- cph(Surv(time, status) ~ ANLN, LIRI)
cph2 <- cph(Surv(time, status) ~ ANLN + CENPA, LIRI)
cph3 <- cph(Surv(time, status) ~ ANLN + CENPA + GPR182, LIRI)
cph4 <- cph(Surv(time, status) ~ ANLN + CENPA + GPR182 + BCO2, LIRI)

我们看一下结果，包括阈值，真阳性，假阳性，净收益，时间，模型名称，如下：

dca_cph <- dca(cph1, cph2, cph3, cph4, model.names = c("ANLN", "ANLN+CENPA", "ANLN+CENPA+GPR182",
    "ANLN+CENPA+GPR182+BCO2"))
head(dca_cph)
##   thresholds       TPR       FPR         NB     time model
## 1 0.08642800 0.1694905 0.8305095 0.09092056 2.136986  ANLN
## 2 0.08837278 0.1696432 0.8260465 0.08956656 2.136986  ANLN
## 3 0.08845805 0.1697980 0.8215813 0.09006990 2.136986  ANLN
## 4 0.08886622 0.1654711 0.8215979 0.08533766 2.136986  ANLN
## 5 0.08933664 0.1656280 0.8171306 0.08546698 2.136986  ANLN
## 6 0.08972435 0.1657871 0.8126612 0.08568445 2.136986  ANLN


ggplot(dca_cph, lwd = 0.5)

Figure 6: Decision Curve Analysis of Multi Cox Models.

除此之外，还有关于生存Cox回归模型，我们还可以选择几种不同时间点以及在验证集中验证等都非常的方便，下面来自公众号：一棵树，于老师的分享，我这里直接借用一下。

1.单个模型，不给times赋值，默认验证中位时间

dca_cph <- dca(cph1, model.names = "ANLN")
ggplot(dca_cph)

Figure 7: Decision Curve Analysis of Single Model in the time point of median.

2.单个模型，多个时间点(生存时间的下四分位数、中位数、上四分位数)

times = round(quantile(LIRI$time, c(0.25, 0.5, 0.75)), 2)
dca_cph <- dca(cph1, model.names = "ANLN", times = times)
ggplot(dca_cph)

Figure 8: Decision Curve Analysis of Single Cox Models in different time points.

3.多个模型，同一个时间点

dca_cph <- dca(cph1, cph2, cph3, cph4, model.names = c("ANLN", "ANLN+CENPA", "ANLN+CENPA+GPR182",
    "ANLN+CENPA+GPR182+BCO2"), times = 2)
ggplot(dca_cph)

Figure 9: Decision Curve Analysis of Multi Cox Models in the same time point.

4.多个模型，多个时间点

dca_cph <- dca(cph1, cph2, cph3, cph4, model.names = c("ANLN", "ANLN+CENPA", "ANLN+CENPA+GPR182",
    "ANLN+CENPA+GPR182+BCO2"), times = c(1.5, 2, 3))
ggplot(dca_cph)

Figure 10: Decision Curve Analysis of Multi Cox Models in different times points

结果解读

DCA曲线图的横坐标为阈概率（ThresholdProbability）。当各种评价方法达到某个值时，患者i的死亡风险概率记为Pi；当Pi达某个阈值（记为Pt），就界定为阳性，采取某种干预措施。纵坐标就是利减去弊之后的净获益率。

另外还有一个包 dcurves同样可以绘制DCA曲线图，但是个人感觉有点复杂，所以就没推荐，感觉这些足以满足需求。不知道大家看懂了没，仔细推敲还是很好理解，关注公众号，桓峰基因，每天更新不停歇！

References:

Vickers AJ, Elkin EB. Decision curve analysis: a novel method for evaluating prediction models. Med Decis Making. 2006;26(6):565-574.
Vickers AJ, van Calster B, Steyerberg EW. A simple, step-by-step guide to interpreting decision curve analysis. Diagn Progn Res. 2019;3:18. Published 2019 Oct 4.
Van Calster B, Wynants L, Verbeek JFM, et al. Reporting and Interpreting Decision Curve Analysis: A Guide for Investigators.Eur Urol. 2018;74(6):796-804.

leetcode(力扣) 594. 最长和谐子序列 (伪滑动窗口法）（哈希表法）深度不学习！！个人笔记交流学习 leetcode python
题目链接：https://leetcode-cn.com/problems/longest-harmonious-subsequence/题目分析：题目中说可以通过删除一些元素或不删除元素、且不改变其余元素的顺序而得到。说到不改变其他元素的顺序，但是答案最终返回的是数组的长度，并且可以删除或者不删除其中的一些元素，那么就可以无视顺序进行操作。法一（伪滑动窗口）：首先对数组进行排序。设置两个指针维护
python多线程：自定义线程类实现线程体、多线程锁机制、死锁问题的解决网小鱼的学习笔记 Python python 开发语言
自定义线程类实现线程体其实threading.Thread是threading模块内的一个类，我们可以自行设计一个类，让这个类继承threading.Thread类，接着在def_init_()内调用threading_Thread_init()方法，然后再所设计的类类别设计run方法，这个概念就称为自定义线程。自定义线程类实现线程体importthreadingimporttime#自定义子线程
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
插入排序解析老一岁算法数据结构排序算法
可以将插入排序类比为整理扑克牌的过程：左手持已排序的牌（初始为空）右手从桌上未排序的牌堆中逐张取牌将取到的牌插入左手正确位置最终左手持完全有序的牌前言一、算法工作原理插入排序是一种基于比较的简单排序算法，其核心思想是逐步构建有序序列。算法将待排序数组视为两个部分：已排序部分（初始时仅包含第一个元素）和未排序部分。通过不断从未排序部分取出元素，在已排序部分中找到适当位置插入，最终完成整个数组的排序。
PyTorch 中 nn.Linear() 参数详解与实战解析（gpt）草莓奶忻深度学习 pytorch gpt 人工智能
PyTorch中nn.Linear()参数详解与实战解析在使用PyTorch构建神经网络时，nn.Linear()是最常用也最基础的模块之一。它用于实现一个全连接层（FullyConnectedLayer），本质上就是对输入进行一次线性变换：y=xAT+by=xA^T+by=xAT+b本文将详细介绍nn.Linear()的参数含义、属性说明、初始化机制，并结合实际代码案例帮助你真正理解它的工作原理
Delphi串行通信组件TComPort8_VCL的实战应用柴犬小管家
本文还有配套的精品资源，点击获取简介：TComPort8是一个专为Delphi开发环境设计的VCL组件，简化了串行端口数据传输和通信的处理。它支持串口的打开/关闭、设置通信参数、读写操作、错误检测与处理、事件驱动编程以及线程安全等关键功能。TComPort8为开发者提供了易于使用的API和事件驱动模型，使开发者能够快速构建串行通信应用，并通过Delphi的VCL提供的图形化界面设计工具，创建直观的
Python简单理解1-10阶乘和运算小张不嚣张꒰ঌ(˚ᆺ˚)໒꒱ Python爬虫基础集合 python 后端
简单理解for循环实现1-10的阶乘运算基本思路;首先分析阶乘的关系如1!=12!=2*1=23!=3*2*1=64!=4*3*2*1=245!=5*4*3*2*1=120....10!=10*9*8*7*6*5*4*3*2*1=3628800自2以后的阶乘都是前面数的阶乘再乘以本身的数。如4的阶乘4!=43!(32*1),因此我们可以使用for循环来执行代码，定义一个变量啊a和一个总和sum然后
python实现回文数的判断简单理解
回文数的判断及解析第一种方法：第二种方法：回文数：简单来说就是，无论是从前往后读还是从后往前读，都是一样的第一种方法：通过字符串的一些特定的功能来判断是不是回文数a=str(input("请输入你要输入的数字:"))#输入字符串b=a[::-1]#倒序输出ifa==b:#判断是否相等print(f'{a}是回文数')else:print('{}不是回文数'.format(a))#format方法输
Cookie：Web 开发中的身份认证与数据存储利器前端小巷子网络相关前端服务器网络面试开发语言
在Web开发中，Cookie是一个不可或缺的概念。它不仅用于身份认证，还用于存储用户偏好设置、会话信息等。本文将详细介绍Cookie的原理、组成、设置方法以及在实际开发中的应用。一、什么是Cookie？Cookie是一种存储在用户浏览器中的小型文本文件，用于存储用户会话信息。每个Cookie都有一个名称和一个值，通常由服务器在响应中设置，并由浏览器存储在用户的设备上。Cookie的主要用途是跟踪用
软件开发架构设计全流程解析你一身傲骨怎能输架构设计架构
文章摘要本文系统地介绍了软件架构设计的流程。架构设计是软件开发的关键环节，决定了系统的结构、性能和可维护性。完整的流程包括需求分析、现状调研、目标制定、风格选择、模块划分、组件设计、技术选型、非功能性设计、评审优化、文档输出、原型验证和持续优化等12个步骤。这是一个需要多方协作的迭代过程，既要满足当前需求，也要为未来扩展和维护做好准备。每个阶段都至关重要，共同构成了科学合理的架构设计方法论。架构设
record 7035通话与录音都会死机问题原因以及解决方法
record7035通话与录音都会死机问题原因以及解决方法17035配置27036配置原因选择opus编解码后通话会死机。2采用配置basic解决3但是录音只有嘶嘶声没有人声问题是自己的开发板MIC线路没有短接导致，现在OK编译指令使用./build.sh--chip=7035AX-B--version=1.2.3.3-r-fdefconfig.basic./build.sh--chip=7035
Flask + GPT 实践红鼻子时代 flask项目 flask gpt python
一、前言本篇文章会介绍从零开始构建一个基于Flask+GPT的小项目的过程。总共有四个版本的迭代，包括：1、调用GPT接口并渲染到前端页面；2、使用Flask提供的session来实现登录和登出功能；3、用SQLAlchemy管理数据库，实现用户注册和登录；4、记录和分页查看用户与GPT的对话历史。二、项目环境与依赖Python版本：建议3.7+Flask：最常用的PythonWeb框架之一ope
【C#】两个list根据某个元素比较差集 weixin_30594001 c#
1.今天突然跟前端有一点小小的分歧，传输数据和数据库里的数据做比对，该前端做处理还是后端，(并不是都不愿意做，相反，都愿意在自己那端处理==)2.最后终于归结我这了，好久之前做过list比对，记得刚写代码的时候，两个list比对？那就无限foreach呗，当然实现是能实现，这就很影响比对效果和代码的整洁度了。3.接下来，我回忆起来了我之前写过的一个比较方法，拿出来记录一下//重写比较方法publi
高效比较两个list中不同的元素 tanghuan0827 java javaapi
第四种方法，将其中一个list转为map,并通过containsKey()方法比较，用在单元测试，读取dbf文件到redis队列，测试redis和dbf的是否相同packagecom.test;importjava.util.ArrayList;importjava.util.HashMap;importjava.util.List;publicclassTest{publicstaticvoid
SQL server 一个字段为yymmdd+3位序号修改为yymm加4位序号的方法海天胜景数据库
在SQLServer中，如果你想要修改一个字段的格式，使其从原来的yymmdd+3位序号改为yymm+4位序号，你可以使用UPDATE语句结合CONVERT或FORMAT函数来实现这个目的。这里有两种常见的场景：场景1：如果原始数据存储为字符串格式假设你有一个表your_table，其中有一个字段your_column存储的是yymmdd+3位序号的格式，例如230415001。你可以使用以下SQ
2025年全球数据安全发展趋势 jinan886 人工智能大数据安全数据分析
随着云计算、大数据、人工智能等技术的迅猛发展，数据已成为驱动经济社会发展的关键生产要素。然而，数据泄露、网络攻击等安全事件频发，给个人隐私、企业利益乃至国家安全带来了前所未有的挑战。全球数据安全发展趋势正随着技术进步和威胁演变而不断变化，以下是主要趋势：1.数据隐私法规加强GDPR（欧盟《通用数据保护条例）和CCPA（加州消费者隐私法案）等法规推动了全球对数据隐私的重视，更多国家和地区正在制定或更
堆排序实现及复杂度分析 hixiaoyang 算法排序算法数据结构
一、算法概述堆排序(HeapSort)是一种基于二叉堆数据结构的比较排序算法。它利用了堆这种数据结构的特性：最大堆：每个节点的值都大于或等于其子节点的值最小堆：每个节点的值都小于或等于其子节点的值堆排序是不稳定排序算法，时间复杂度为O(nlogn)，空间复杂度为O(1)二、算法步骤1.构建初始堆将无序数组构建成一个最大堆（升序排序时）2.交换与调整将堆顶元素（最大值）与末尾元素交换缩小堆的范围，重
Web3.0 技术应用溯源系统建设天机️灵韵区块链区块链 web3.0
Web3.0技术与溯源（TrackandTrace）的结合，是区块链等去中心化技术在实际应用中的典型场景之一。通过Web3.0的底层技术，可以构建透明、不可篡改且可验证的溯源系统，解决传统供应链、商品流通等领域的数据信任问题。以下是两者的深度关联与具体应用：一、Web3.0如何赋能溯源？区块链的不可篡改性核心机制：区块链通过哈希链、共识算法（如PoW/PoS）确保数据一旦上链，无法被单一方修改或删
使用Chaindesk进行简单高效的文档检索 2501_92325368 langchain
##技术背景介绍Chaindesk是一个开源的文档检索平台，它帮助将个人数据与大型语言模型结合起来，实现高效的信息搜索和数据分析。Chaindesk的核心功能是通过创建数据存储库(datastore)并与大型语言模型进行交互，以提供快捷准确的文档检索能力。##核心原理解析Chaindesk通过一种称为Retriever的组件实现数据检索。Retriever可以与不同的数据存储库进行交互，拉取相关文
数据库连接池优化深度解析后端
在Java企业级应用中，数据库连接池作为数据库访问的核心组件，其性能直接影响系统的整体吞吐量与稳定性。本文从连接池核心参数、性能调优策略、监控与故障诊断及面试高频问题四个维度，结合主流连接池实现（HikariCP、Druid）与工程实践，系统解析数据库连接池的优化方法与最佳实践。一、连接池核心原理与关键参数1.1连接池工作流程1.2关键参数解析（以HikariCP为例）参数作用推荐值maximum
Oracle应急处理：Oracle RAC 集群节点进程通信出现报错
小亦平台会持续给大家科普一些Oracle数据库的应急处理方案，运维朋友们可以在往期文章中查看更多案例。问题概述•核心问题：监控日志中出现IPCSENDTimeout错误。•主要现象：RAC集群监控日志中报告了Inter-ProcessCommunication(IPC)发送超时错误。问题分析IPCSENDTimeout错误通常表明OracleRAC集群中节点间进程通信（IPC）出现了问题。IPC是
c# 比较两个list 之间元素差异海天胜景 c#list 开发语言
在C#中，比较两个List之间元素的差异通常有多种方法，具体取决于你想如何表达这些差异（例如，找出存在于一个列表中但不在另一个列表中的元素）。下面是一些常用的方法：1.使用Except方法Except方法可以找出存在于第一个列表中但不在第二个列表中的所有元素。Listlist1=newList{1,2,3,4,5};Listlist2=newList{4,5,6,7,8};//找出存在于list1
Spring Security 鉴权与授权详解（前后端分离项目）
前言在现代Web开发中，前后端分离架构已经成为主流。后端专注于提供RESTfulAPI，而前端通过AJAX请求与后端交互。在这种架构下，如何对用户进行认证（Authentication）和授权（Authorization）成为了系统设计中的核心问题。SpringSecurity是Spring框架中用于构建安全系统的模块，它不仅提供了强大的安全机制，还支持灵活的自定义配置。本文将围绕鉴权失败和成功时
Arduino ESP8266 – ESP8266WiFiGeneric API库函数介绍 perseverance52 嵌入式开发笔记 esp8266 Arduino
ESP8266–ESP8266WiFiGenericAPI库函数介绍ESP8266WiFiGeneric-API库函数介绍ESP8266WiFiSTAClass、ESP8266WiFiScanClass、ESP8266WiFiAPClass可以访问ESP8266WiFiGenericClass的private和protected成员.整体上来说，方法可以分为两类：第一类方法，管理WIFi事件（Wi
AI原生应用监控：实时领域偏见预警系统设计原理 Agentic AI人工智能与大数据 CSDN AI-native 人工智能 ai
AI原生应用监控：实时领域偏见预警系统设计原理关键词AI监控、算法偏见、实时预警、公平性AI、模型监控、偏见检测、AI治理摘要在人工智能驱动决策日益普及的今天，AI系统中的隐性偏见已成为影响公平性、可信度和业务连续性的关键风险。本文深入探讨了AI原生应用监控的核心挑战，重点剖析了实时领域偏见预警系统的设计原理与实现方法。通过将复杂的算法偏见比作"数字世界的隐形滤镜"，我们揭示了偏见如何在AI系统中
《5G网络切片诊断技术：性能指标关联分析与故障溯源》团结湖到了笔记
1.研究背景与问题5G网络通过网络切片技术实现多业务场景（如eMBB、uRLLC、mMTC）的隔离与定制化服务。但切片间资源抢占、跨层协议异常（如NR-RAN与核心网接口故障）等问题，常导致切片性能劣化（如时延突增、吞吐量骤降）。传统网络诊断方法难以适应切片的动态拓扑与多维度性能指标（如用户面时延、控制面信令成功率），亟需构建面向切片的智能诊断体系，解决“指标异常-故障根源”的关联分析与快速溯源问
【软考高项论文】论信息系统项目的沟通管理 _Richard_ 软考高项论文软考高项软考高级信息系统项目管理师
摘要信息系统项目的沟通管理是项目成功的关键因素之一。本文结合实际项目，阐述了对信息系统项目沟通管理的认识，包括项目沟通管理的过程、输入和输出，以及如何拟定沟通管理计划。同时，详细介绍了在项目中灵活应用沟通方法与不同干系人进行有效沟通的具体做法，并分享了心得体会。通过有效的沟通管理，能够确保信息准确传递，减少误解和冲突，提高项目执行效率和客户满意度。正文在当今数字化时代，信息系统项目日益复杂，涉及众
高效沟通专栏--组织运转的命脉与个人成功的基石古城码农工作记实录高效沟通沟通模型沟通案例
高效沟通：组织运转的命脉与个人成功的基石高效沟通01-沟通模型高效沟通02-SCQA表达模型在信息爆炸、协作日益紧密的时代，高效沟通已远非锦上添花的技能，而是维系组织活力、驱动项目成功、构建信任关系的核心命脉。它意味着信息能够在发送者与接收者之间实现精准、及时、完整且意图清晰的传递与理解。高效沟通的价值在于：它能显著减少误解与冲突，避免因歧义导致的返工和资源浪费；它能极大提升决策速度与
Mac电脑医学绘图 Graphpad Prism 2501_92604878 macos mac 医学绘图
GraphPadPrismMac是一款功能强大、易于使用的科学和统计分析工具，适用于各种类型的数据处理和可视化需求。无论您是进行基础研究、临床试验还是学术写作，GraphPadPrismMac都能为您短时间内做出最合适的分析选择，并优雅地绘制和展示您的作品。原文地址：GraphpadPrismMac医学绘图
Python的GUI库选择指南（深度拓展）
前文我们分析了python的GUI库，有很多，面向应用场景也不尽相同，如何在使用过程中，选择合适的GUI库呢？可以查看：python有哪些常用的GUI（图形用户界面）库及选择指南-CSDN博客初学者推荐：Tkinter或PySimpleGUI，简单易学，文档丰富。复杂应用：PyQt5或WxPython，提供完整的功能集和高级组件。移动应用：Kivy或BeeWare（Toga），支持跨平台部署到iO
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

Topic 15. 临床预测模型之决策曲线 (DCA)

DCA算法原理

实例解析

1. 软件安装

2. DCA 曲线绘制

1. plot_decision_curve {rmda}

a.数据读取

b. 模型构建

Description

c.DCA曲线绘制

d.多模型同图

2. dca {ggDCA}

a.数据读取

ICGC Liver Data from Japan

Description

b.模型构建

c.DCA绘制

构建Logistic回归模型

构建Cox回归模型

结果解读

另外还有一个包 dcurves同样可以绘制DCA曲线图，但是个人感觉有点复杂，所以就没推荐，感觉这些足以满足需求。不知道大家看懂了没，仔细推敲还是很好理解，关注公众号，桓峰基因，每天更新不停歇！

References:

你可能感兴趣的:(RNA数据分析,临床预测模型构建统计学分析方法,人工智能,数据分析,数据挖掘)