kidxu

R源代码研究——逻辑回归logistic regression

概述

R中逻辑回归用过很多次了，最近突然想对其源代码探究一二，以便更好理解该算法。此文章记录了R中逻辑回归的源代码的研究理解，如果有任何问题或错误欢迎各位读者提出。

建议：此篇文章主要以介绍代码实现为重点，会穿插理论知识。建议读者可以先大致了解逻辑回归理论再读此文。

R中实现逻辑回归可以通过调用glm函数实现，R中对该函数的使用方法及描述如下:

glm(formula, family = gaussian, data, weights, subset,
    na.action, start = NULL, etastart, mustart, offset,
    control = list(...), model = TRUE, method = "glm.fit",
    x = FALSE, y = TRUE, contrasts = NULL, ...)

glm is used to fit generalized linear models, specified by giving a symbolic description of the linear predictor and a description of the error distribution.

可见glm函数实际是用于广义线性模型的拟合，通过指定参数可以实现逻辑回归（实际逻辑回归属于广义线性回归的一种），简单介绍一下广义线性回归：

$g(y)=\boldsymbol{\beta}^\text{T}\cdot \boldsymbol{x}$

其中g(y)称为链接函数link function。其中逻辑回归的link function为

$g(y)=ln(\frac{y}{1-y})$

样例

以下是一个实现逻辑回归的代码样例，family = binomial(link = "logit) 即为指定link function的语句。先不考虑其他参数，通过这个简单的例子来研究其实现原理。

fit <- glm(label ~., family = binomial(link="logit"), data= train.yx,
           control = list(maxit = 5000, epsilon = 0.00000001))

`family`	character: the family name.
`link`	character: the link name.
`linkfun`	function: the link.
`linkinv`	function: the inverse of the link function.
`variance`	function: the variance as a function of the mean.
`dev.resids`	function giving the deviance residuals as a function of `(y, mu, wt)`.
`aic`	function giving the AIC value if appropriate (but `NA` for the quasi- families). See `logLik` for the assumptions made about the dispersion parameter.
`mu.eta`	function: derivative `function(eta)` dμ/dη.
`initialize`	expression. This needs to set up whatever data objects are needed for the family as well as `n` (needed for AIC in the binomial family) and `mustart` (see `glm`).
`validmu`	logical function. Returns `TRUE` if a mean vector `mu` is within the domain of `variance`.
`valideta`	logical function. Returns `TRUE` if a linear predictor `eta` is within the domain of `linkinv`.
`simulate`	(optional) function `simulate(object, nsim)` to be called by the `"lm"` method of `simulate`. It will normally return a matrix with `nsim` columns and one row for each fitted value, but it can also return a list of length `nsim`. Clearly this will be missing for ‘quasi-’ families.

debug该行代码进入glm函数，函数中赋值、传参等操作代码不讨论，主要讨论与实现相关的核心功能代码。下面这句代码意为调用“method”这个函数，后面为函数参数。R中这样介绍method参数：the method to be used in fitting the model. The default method "glm.fit" uses iteratively reweighted least squares (IWLS)。由于我们没有指定method，那么此时method即为glm.fit。注意这句话后半句说该method用iteratively reweighted least squares (IWLS)方法，也叫IRLS。这里是R中glm实现逻辑回归与一般对逻辑回归介绍不同的地方。一般书籍或文章介绍的逻辑回归求解时的cost function是对数似然函数，而glm.fit则是用IWLS方法，译为“迭代加权最小二乘法”。它与线性回归的求解方法采用的最小二乘法原理类似。

fit <- eval(call(if (is.function(method)) "method" else method, 
	x = X, y = Y, weights = weights, start = start, etastart = etastart, 
	mustart = mustart, offset = offset, family = family, 
	control = control, intercept = attr(mt, "intercept") > 0L))

glm.fit(x, y, weights = rep(1, nobs),
        start = NULL, etastart = NULL, mustart = NULL,
        offset = rep(0, nobs), family = gaussian(),
        control = list(), intercept = TRUE)

1)参数初始化

conv <- FALSE  #是否达到收敛的标志
nobs <- NROW(y) # number of objects,观测数目即样本数量
nvars <- ncol(x) # number of variables, 变量个数
weights <- rep.int(1, nobs)
offset <- rep.int(0, nobs)

2）相关函数初始化

variance <- family$variance # function (mu) mu * (1 - mu)
linkinv <- family$linkinv #the inverse of the link function.
dev.resids <- family$dev.resids
aic <- family$aic
mu.eta <- family$mu.eta
if (is.null(mustart)) {
		eval(family$initialize)
	}

初始化函数时，实际部分函数是通过调用C代码实现。如在R控制台输入family$linkinv，输出信息如下：
function (eta)
.Call(C_logit_linkinv, eta)

调用了名为C_logit_linkinv的函数，从CRAN上下载R的源代码可以在代码目录“R-3.5.2/src/library/stats/src/family.c”找到名为family.c的C代码文件，该C文件里面包含了family的部分函数定义。

函数名	解释	C文件中函数定义	数学表达式
logit_link	link function	static R_INLINE double x_d_omx(double x) { if (x < 0 \|\| x > 1) error(_("Value %g out of range (0, 1)"), x); return x/(1 - x); } static R_INLINE double x_d_opx(double x) {return x/(1 + x);} SEXP logit_link(SEXP mu) { int i, n = LENGTH(mu); SEXP ans = PROTECT(shallow_duplicate(mu)); double rans = REAL(ans), rmu=REAL(mu); if (!n \|\| !isReal(mu)) error(_("Argument %s must be a nonempty numeric vector"), "mu"); for (i = 0; i < n; i++) rans[i] = log(x_d_omx(rmu[i])); UNPROTECT(1); return ans; }	$ln(\frac{\mu}{1-\mu})$
logit_linkinv	inverse of link function	SEXP logit_linkinv(SEXP eta) { SEXP ans = PROTECT(shallow_duplicate(eta)); int i, n = LENGTH(eta); double rans = REAL(ans), reta = REAL(eta); if (!n \|\| !isReal(eta)) error(_("Argument %s must be a nonempty numeric vector"), "eta"); for (i = 0; i < n; i++) { double etai = reta[i], tmp; tmp = (etai < MTHRESH) ? DOUBLE_EPS : ((etai > THRESH) ? INVEPS : exp(etai)); rans[i] = x_d_opx(tmp); } UNPROTECT(1); return ans; }	$\frac{ e^\eta }{1+e^\eta}$
logit_mu_eta	derivative `function(eta)` dμ/dη	SEXP logit_mu_eta(SEXP eta) { SEXP ans = PROTECT(shallow_duplicate(eta)); int i, n = LENGTH(eta); double rans = REAL(ans), reta = REAL(eta); if (!n \|\| !isReal(eta)) error(_("Argument %s must be a nonempty numeric vector"), "eta"); for (i = 0; i < n; i++) { double etai = reta[i]; double opexp = 1 + exp(etai); rans[i] = (etai > THRESH \|\| etai < MTHRESH) ? DOUBLE_EPS : exp(etai)/(opexp * opexp); } UNPROTECT(1); return ans; }	$\frac{ e^\eta }{(1+e^\eta)^2}$
binomial_dev_resids		SEXP binomial_dev_resids(SEXP y, SEXP mu, SEXP wt) { int i, n = LENGTH(y), lmu = LENGTH(mu), lwt = LENGTH(wt), nprot = 1; SEXP ans; double mui, yi, rmu, ry, rwt, rans; if (!isReal(y)) {y = PROTECT(coerceVector(y, REALSXP)); nprot++;} ry = REAL(y); ans = PROTECT(shallow_duplicate(y)); rans = REAL(ans); if (!isReal(mu)) {mu = PROTECT(coerceVector(mu, REALSXP)); nprot++;} if (!isReal(wt)) {wt = PROTECT(coerceVector(wt, REALSXP)); nprot++;} rmu = REAL(mu); rwt = REAL(wt); if (lmu != n && lmu != 1) error(_("argument %s must be a numeric vector of length 1 or length %d"), "mu", n); if (lwt != n && lwt != 1) error(_("argument %s must be a numeric vector of length 1 or length %d"), "wt", n); /* Written separately to avoid an optimization bug on Solaris cc / if(lmu > 1) { for (i = 0; i < n; i++) { mui = rmu[i]; yi = ry[i]; rans[i] = 2 rwt[lwt > 1 ? i : 0] * (y_log_y(yi, mui) + y_log_y(1 - yi, 1 - mui)); } } else { mui = rmu[0]; for (i = 0; i < n; i++) { yi = ry[i]; rans[i] = 2 * rwt[lwt > 1 ? i : 0] * (y_log_y(yi, mui) + y_log_y(1 - yi, 1 - mui)); } } UNPROTECT(nprot); return ans; }	$2w_i[y_iln\frac{y_i}{\mu_i}+(1-y_i)ln\frac{1-y_i}{1-\mu_i}]$

初始化参数：mustart

# family$initialize: expression, not function

    if (NCOL(y) == 1) {
        if (is.factor(y)) 
            y <- y != levels(y)[1L]
        n <- rep.int(1, nobs)
        y[weights == 0] <- 0
        if (any(y < 0 | y > 1)) 
            stop("y values must be 0 <= y <= 1")
        mustart <- (weights * y + 0.5)/(weights + 1) # 求y与0.5的加权平均，二者的权重分别为weights、1
        m <- weights * y
        if (any(abs(m - round(m)) > 0.001)) 
            warning("non-integer #successes in a binomial glm!") #暂时不知道此处是何意，望知道者告知
    }
    else if (NCOL(y) == 2) { # 先不管此种情况
        if (any(abs(y - round(y)) > 0.001)) 
            warning("non-integer counts in a binomial glm!")
        n <- y[, 1] + y[, 2]
        y <- ifelse(n == 0, 0, y[, 1]/n)
        weights <- weights * n
        mustart <- (n * y + 0.5)/(n + 1)
    }
    else stop("for the 'binomial' family, y must be a vector of 0 and 1's\nor a 2 column matrix where col 1 is no. successes and col 2 is no. failures")
})

初始化参数：coefold（模型系数beta的某次迭代前的值)、eta （beta*x)

coefold <- NULL
eta <- family$linkfun(mustart)
mu <- linkinv(eta)
devold <- sum(dev.resids(y, mu, weights))
boundary <- conv <- FALSE

for (iter in 1L:control$maxit) {
			good <- weights > 0
			varmu <- variance(mu)[good]
			if (anyNA(varmu)) 
				stop("NAs in V(mu)")
			if (any(varmu == 0)) 
				stop("0s in V(mu)")
			mu.eta.val <- mu.eta(eta)
			if (any(is.na(mu.eta.val[good]))) 
				stop("NAs in d(mu)/d(eta)")
			good <- (weights > 0) & (mu.eta.val != 0)
			if (all(!good)) {
				conv <- FALSE
				warning(gettextf("no observations informative at iteration %d", 
					iter), domain = NA)
				break
			}
			z <- (eta - offset)[good] + (y - mu)[good]/mu.eta.val[good]
			w <- sqrt((weights[good] * mu.eta.val[good]^2)/variance(mu)[good])
			fit <- .Call(C_Cdqrls, x[good, , drop = FALSE] * 
				w, z * w, min(1e-07, control$epsilon/1000), 
				check = FALSE)
			if (any(!is.finite(fit$coefficients))) {
				conv <- FALSE
				warning(gettextf("non-finite coefficients at iteration %d", 
					iter), domain = NA)
				break
			}
			if (nobs < fit$rank) 
				stop(sprintf(ngettext(nobs, "X matrix has rank %d, but only %d observation", 
					"X matrix has rank %d, but only %d observations"), 
					fit$rank, nobs), domain = NA)
			start[fit$pivot] <- fit$coefficients
			eta <- drop(x %*% start)
			mu <- linkinv(eta <- eta + offset)
			dev <- sum(dev.resids(y, mu, weights))
			if (control$trace) 
				cat("Deviance = ", dev, " Iterations - ", iter, 
					"\n", sep = "")
			boundary <- FALSE
			if (!is.finite(dev)) {
				if (is.null(coefold)) 
					stop("no valid set of coefficients has been found: please supply starting values", 
						call. = FALSE)
				warning("step size truncated due to divergence", 
					call. = FALSE)
				ii <- 1
				while (!is.finite(dev)) {
					if (ii > control$maxit) 
						stop("inner loop 1; cannot correct step size", 
							call. = FALSE)
					ii <- ii + 1
					start <- (start + coefold)/2
					eta <- drop(x %*% start)
					mu <- linkinv(eta <- eta + offset)
					dev <- sum(dev.resids(y, mu, weights))
				}
				boundary <- TRUE
				if (control$trace) 
					cat("Step halved: new deviance = ", dev, "\n", 
						sep = "")
			}
			if (!(valideta(eta) && validmu(mu))) {
				if (is.null(coefold)) 
					stop("no valid set of coefficients has been found: please supply starting values", 
						call. = FALSE)
				warning("step size truncated: out of bounds", 
					call. = FALSE)
				ii <- 1
				while (!(valideta(eta) && validmu(mu))) {
					if (ii > control$maxit) 
						stop("inner loop 2; cannot correct step size", 
							call. = FALSE)
					ii <- ii + 1
					start <- (start + coefold)/2
					eta <- drop(x %*% start)
					mu <- linkinv(eta <- eta + offset)
				}
				boundary <- TRUE
				dev <- sum(dev.resids(y, mu, weights))
				if (control$trace) 
					cat("Step halved: new deviance = ", dev, "\n", 
						sep = "")
			}
			if (abs(dev - devold)/(0.1 + abs(dev)) < control$epsilon) {
				conv <- TRUE
				coef <- start
				break
			}
			else {
				devold <- dev
				coef <- coefold <- start
			}
		}

核心代码如下，调用lm.c文件中的C_Cdqrls函数

           z <- (eta - offset)[good] + (y - mu)[good]/mu.eta.val[good]
           w <- sqrt((weights[good] * mu.eta.val[good]^2)/variance(mu)[good])
           fit <- .Call(C_Cdqrls, x[good, , drop = FALSE] *
               w, z * w, min(1e-07, control$epsilon/1000),
               check = FALSE)

函数 SEXP Cdqrls(SEXP x, SEXP y, SEXP tol, SEXP chk)用于求解

$\textbf{W}\textbf{X}^\text{T}\boldsymbol{\beta}=\textbf{W}\boldsymbol{z}$ ，其中：
$\textbf{X}^{\text T}=$$ \left\[ \begin{matrix} 1& x_{11} & x_{12} & \cdots & x_{1d} \\ 1& x_{21} & x_{22} & \cdots & x_{2d} \\ \vdots& \vdots & \vdots & \ddots &\vdots \\ 1& x_{n1} & x_{n2} & \cdots & x_{nd} \end{matrix} \right\] \tag{2} $$,\ \textbf{W}=\textbf{W}^{\text T}= $$ \left\[ \begin{matrix} \text w_1 & & & \\ & \text w_2 & \\ & & \ddots & \\ & & &\text w_n \end{matrix} \right\] \tag{2} $$$

$z=\eta+\frac{y-\mu}{\text{d}\mu/\text{d}\eta },\ \ \text w=\sqrt{\frac{\omega(\text{d}\mu/\text{d}\eta)^2}{\mu(1-\mu)}}=\sqrt{\omega \frac{\text d \mu}{\text d \eta}}=\sqrt{\omega\mu(1-\mu)}$

z是利用牛顿法求方程f(eta)=y-linkinv(eta)=0的解的迭代公式：

$z=\eta^{(t+1)}=\eta^{(t)}-\frac{f(\eta^{(t)})}{f'(\eta^{(t)})}= \eta^{(t)}-\frac{y-linkinv(\eta^{(t)})}{-linkinv'(\eta^{(t)})}= \eta^{(t)}+\frac{y-\mu}{\text d \mu^{(t)}/\text d \eta^{(t)}}$

即转化为一般的线性回归问题 $\textbf{W}\textbf{X}^\text{T}\boldsymbol{\beta}=\textbf{W}\boldsymbol{\eta}^\text{(t+1)}$ ，求解系数 $\boldsymbol \beta^{(t+1)}$ ，调用Cdqrls（采用IRLS方法）求解该问题。

Cdqrls函数又调用Fortran文件dqrls.f，该文件再调用两个f文件：dqrdc2.f、dqrsl.f。其中：

f文件

说明

备注

dqrdc2.f

uses householder transformations to compute the qr factorization of an n by p matrix x.

qr分解

dqrsl.f

applies the output of dqrdc to compute coordinate transformations, projections, and least squares solutions.
for k .le. min(n,p), let xk be the matrix xk = (x(jpvt(1)),x(jpvt(2)), ... ,x(jpvt(k)))

formed from columnns jpvt(1), ... ,jpvt(k) of the original n x p matrix x that was input to dqrdc (if no pivoting was done, xk consists of the first k columns of x in their original order). dqrdc produces a factored orthogonal matrix q and an upper triangular matrix r such that

xk = q * (r)
(0)
this information is contained in coded form in the arrays x and qraux.

ouput b contains the solution of the least squares problem

minimize norm2(y- xk*b)

dqrdc2 uses householder transformations to compute the qr factorization of an n by p matrix x.

qrsl applies the output of dqrdc to compute coordinate transformations, projections, and least squares solutions.
for k .le. min(n,p), let xk be the matrix

xk = (x(jpvt(1)),x(jpvt(2)), ... ,x(jpvt(k)))
formed from columnns jpvt(1), ... ,jpvt(k) of the original n x p matrix x that was input to dqrdc (if no pivoting was done, xk consists of the first k columns of x in their original order). dqrdc produces a factored orthogonal matrix q and an upper triangular matrix r such that
xk = q * (r)
(0)
this information is contained in coded form in the arrays x and qraux.

	英文解释	备注
qr	contains the output array from dqrdc2.namely the qr decomposition of x stored in compact form.	分解的结果
coefficients	contains the solution vectors with rows permuted in the same way as the columns of x. components corresponding to columns not used are set to zero.	其次迭代得到的系数，即式中的b
residuals	contains the residual vectors y-x*b.	残差矩阵，y-x*b
effects	qty contains the vectors q y. note that the initial p elements of this vector are permuted in the same way as the columns of x.
rank	contains the number of columns of x judged to be linearly independent, i.e., "the rank"
pivot	has its contents permuted as described above
qraux	qraux contains further information required to recover the orthogonal part of the decomposition.
tol	tolerance
pivoted	jpvt(j) contains the index of the column of the original matrix that has been interchanged into the j-th column. Consequently, jpvt[] codes a permutation of 1:p; it is called 'pivot' in R

(to be continued)

152.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之Banner模块实现效果演示1.Banner模块结构1.1基础布局@BuilderbannerModule(){Column(){Text($r('app.string.cube_animation
数据结构复习笔记5.2：二叉树 SGCGYU_Tan 数据结构笔记数据结构笔记 c++
1.二叉树的概念⼆叉树是每个结点最多有两个⼦树的树结构。也就是说⼆叉树不允许存在度⼤于2的树。它有五种最基本的形态：⼆叉树可以是空集。根可以有空的左⼦树或者右⼦树；或者左右⼦树都是空。其中只有左⼦树或者右子树的叫做斜树。为何要重点研究每结点最多只有两个“叉”的树？二叉树的结构最简单，规律性最强；可以证明，所有树都能转为唯一对应的二叉树，不失一般性。普通树（多叉树）若不转化为二叉树，则运算很难实现。
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
科技资讯杂志科技资讯编辑部科技资讯杂志社2025年第2期目录 QQ296078736 人工智能
学思践悟二十大党的二十大背景下以人民为中心发展教育的路径探究宋靖玮;韩冰;1-3党的二十大精神引领下药学课程群思政育人探索与实践——以应用型本科生物制药专业为例张志国;张媛婷;刘畅;闫立地;岳华;徐晶雪;秦姝冕;王雨欣;4-8党的二十大背景下“资源再生利用”思政教学的设计研究孟娟;秦恒飞;罗京;蒋杰;程龙;9-11+15践行党的二十大精神探索机器人工程专业创新型人才培养新模式郭霆;安少军;张明慧;
基于协同过滤推荐算法的景点票务数据系统（python-计算机毕设）计算机程序设计(接毕设) 推荐算法机器学习毕业设计 python 人工智能
摘要IABSTRACTII第1章引言1研究背景及意义1研究背景1研究意义1国内外研究现状2智慧旅游3旅游大数据3研究内容4本章小结4第2章相关技术概述5基于内容的推荐算法5基于内容的推荐算法原理5基于内容的推荐算法实现5协同过滤推荐算法6协同过滤算法原理6协同过滤算法实现7SpringBoot框架9SpringBoot简介9SpringBoot特性10SpringBoot工作原理10Vue.js框
巨人学术搜索官网入口，免费参考文献论文及学术搜索引擎黄豆匿zlib 学习方法
巨人学术搜索自2024年上线以来，迅速成为学术界不可或缺的重要工具，尤其受到研究人员、教师及学生的青睐。这款专注于学术领域的专业搜索引擎，覆盖了自然科学、人文科学、社会科学等多个学科领域，整合了国内外众多主流数据库，包括维普、万方、Elsevier、WebofScience等，为用户提供了期刊论文、学位论文、专利、图书、预印本等多种类型资源的精准检索服务。与普通搜索引擎相比，巨人学术搜索的优势在于
固态电池行业深度研究报告：技术变革与市场展望萧十一郎@ 知识科普大数据人工智能
目录一、引言1.1研究背景与目的1.2研究方法与数据来源二、固态电池概述2.1定义与分类2.1.1定义2.1.2分类2.2工作原理2.3发展历程三、固态电池技术优势与挑战3.1技术优势3.1.1高安全性3.1.2高能量密度3.1.3长循环寿命3.2技术挑战3.2.1离子电导率低3.2.2固-固界面问题3.2.3锂枝晶生长3.2.4成本高昂四、固态电池材料体系与技术路线4.1固态电解质材料4.1.1
数据分析_python进行数据筛选1_行筛选 Monkey*王 python 数据分析 pandas
以titanic的训练数据为例进行展示，为了简化取前十行为例首先导入模块，导入数据importpandasaspdimportnumpyasnpdf=pd.read_csv(r"C:\Users\admin\Desktop\train.csv")df=df.head(10)df.index=['a','b','c','d','e','f','g','h','i','g']筛选单行1.利用df[行索
前端面经分享（25/03/19） CreatorRay 前端面试前端面试
北京一家做协同办公软件出海的公司，技术一面，20k-40k，要求3-5年详细聊了一下上家公司的项目上家公司的项目是不做了吗，离职原因是什么，你觉得公司的这个产品怎么样在做AI类的业务时，作为前端感觉跟常规业务有什么区别详细聊了一下上上家公司的项目细节讲一下项目里用编辑器做了什么事遇到过什么难解决的问题项目里提供的UI自动化的功能是怎么做的聊了一下写博客的事情有没有了解过浏览器底层的东西最近在研究或
Python的那些事第四十六篇：基于属性的测试库hypothesis研究暮雨哀尘 Python的那些事 python 开发语言属性测试库 hypothesis 执行流程构建
一、引言（一）研究背景随着软件系统复杂性的不断增加，软件测试在确保软件质量方面的重要性愈发凸显。传统测试方法在面对大规模、复杂软件系统时，往往存在测试用例设计不全面、测试执行效率低下等问题。基于属性的测试作为一种新兴的测试方法，通过定义软件系统的属性来指导测试用例的设计与执行，为解决上述问题提供了新的思路。（二）研究意义本研究旨在深入探讨基于属性的测试库的构建与应用，以提高软件测试的效率和质量，降
DeepSeek+知网研学轻松搞定研究生选题 AI新视界 AI学术学术软件推荐 AI工具 AI学术学习人工智能学术
选题是研究生学术研究的起点，一个好的选题不仅决定了研究的方向，还直接影响研究的深度和成果。本文将详细介绍如何结合DeepSeek大模型与知网研学，帮助研究生高效完成选题工作。一、选题的重要性与挑战选题的重要性：选题是研究的核心，决定了研究的创新性和可行性。好的选题能够为后续研究提供明确的方向和动力。选题的挑战：如何从海量文献中找到有价值的研究方向？如何判断选题的创新性和研究价值？如何确保选题的可行
基于大模型的腮腺多形性腺瘤全周期诊疗方案研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与目的1.2研究现状与趋势二、大模型预测原理与方法2.1大模型概述2.2数据收集与预处理2.3模型训练与优化三、术前预测与评估3.1肿瘤特征预测3.2风险评估3.3案例分析四、术中方案制定与实施4.1手术方案选择4.2面神经保护策略4.3麻醉方案确定五、术后恢复与并发症预测5.1恢复情况预测5.2并发症风险预测5.3案例分析六、术后护理与康复6.1护理措施6.2康复训练6
STM32F407 SPI1源代码 heraldww keil ARM stm32 单片机嵌入式硬件
头文件#ifndef__spi1_PA567_H#define__spi1_PA567_H#include"sys.h"#include"project_config.h"#include"gpio.h"////本程序只供学习使用，未经作者许可，不得用于其它任何用途//ALIENTEKSTM32F407开发板//SPI驱动代码//正点原子@ALIENTEK//技术论坛:www.openedv.co
OSPO Summit 2025 正式定档！议题征集同步开启开源
历经二十余年的发展，OSPO已然成为企业数字化转型的战略枢纽、产学研协同创新的关键桥梁、公共领域开放生态建设的核心引擎。作为这一进程的重要见证者和推动者，OSPOSummit也将在2025年6月12日迎来它的第三次进化。会议信息时间：2025年6月12日地点：北京议题征集，期待你的声音现在，我们面向全球开源社区决策者、企业技术管理者、学术机构研究者及一线开发者，发起议题征集！诚邀您分享OSPO如何
华为ensp--BGP路径选择Community 华为路由bgp
学习新思想，争做新青年，今天学习的是BGP路径选择Community实验目的·理解团体属性的概念与作用·熟悉运用团体属性来控制路由传递的方法·理解No-Export、No-Advertise、No-Export-Subconfed属性的区别实验内容本实验网络中，R1属于AS100，R2、R3和R4属于AS编号为200的一个联盟，R5属于AS300。在联盟AS200中，R2和R4属于成员AS2001
友思特新品 | OCT-3D断层扫描成像测量系统OQ StrataScope升级2.0型号！友思特机器视觉与光电机器视觉 3d OCT 光学相干断层扫描
ProductUpdate！友思特高精度OCT-3D断层扫描成像测量系统推出OQStrataScope升级2.0/R型号！同时，原有的OQStrataScope1.0型号产品将暂时停产。OCT新品简介OQStrataScope2.0是仅用于研究和工业领域应用的光学相干断层扫描系统，可针对高度散射的样品介质增加极深的成像深度。相较于OQLabScope系列，OQStrataScope中心波长可达13
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
初学python100例-案例4 计算一年第几天多种不同解法少儿编程案例讲解小兔子编程初学python100例 python学习 python100例 python计算天数 python算法 python案例
题目输入某年某月某日，判断这一天是这一年的第几天？解法1程序分析1、以5月2日为例，应该先把前四个月的加起来，2、然后再加上2天即本年的第几天，3、特殊情况，闰年且输入月份大于2时需考虑多加一天：4、闰年1、年份能被4整除；2、年份若是100的整数倍的话需被400整除，否则是平年。程序源代码：year=int(input('year:\n'))month=int(input('month:\n')
一文搞懂Nginx: 域名配置、SSL、HTTP转HTTPS 千层冷面知识类 http nginx ssl linux
本文将在Centos系统下详解Nginx服务器，从概念、下载、安装、编译、配置(含域名和证书)到启动。本文先讲Nginx如何使用，然后再谈概念。一、实践1.下载下载通常有2种方式：Centos自带的包管理工具、源码编译安装(推荐，拓展性强)，本文使用源码编译安装的形式下载从Nginx官网（nginx.org）下载Nginx的源代码。亦可以使用wget命令或者浏览器下载后通过FTP等方式传输到服务器
GGUF量化模型技术解析与DeepSeek-R1-Distill-Llama-8B选型指南每天三杯咖啡人工智能
```markdown#【完全指南】GGUF量化技术与DeepSeek-R1模型选型：从入门到部署##什么是模型量化？（小白扫盲版）###1.1量化就像"模型减肥术"-**传统模型**：每个参数用32位浮点数（好比高清无损图片）-**量化模型**：用4-8位整数存储（类似手机压缩照片）-**核心原理**：`FP32→Int8/Int4`的数学映射，保留关键特征###1.2为什么要量化？|对比项|原
含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）创新优化代码学习能源 matlab 前端
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述含光热电站、有机朗肯循环与P2G的综合能源优化调度研究一、技术基础与系统作用二、多技术协同机制三、优化调度模型构建四、典型案例与仿真分析五、未来研究方向结论2运行结果3参考文献4Matlab代码实现1概述光热发电(concentratingsolarp
力扣Hot100——136. 只出现一次的数字飞奔的马里奥 leetcode 算法职场和发展
难点在于时间与空间复杂度的要求，一般遇到这样的限制，就要考虑使用位运算，位运算效率最高了。异或当且仅当两个输入值不同时，异或运算输出为真（1），否则输出为假（0），即“同为0，异为1”。这是针对二进制运算的规则，整数进行异或运算，需要转换为二进制，一样遵循这个运算规则。异或的运算律：交换律：p⊕q=q⊕p结合律：p⊕(q⊕r)=(p⊕q)⊕r恒等律：p⊕0=p归零律：p⊕p=0对合运算：p⊕q⊕q
stm32基于HAL库的串口UART中断接收不定长数据代码实现 ls20010901 stm32 单片机 mcu
总体分析：代码使用的串口USART1，GPIO的复用引脚分别是：PA9复用为RX引脚；PA10复用为TX引脚。数据接收标志符为"\r\n"即回车按键按下，当接收到\r\n时接收停止。接收数据缓冲区只能容纳一个字节数据，设置的接收一个字节数据产生一次接收中断，在中断回调函数中进行串口接收协议的编写。代码现象：将接受的数据重新发送至串口进行回显。代码实现uart.h#ifndef__USART_H#d
本地源代码运行bun install时报错星火燎猿 C#疑难杂症处理方案 Bun Bun.js
最近使用Ubuntu系统运行Bun的时候报，Failedtospawnscriptinstallduetoerroros.linux.errno.generic.E.PERMPERM的错误，查看官方文档也没有这个错误描述，最终找到解决方案进行分享。报错问题如下：errorloadingcurrentdirectoryInstalling[2637/2230]error:failedtospawnl
python pyttsx3文本转语音_python 利用pyttsx3文字转语音木大木大本太 python pyttsx3文本转语音
#-*-coding:utf-8-*-importpyttsx3f=open("all.txt",'r')line=f.readline()engine=pyttsx3.init()whileline:line=f.readline()print(line,end='')engine.say(line)engine.runAndWait()f.close()importwin32com.clien
某智慧医养服务平台Uploads存在任意文件上传漏洞(DVB-2025-8968) Byp0ss403 漏洞复现集合文件上传 web安全
免责声明本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品介绍广西金中软件集团有限公司前身成立于1999年，隶属于广西电信下的三产公司金中信息产业有限公司，是一家集软件开发、网站建设、网络工程、系统
Web3身份验证技术对数据保护的影响研究清晨反侦测指纹浏览器社交媒体 web3 ClonBrowser 跨境电商隐私保护
Web3身份验证技术对数据保护的影响研究在这个数字化时代，我们的身份和数据安全比以往任何时候都更加重要。Web3技术以其去中心化和用户主权的核心理念，为个人数据的管理和保护提供了新的视角。本文将探讨Web3身份验证技术如何影响数据保护，并分析其对我们数字生活的影响。Web3身份验证技术简介Web3身份验证技术依托于区块链和先进的加密技术，如非对称加密算法和智能合约，为用户提供了一种全新的身份验证方
金三银四快过去一半了，是时候加把劲了后端go找工作面试
从复旦春招会的15000+岗位争夺战，到AI算法岗年薪百万的“神仙打架”，再到游戏行业20:1的残酷竞争比，今年的金三银四像极了《三体》里的黑暗森林：机会看似遍地，但稍有不慎就成了别人的“背景板”。但现实真的是“投晚了就凉了”吗？数据告诉你真相：智联研究院统计显示，算法工程师、机器人算法工程师等岗位需求同比激增44%，而中小企业的“捡漏窗口”才刚开启。这半个月，我整理了20+场面试实录（含小鹅通、
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
Trading星周二Space第三期：理性应对波动，聚焦长期价值 web3区块链比特币
作者：Trading星周二在3月20日美联储利率决议这一关键节点前夕，TechubNews王牌栏目「Trading星周二」第三期以「加密资产仓位攻防战：政策拐点下的BTC/ETH配置法则」为主题，引发行业高度关注。数据显示，本期由主持人茄哥与Balance（Kingdata&Geniidata联合创始人）、A神（RITDLab联合创始人）、交易员Beyond、Cassie（LYSLab研究员）组成
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

R源代码研究——逻辑回归logistic regression

概述

样例

你可能感兴趣的:(R源代码研究——逻辑回归logistic regression)