太上老君的炼丹炉

判别分析原理及R语言实现

判别分析内容

判别分析做的好能挖掘数据最大的价值。判别分析（discriminat analysis）他要解决的问题是在一些已知研究对象已经用某种方法分成若干类的情况下，确定新的样品属于已知类别中的哪一类。如已知健康人和冠心病人的血压、血脂等资料，以此建立判别函数，对新样品分类进行预测。在模式识别领域（比如人脸识别，舰艇识别等图形图像识别领域）中有非常广泛的应用。判别分析在处理问题时，通常要给出一个衡量新样品与各已知类别接近程度的描述统计模型，即判别函数，同时也需要指定一种判别规则，以判断新样品的归属。判别规则可以是确定性的也可以是统计性的分别对应Fisher判别和Bayes判别。今天明明同学给大家讲讲《判别分析原理及R语言实现》。

最早由fisher（1936）提出，用于花卉分类上，将花卉的各种特征（如花瓣长与宽，花萼长与宽等）利用线性组合方法变成单变量值，再以单值比较方法来判别事物间的差别。
示例：
以两类判别为例说明。设有两类样品，分别为n1,n2个样品，各测得p个指标，观察值如下表所示。

序号	变量				分类
序号	X1	X2	…	Xp	Y
1	x11	x12	…	x1p	1
2	x21	x22	…	x2p	1
…	…	…	…	…	1
n1	xn11	xn12	…	xn1p	1
1	…	…	…	…	2
2	…	…	…	…	2
…	…	…	…	…	2
n2	xn21	xn22	…	xn2p	2

可以预设线性判别函数为Y = a1X1+ a2X2+……+ apXp = a’X。使得该判别函数能根据指标X1，X2，XP之值区分各样品归属哪一类。

步骤：

1、求Fisher线性判别函数（Fisher线性判别准则要求各类之间的变异尽可能地大，而各类内部的变异尽可能地小，变异用离均差平方和表示）
2、计算判别界值（求的ai后，代入判别函数式即得判别函数）
3、建立判别标准

下面对R语言实现过程详细介绍。

根据经验，今天和昨天气温差x1和x2是预报明天下雨或不下雨的两个重要因子，实验记录如下表格，试问，今天测得x1=8.1，x2=2.0，明天应该预报下雨还是晴天？

Grop	x1	x2	weather
1	-1.9	3.2	雨
1	-6.9	0.4	雨
1	5.2	2	雨
1	5	2.5	雨
1	7.3	0	雨
1	6.8	12.7	雨
1	0.9	-5.4	雨
1	-12.5	-2.5	雨
1	1.5	1.3	雨
1	3.8	6.8	雨
2	0.2	6.2	晴
2	-0.1	7.5	晴
2	0.4	14.6	晴
2	2.7	8.3	晴
2	2.1	0.8	晴
2	-4.6	4.3	晴
2	-1.7	10.9	晴
2	-2.6	13.1	晴
2	2.6	12.8	晴
2	-2.8	10	晴

R语言中进行线性判别得函数为lda()
形式如下:
lda(formula , data，……)
formula和上次明明同学介绍的回归分析中的形式一样。
Data为数据框。
1、首先把数据加载到R语言中，然后画出数据散点图，初步观察数据分布。

#导入数据
weatherData <- read.table("clipboard" , header = T);
#将Grop中的1，2转换成因子变量
weatherData$Grop <- as.factor(weatherData$Grop)
#画出散点图，初步观察数据分布情况
ggplot(data = weatherData , aes(x = x1 , y = x2 , shape = Grop ,color = Grop)) + 
geom_point() + geom_text(aes(label = weather) , vjust = -0.8);

2、建立判别函数

> #加载分析所需要的包
> require(MASS);
> #建立判别函数
> weatherLd <- lda(Grop ~ x1 + x2 , data = weatherData);
> #查看函数结果
> weatherLd;
Call:
lda(Grop ~ x1 + x2, data = weatherData)

Prior probabilities of groups:
  1   2 
0.5 0.5 

Group means:
     x1   x2
1  0.92 2.10
2 -0.38 8.85

Coefficients of linear discriminants:
          LD1
x1 -0.1035305
x2  0.2247957

3、用训练的判别函数对源数据进行检测

> #根据线性函数模型预测所属类别
> weatherPredict <- predict(weatherLd)
> #预测的所属类的结果
> newGrop <- weatherPredict$class
> #显示预测前后分组结果
> cbind(weatherData$Grop , weatherPredict$x , newGrop)
             LD1 newGrop
1  1 -0.28674901       1
2  1 -0.39852439       1
3  1 -1.29157053       1
4  1 -1.15846657       1
5  1 -1.95857603       1
6  1  0.94809469       2
7  1 -2.50987753       1
8  1 -0.47066104       1
9  1 -1.06586461       1
10 1 -0.06760842       1
11 2  0.17022402       2
12 2  0.49351760       2
13 2  2.03780185       2
14 2  0.38346871       2
15 2 -1.24038077       1
16 2  0.24005867       2
17 2  1.42347182       2
18 2  2.01119984       2
19 2  1.40540244       2
20 2  1.33503926       2

由结果可知，两类中分别有一个判别错误，判对的共有18对。判对率为18/20=90%
4、构造混淆矩阵，求出判对率

> tab <- table(weatherData$Grop , newGrop)
> tab
   newGrop
    1 2
  1 9 1
  2 1 9
> sum(diag(prop.table(tab)))
[1] 0.9

由这个结果也可以看出，判对率为90%。求出的判别函数为y=-0.1035x1+0.2248x2 。
画出分类线为：

5、对新数据进行预测

> predict(weatherLd , newdata = data.frame(x1 = 8.1 , x2 = 2))
$class
[1] 1
Levels: 1 2

$posterior
          1          2
1 0.9327428 0.06725717

$x
        LD1
1 -1.591809

由结果可以看出，当x1 = 8.1 ， x2 = 2.0时，明天天气分类为1，即明天天气为下雨。
把新点添加到图层，查看可视化效果，图中箭头指向的黑色点就是新点。也可以看出，该点落在有雨的类别中。

2、距离判别分析

距离判别的基本思想是，根据已知分类的数据，分别计算各类的重心，即各组的均值。距离判别的准则是：对任给的一次观测，若它与第i类的重心距离最近，就认为它来自第i类。通常采用马氏距离进行判别。
设有两总体G1、G2，从第一个总体中抽取n1个样品，从第二个总体中抽取n2个样品，对每个样品测量P个指标。任取一个样品实测指标为X =(x1，x2，…… ，xp)'。分别计算样品X到总体G1、G2的距离D(X , G1)和D(X , G2),按距离最近准则判别归类。即：

⎧ ⎩ ⎨ D (X, G 1) < D (X, G 2), X \subseteq G 1 D (X, G 1) > D (X, G 2), X \subseteq G 2 D (X, G 1) = D (X, G 2), 代 判

在R语言中利用 WeDiBaDis包可以实现加权马氏距离判别分析。
下面距离说明：
从市场上随机抽取了20中牌子的电视机进行调查。按照电视机的质量评分、功能评分、销售价格以及销售情况（共两种，畅销和滞销）进行如下统计(1、表示畅销， 2、表示滞销)。
现有一新厂商来推销其产品，质量评分8.0，功能评分7.5，售价65百元。该厂商的场景如何？

销售状况	质量评分	功能评分	销售价格
1	8.3	4	29
1	9.5	7	68
1	8	5	39
1	7.4	7	50
1	8.8	6.5	55
1	9	7.5	58
1	7	6	75
1	9.2	8	82
1	8	7	67
1	7.6	9	90
1	7.2	8.5	86
1	6.4	7	53
1	7.3	5	48
2	6	2	20
2	6.4	4	39
2	6.8	5	48
2	5.2	3	29
2	5.8	3.5	32
2	5.5	4	34
2	6	4.5	36

R语言实现过程：

1）载入数据，分析数据呈现方式

#导入数据
TV_data <- read.table("clipboard" , header = T)
#将分组数据转换成因子
TV_data$G <- as.factor(TV_data$G) 
#导入ggplot2包
require(ggplot2)
#建立图层的底层
base_plot <- ggplot(data = TV_data , aes(color = G))
#显示质量评分和功能评分与销售状况的关系
base_plot + geom_point(aes(x = Q , y = C)) + geom_text(aes(x = Q , y = C , label = G) , vjust = -0.8)
#显示质量评分和销售价格与销售状况的关系
base_plot + geom_point(aes(x = Q , y = P)) + geom_text(aes(x = Q , y = P , label = G) , vjust = -0.8)
#显示功能评分和销售价格与销售状况的关系
base_plot + geom_point(aes(x = C , y = P)) + geom_text(aes(x = C , y = P , label = G) , vjust = -0.8)

2）、导入`WeDiBaDis`包，建立马氏距离模型。使用`WDBdisc ()`函数建立模型。

WDBdisc函数结构为：
WDBdisc(data, datatype, classcol, new.ind, distance, type, method)
Data: 一个训练数据矩阵或者训练数据距离矩阵。
Datatype：如果数据是数据矩阵，则datatype = “m”，如果数据是距离矩阵，则datatype = “d”。
Classcol：分类变量所在的列，默认为第一列。
new.ind：为测试数据，可选参数，如果需要测试新数据的话需要加上。
distance: 判别分析采用的距离方法。默认为欧式距离。可选“correlation” , “Bhattacharyya”, “Gower”,“Mahalanobis”,“BrayCurtis”, “Orloci”, “Hellinger”or “Prevosti”。
type: 如果距离为“Gower“距离，则需要该参数。该参数是一个列表。
Method：判别分析采用的方法，为"DB" 或者"WDB"，默认为"WDB"。

> #载入程序包
> require(WeDiBaDis)
> #把TV_data转换成数据矩阵
> TV_data_matrix <- as.matrix(TV_data)
> #把矩阵转换成数值型
> TV_data_matrix_1 <- matrix(as.integer(TV_data_matrix) , ncol = 4)
> #进行马氏距离判别分析
> summary(WDBdisc(data = TV_data_matrix_1 , datatype = "m" , 
+                 classcol = 1 , distance = "Mahalanobis"))
Discriminant method:  
------ Leave-one-out confusion matrix: ------
    Predicted
Real  1  2
   1 11  2
   2  1  6

Total correct classification:  85 % 

Generalized squared correlation:  0.4689 

Cohen's Kappa coefficient:  0.6808511 

Sensitivity for each class: 
    1     2 
84.62 85.71 

Predictive value for each class: 
    1     2 
91.67 75.00 

Specificity for each class: 
    1     2 
85.71 84.62 

F1-score for each class: 
 1  2 
88 80 
------ ------ ------ ------ ------ ------

No predicted individuals

由此可见训练结果可知，类别1有两个判错的，类别2有一个判错的，判对率为85%。
新数据代入模型，判断新类别的分类。

> #构建新测试数据矩阵
> new_test_data <- matrix(c(8.0 , 7.5 , 65) , nrow = 1)
> #代入训练模型，预测新测试数据分类
> summary(WDBdisc(data = TV_data_matrix_1 , datatype = "m" , 
+                 classcol = 1 , new.ind = new_test_data , 
+                 distance = "Mahalanobis"))
Discriminant method:  
------ Leave-one-out confusion matrix: ------
    Predicted
Real  1  2
   1 11  2
   2  1  6

Total correct classification:  85 % 

Generalized squared correlation:  0.4689 

Cohen's Kappa coefficient:  0.6808511 

Sensitivity for each class: 
    1     2 
84.62 85.71 

Predictive value for each class: 
    1     2 
91.67 75.00 

Specificity for each class: 
    1     2 
85.71 84.62 

F1-score for each class: 
 1  2 
88 80 
------ ------ ------ ------ ------ ------

Prediction for new individuals: 
  Pred. class
1 "1"

由预测结果可知，新类别所属分类为1，即新厂商推广的产品为畅销，新厂商前景比较乐观。

3、二次判别分析

当多总体之间的协方差矩阵不相同时，距离判别函数为非线性形式，一般为二次函数。R语言中用MASS包里的qda()函数来建立模型。
qda()函数书写形式和lda()一样，这里明明同学简单略过。你们可以回头看看线性判别函数lda()书写。
本次还以距离判别的数据为例，用二次判别建立模型，看看模型判对率。

> #二次判别函数构建并查看结果
> (qda_model <- qda(G ~ . , TV_data))
Call:
qda(G ~ ., data = TV_data)

Prior probabilities of groups:
   1    2 
0.65 0.35 

Group means:
         Q        C        P
1 7.976923 6.730769 61.53846
2 5.957143 3.714286 34.00000
> #对训练数据进行模型预测
> predict_TV_data <- predict(qda_model)
> #预测后新的分类
> new_data_grop <- predict_TV_data$class
> #构建原始数据对照表
> cbind(TV_data$G , new_data_grop)
        new_data_grop
 [1,] 1             1
 [2,] 1             1
 [3,] 1             1
 [4,] 1             1
 [5,] 1             1
 [6,] 1             1
 [7,] 1             1
 [8,] 1             1
 [9,] 1             1
[10,] 1             1
[11,] 1             1
[12,] 1             1
[13,] 1             1
[14,] 2             2
[15,] 2             2
[16,] 2             2
[17,] 2             2
[18,] 2             2
[19,] 2             2
[20,] 2             2
> #构造混淆矩阵，求出判对率
> tab = table(TV_data$G , new_data_grop)
> sum(diag(prop.table(tab)))
[1] 1

由此可见，我们给定的20个样本训练数据训练的模型全部判对。判对率为100%。由此可见应用二次判别比马氏距离判别效果好。

4、Bayes判别分析

前面讲的几种判别分析方法计算简单，结果明确，比较实用。但是存在两个缺点，一是判别方法与总体各自出现的概率大小完全无关；二是判别方法与错判后造成的损失无关，这些都不尽合理。Bayes判别则是很好的考虑了这两个因素而提出的一种判别方法。
我们还以二次判别分析的例子用bayes建模。
1、假设先验概率相等，即q1=q2=1/2，此时判别函数等价于fisher线性判别函数。

> #先验概率相等的bayes判别模型
> (bayes1 <- lda(G ~ . , data = TV_data , prior = c(1 , 1)/2))
Call:
lda(G ~ ., data = TV_data, prior = c(1, 1)/2)

Prior probabilities of groups:
  1   2 
0.5 0.5 

Group means:
         Q        C        P
1 7.976923 6.730769 61.53846
2 5.957143 3.714286 34.00000

Coefficients of linear discriminants:
          LD1
Q -0.82211427
C -0.64614217
P  0.01495461
> #对结果进行预测
> bayes1_predict <- predict(bayes1)
> cbind(TV_data$G , bayes1_predict$x , bayes1_predict$class)
            LD1  
1  1 -0.5866112 1
2  1 -2.9283451 1
3  1 -0.8365730 1
4  1 -1.4710880 1
5  1 -2.2242039 1
6  1 -2.9899051 1
7  1 -0.1222350 1
8  1 -3.1184884 1
9  1 -1.7101283 1
10 1 -2.3296109 1
11 1 -1.7375125 1
12 1 -0.6041099 1
13 1 -0.1265015 1
14 2  2.4619445 2
15 2  1.1249520 2
16 2  0.2845556 2
17 2  2.6080852 2
18 2  1.8366094 2
19 2  1.7900818 2
20 2  1.0858628 2

2、先验概率不一样，取q1=13/20 , q2=7/20，然后建立bayes判别函数

> #先验概率不相等的bayes判别模型
> (bayes2 <- lda(G~. , data = TV_data , prior = c(13,7)/20))
Call:
lda(G ~ ., data = TV_data, prior = c(13, 7)/20)

Prior probabilities of groups:
   1    2 
0.65 0.35 

Group means:
         Q        C        P
1 7.976923 6.730769 61.53846
2 5.957143 3.714286 34.00000

Coefficients of linear discriminants:
          LD1
Q -0.82211427
C -0.64614217
P  0.01495461
> #对结果进行预测
> bayes2_predict <- predict(bayes2)
> cbind(TV_data$G , bayes2_predict$x , bayes2_predict$class)
            LD1  
1  1 -0.1069501 1
2  1 -2.4486840 1
3  1 -0.3569119 1
4  1 -0.9914270 1
5  1 -1.7445428 1
6  1 -2.5102440 1
7  1  0.3574261 1
8  1 -2.6388274 1
9  1 -1.2304672 1
10 1 -1.8499498 1
11 1 -1.2578515 1
12 1 -0.1244489 1
13 1  0.3531596 1
14 2  2.9416056 2
15 2  1.6046131 2
16 2  0.7642167 2
17 2  3.0877463 2
18 2  2.3162705 2
19 2  2.2697429 2
20 2  1.5655239 2

由于我们样本数据少的原因，本结果中无论是先验概率一样还是先验概率不一样的bayes判别都针对本实验完美的进行了判别。判别结果好过马氏距离判别分析。

由于篇幅有限，本文关于判别函数的建立与推到并没有写出，希望大家自己查看资料学习。更多R语言数据分析使用技巧、EXCEL和PPT制作教程明明同学会在博客中相继给大家介绍。
有任何问题请评论区会说明并私信明明同学，明明同学帮助你解决数据分析，PPT制作，论文做图、以及高质量图片处理的难处。

微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
【数据分析】多数据集网络分析：探索健康与退休研究中的变量关系生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理函数网络分析画图保存图片总结系统信息介绍在医学和社会科学研究中，理解多个变量之间的复杂关系对于揭示潜在的病理生理机制和社会行为模式至关重要。本文介绍了一种基于R语言的网络分析方法，用于探索HRS（健康与退休研究）及其类似研究（CHARLS、ELSA、MHAS、SHARE）中的变
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
R语言舆情监控与可视化统计 q56731523 r语言开发语言爬虫
用R语言进行舆情监控并且做到可视化，对我来说，总体难度还算可以，主要是舆情监控通常涉及文本数据的收集（如社交媒体、新闻评论），然后进行情感分析，最后通过图表展示结果。步骤看似简单实则一点也不简单。以下就是我使用R语言进行舆情监控和可视化统计的完整示例。该方案包括文本情感分析和时间趋势可视化：#加载必要的包library(tidyverse)#数据处理和可视化library(tidytext)#文本
ISBI 2023部分半监督学习论文汇总 xiongxyowo 划水
ISBI2023论文集：https://ieeexplore.ieee.org/xpl/conhome/10230311/proceeding[link]LeveragingInter-AnnotatorDisagreementforSemi-SupervisedSegmentation生物医学图像的信噪比通常较低，这往往导致专家们对GT分割存在分歧。现有的多重标注方法试图解决相互冲突的标注，而我
R 语言数据框连接操作详解：join 与 merge 方法对比晚风keeper r语言开发语言学习笔记学习方法
在数据分析工作中，我们经常需要将多个数据集按照某些条件进行合并。R语言提供了多种数据框连接方法，本文将详细介绍如何使用dplyr包的join系列函数和基础R的merge函数进行数据框的各种连接操作，并对比它们之间的差异。一、数据框连接操作概述数据框连接是将两个或多个数据框按照某些共同的列或条件组合成一个新的数据框的过程。常见的连接类型包括：左连接（LeftJoin）：保留左数据框的所有行，匹配右数
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析一起搞IT吧数码相机算法数据结构人工智能 android 图像处理计算机视觉
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：Camera相机人脸识别系列专题分析之十六：人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析目录一、libcvface_api.so数据结构详细注释解析一、libcvface_api.so数据结构详细注释解析///@brief人脸信息结构体typedefstructcv_face_t{cv_r
Readr 项目安装与配置指南芮奕滢Kirby
Readr项目安装与配置指南readr项目地址:https://gitcode.com/gh_mirrors/rea/readr1.项目基础介绍readr是一个R语言的开源项目，由HadleyWickham创建和维护。该项目的主要目的是提供一种快速且友好的方式来读取分隔文件（如CSV和TSV）中的矩形数据。readr能够解析多种数据类型，并在解析过程中提供详细的错误报告，以便用户能够快速识别和解决
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
基于STM32单片机的考勤打卡系统
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于STM32单片机的考勤打卡系统介绍一、系统概述基于STM32单片机的考勤打卡系统是一种集数据采集、身份识别、记录存储与远程管理于一体的智能化考勤解决方案。该系统以STM32微控制器为核心，通过非接触式识别技术（如RFID、指纹、人脸识别）或传统输入方式（如按键、密码）快速采集员工考勤信息，结合实时时钟模块（RTC）记录
4篇2章5节：ANOVA 功效的单次精确模拟与可视化全解析 MD分析用R探索医药数据科学 r语言-4.2.1 r语言功效曲线单次精确模拟分析
在医学研究尤其是糖尿病等干预性试验中，精准的实验设计与功效分析是确保研究价值的关键。R语言为重复测量方差分析（ANOVA）提供了强大工具，从实验设计构建、单次精确模拟分析，到功效曲线可视化，覆盖研究全流程。本文结合糖尿病胰岛素治疗试验案例，深度拆解函数的应用逻辑，手把手教你用数据驱动实验设计，让“样本量规划”“效应检测能力”从抽象概念变为可操作、可视化的研究支撑。一、相关函数的介绍在医学研究中，实
R语言如何接入实时行情接口
目录1.安装必要的R包2.导入库3.连接WebSocket4.处理连接成功后的操作5.处理接收到的消息6.处理连接关闭和错误7.发送心跳数据8.自动重连机制9.启动连接和重连总结在数据分析和金融研究中，实时行情数据的获取至关重要，但市面上的实时行情接口并不多，本文将一步步教你如何使用R语言接入实时行情接口，获取来自WebSocket的实时数据。1.安装必要的R包首先，确保你已安装了以下R包，用于处
Bongo-Cat-Crew:用Python打造动态音乐猫元楼
本文还有配套的精品资源，点击获取简介：在这个项目中，我们创建了一个将音乐、游戏和编程结合的创新体验，允许玩家通过动态猫声分类与节奏游戏OSU!互动。Python的使用使得音乐节奏识别、猫声分类逻辑和游戏接口交互成为可能。项目的核心包含了音乐节奏分析、游戏模式识别和猫声动画实现等技术要点，旨在为玩家提供独特的交互乐趣。1.Python在项目中的应用和角色1.1Python在IT行业中的普及Pytho
【AI与数据管理】基于AI大模型的企业元数据管理方案暴躁小师兄数据学院人工智能 ai 语言模型
基于AI大模型的元数据关键解决方案元数据（metadata）是描述数据的数据，例如数据的来源、结构、类型和质量信息。它在数据管理、分析和应用中至关重要。随着人工智能（AI）大模型（如基于Transformer的模型）的发展，这些模型凭借其强大的自然语言处理、模式识别和生成能力，为元数据处理提供了高效、自动化的解决方案。下面，我将逐步解释基于AI大模型的元数据关键解决方案，帮助您理解核心方法、挑战和
【R语言】Can‘t subset elements that don‘t exist. 新子y r语言开发语言 excel
Errorin`select()`:ℹInargument:`all_of(label_col)`.Causedbyerrorin`all_of()`:!Can'tsubsetelementsthatdon'texist.✖Element`Label`doesn'texist.Run`rlang::last_trace()`toseewheretheerroroccurred.原文中文解释涉及关键
r读取文件夹下的所有csv文件_R语言读取文件夹下多个文件并进行合并数据生成总数据文件... seiji morisako r读取文件夹下的所有csv文件
在流水化办公中，通常有格式统一的表格文件产生，但是到最后要将这一堆表格文件整合为大表却很揪心，累断手，如何用R语言进行一次性导入整合呢？假设我们将D:/input文件夹作为需要导入的表格的存放点，文件夹内所有文件均为此次需要导入数据，那么可以用以下程序进行操作setwd("D:/")#设定工作目录为D盘a=list.files("input")#list.files命令将input文件夹下所有文件
从0开始学习R语言--Day41--Moran‘s I Chef_Chen 学习
在处理带有空间特征的数据，我们往往都直接一股脑地处理数据点，但很多时候，空间上的信息对于处理后续衍生出来的问题会有很大帮助，例如对于城市里大小县城的发展情况，只知道单一县城的经济发展曲线，很难解释一些拐点和突然的攀升，而如果知道相邻县城存在经济发展飞快的例子，可能就是被带动了经济水平；亦或者是在处理社交网络的好有问题时，只知道谁和谁是朋友（类似于空间矩阵），是无法推断出经济收入相似的推论的，所以说
结构方程模型（SEM）高阶应用系列梦想的初衷~ 结构方程生态环境 python 开发语言结构方程
结构方程模型（StructuralEquationModeling）是分析多变量间因果关系的利器，在众多学科领域具有巨大应用潜力。我们前期推出的《基于R语言结构方程模型》通过结构方程原理介绍、结构方程全局和局域估计、模型构建和调整、潜变量分析、复合变量分析及结构方程贝叶斯方法实现等一系列专题的介绍及大量案例讲解，由浅入深地系统介绍了结构方程模型的建立、拟合、评估、筛选和结果展示全过程，得到学员广泛
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
r语言改变数据框列名_数据决定离线强化学习将如何改变我们的语言习惯杨_明 python 大数据人工智能 java 机器学习
r语言改变数据框列名重点(Tophighlight)Aridesharingcompanycollectsadatasetofpricinganddiscountdecisionswithcorrespondingchangesincustomeranddriverbehavior,inordertooptimizeadynamicpricingstrategy.Anonlinevendorrec
【数据分析】R语言基于虚弱指数的心血管疾病风险评估生信学习者1 数据分析 (2025版)数据分析 r语言数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图其他1其他2其他3其他4总结系统信息介绍生存分析是医学和生物统计学中常用的方法，用于研究事件（如疾病发生、死亡等）发生的时间和相关影响因素。本文介绍了一种基于R语言的生存分析方法，用于评估虚弱指数（FrailtyIndex,FI）对心血管疾病（CVD）发生风险的影响。通过这
Python机器学习入门必看！从原理到实战，手把手教你线性回归模型小张在编程 python 机器学习线性回归
引言在人工智能浪潮席卷全球的今天，机器学习（MachineLearning）早已不再是实验室的“黑科技”——打开购物APP的“猜你喜欢”、输入搜索词后的“相关推荐”、甚至天气预报中的温度预测，背后都有机器学习模型的身影。而在线性回归（LinearRegression）作为机器学习中最基础、最经典的监督学习模型，堪称机器学习的“敲门砖”。本文将从原理到实战，带你彻底掌握这一核心算法。一、机器学习的“
【科研绘图系列】R语言绘制论文组合图（multiple plots）生信学习者1 SCI科研绘图系列 (2025版)r语言数据分析数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载函数数据预处理画图1画图2画图3画图4画图5画图6总结系统信息介绍这段代码是一个用于生成多种复杂数据可视化的R脚本，主要利用ggplot2、tidyverse和自定义函数来处理和展示与小鼠实验相关的数据。它通过读取、处理数据，并生成多种图形，旨在清晰地展示不同实验组的小鼠在不同时间点的抗体浓度和
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
如何自定义R语言函数？参数中的省略号`...`有什么用？「已注销」 python 编程语言 java 人工智能 c++
学习R未必要学习很多工具包，有时候根据自己的理解去自定义函数也是一个不错的选择。本篇推文主要介绍两方面的内容：在R语言中自定义函数的一般方法；函数参数中...的作用。在看函数的帮助文档时会发现许多函数的参数中都有...符号，它是表示被省略的参数吗？如果是，作者为什么会省略它？如果不是，那又表示什么含义呢？不久前，学堂君分享了自己编写的计算空间可达性的函数，详见推文：两步移动搜索法（2SFCA）计算
Logistic回归预测模型2：R语言实现模型的内部和外部验证
前面我们讲了logistic回归预测模型的建立，今天介绍的是模型的验证，可以在训练集和验证集中通过ROC曲线、校准曲线和决策曲线分别进行验证。1、原始数据原始数据分为训练集和验证集，其中训练集用于模型的构建和内部验证，验证集用于外部验证。两个数据集都包含5列，且列名相同。组别Group为因变量，1代表阳性结局，0代表阴性结局。自变量1和4为连续性变量，自变量2和3为二分类变量。2、安装所需要的R包
R 列表：深入解析与高效应用沐知全栈开发开发语言
R列表：深入解析与高效应用引言在R语言中，列表（List）是一种非常重要的数据结构，它允许我们将不同类型的数据组合在一起。列表在数据分析和统计建模中扮演着至关重要的角色。本文将深入探讨R列表的概念、创建方法、操作技巧以及在实际应用中的高效使用。R列表概述定义R列表是一种可以包含多种数据类型的数据结构，如数值、字符、逻辑值、其他列表等。列表可以看作是一个容器，可以存储任意数量的元素。类型R列表分为两
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

判别分析原理及R语言实现

判别分析内容

目录：

1、线性判别分析

提出:

步骤：

下面对R语言实现过程详细介绍。

2、距离判别分析

R语言实现过程：

1）载入数据，分析数据呈现方式

2）、导入`WeDiBaDis`包，建立马氏距离模型。使用`WDBdisc ()`函数建立模型。

3、二次判别分析

4、Bayes判别分析

你可能感兴趣的:(R语言,判别分析,判别分析,R语言,模式识别,人脸识别,监督学习)

销售状况	质量评分	功能评分	销售价格
1	8.3	4	29
1	9.5	7	68
1	8	5	39
1	7.4	7	50
1	8.8	6.5	55
1	9	7.5	58
1	7	6	75
1	9.2	8	82
1	8	7	67
1	7.6	9	90
1	7.2	8.5	86
1	6.4	7	53
1	7.3	5	48
2	6	2	20
2	6.4	4	39
2	6.8	5	48
2	5.2	3	29
2	5.8	3.5	32
2	5.5	4	34
2	6	4.5	36

销售状况	质量评分	功能评分	销售价格
1	8.3	4	29
1	9.5	7	68
1	8	5	39
1	7.4	7	50
1	8.8	6.5	55
1	9	7.5	58
1	7	6	75
1	9.2	8	82
1	8	7	67
1	7.6	9	90
1	7.2	8.5	86
1	6.4	7	53
1	7.3	5	48
2	6	2	20
2	6.4	4	39
2	6.8	5	48
2	5.2	3	29
2	5.8	3.5	32
2	5.5	4	34
2	6	4.5	36

判别分析原理及R语言实现

判别分析内容

目录：

1、线性判别分析

提出:

步骤：

下面对R语言实现过程详细介绍。

2、距离判别分析

R语言实现过程：

1）载入数据，分析数据呈现方式

2）、导入WeDiBaDis包，建立马氏距离模型。使用WDBdisc ()函数建立模型。

3、二次判别分析

4、Bayes判别分析

你可能感兴趣的:(R语言,判别分析,判别分析,R语言,模式识别,人脸识别,监督学习)

2）、导入`WeDiBaDis`包，建立马氏距离模型。使用`WDBdisc ()`函数建立模型。

销售状况	质量评分	功能评分	销售价格
1	8.3	4	29
1	9.5	7	68
1	8	5	39
1	7.4	7	50
1	8.8	6.5	55
1	9	7.5	58
1	7	6	75
1	9.2	8	82
1	8	7	67
1	7.6	9	90
1	7.2	8.5	86
1	6.4	7	53
1	7.3	5	48
2	6	2	20
2	6.4	4	39
2	6.8	5	48
2	5.2	3	29
2	5.8	3.5	32
2	5.5	4	34
2	6	4.5	36