小胡涂记

看书标记【R语言数据分析项目精解：理论、方法、实战 6】

看书标记——R语言

Chapter 6 变量筛选技术
- - 6.1项目背景、目标和方案
  - - 6.1.1项目背景
    - 6.1.2项目目标
    - 6.1.3项目方案
  - 6.2项目技术简介
  - - 6.2.1变量相关性
    - - 1.定类变量和定类变量
      - 2.定序变量与定类变量
      - 3.定距（连续型）变量与定距变量
      - 4.定类变量与定序变量
    - 6.2.2变量筛选
    - - 1．基于变量距离的层次聚类
      - 2.基于变量距离的模糊聚类
    - 6.2.3变量降维
    - - 1.主成分分析（PCA）
      - 2.因子分析
    - 6.2.4 R语言实例代码
    - - 1.基于变量距离的层次聚类
      - 2.模糊聚类
      - 3.主成分分析
      - 4.因子分析
  - 6.3项目实践
  - - 6.3.1变量筛选
    - 6.3.2变量降维
    - - 1.主成分分析
      - 2.因子分析

【R语言数据分析项目精解：理论、方法、实战】

Chapter 6 变量筛选技术

6.1项目背景、目标和方案

6.1.1项目背景

对底层数据做一次清洗和olap层中间数据的搭建，方便日后分析和选取。问题的提出：哪些变量是相关的？这些变量能否归类？
在统计建模中，筛选变量是前期最重要的步骤，原因：
（1）能提高魔性的稳定性
（2）能提高模型的预测能力
（3）能提高模型的运行效率
设计一套方法、开发一套程序以应对今后的变量筛选问题是有必要的，可以给业务带来更好的解释和指引，帮助查看重要变量。发起一个内部技术项目：智能化筛选和划分变量。

6.1.2项目目标

（1）基于原始变量，探究各变量之间的关系
（2）开发变量筛选的通用模块
（3）规范变量变换和变量筛选流程。

6.1.3项目方案

（1）用变量相关系数，探究变量的相关性。
（2）对变量进行分析（变量筛选：距离聚类、模糊聚类等，从原始数据及中选出子集；变量降维：主成分分析、因子分析等，通过属性间的关系以组合的方式得到新的属性，改变了原本的特征空间）
（3）总结各方法的特点和使用情况，制作智能化工具。

6.2项目技术简介

（1）有较高缺失值的变量。缺失率大于阈值80%
（2）变量大部分为常数。逻辑变量除外
（3）变量站位过多，邮政编码类的变量需考虑剔除。
以上三种数据考虑直接剔除，然后将变量分为连续型和离散型，为下一步分析做准备。

6.2.1变量相关性

1.定类变量和定类变量

λ相关系数：用定类变量解释或预测定类变量时，以众数作为标准，这样可以减少预测误差。

2.定序变量与定类变量

关于属性值的顺序之分

同序对：某对样本在两个变量上的相对等级是相同的
异序对：某对样本在两个变量上的相对等级是不同的
同分对：两个样本在某个变量上是同分。
（1）Gamma相关系数
$G=(N_s-N_d)/(N_s+N_d),N_s表示同序对，N_d表示异序对$
$N_s+N_d)$ 表示在预测或解释任何一个个案的相对等级时可能的最大误差， $N_s-N_d)$ 表示以一对个案在一个变量上的相对等级来预测其在另一个变量上的相对等级所能减少的误差。
（2）肯德尔的tau系数
有三种形式：tau-a、tau-b、tau-c。都可用于分析对称关系（两个变量都是自变量，非对称关系是指两个变量一个是自变量一个是因变量），用于计算同序对数与异序对数之差在全部可能对数中所占的比例。

三种方法的适用情形：
两变量没有同分对，tau-a
有同分对，交叉分组表行列数相等（r=c），tau-b
无论同分对和行列数，tau-c
（3）斯皮尔曼rho系数（等级相关系数）
不仅区分个案在两变量上的等级高低，还能将差异的确切数值计算出来。该算法可以消减误差比例：
$r_s=1- \frac {6\sum D^2}{n(n^2-1)}，D$ 为同一个样本不同变量之间的等级差

3.定距（连续型）变量与定距变量

两个连续型变量之间的关系可以用斯皮尔曼相关系数来描述：

4.定类变量与定序变量

lambda、tau-y系数描述。

6.2.2变量筛选

1．基于变量距离的层次聚类

首先计算各变量之间的距离，然后根据变量之间的距离进行聚类，变量距离的计算基于变量相关性，变量相关性越高，它们之间的距离就越近;反之，它们之间的距离就越远。距离和相关性之间的关系如下:
$D_{xy}=1-ρ_{xy}$
根据聚类所用的不同方法，聚类可分为层次聚类、动态聚类、模糊聚类、基于密度聚类和最大期望聚类等。常会选择层次聚类和模糊聚类这两种。
变量层次聚类的步骤是：先计算变量之间的距离，每次将距离最近的点合并到同一个类;然后计算类与类之间的距离，将距离最近的类合并为一个大类;不停地合并，直到合成一个类。其中，类与类距离的计算方法有最短距离法、最长距离法、中间距离法和类平均法等。比如，最短距离法是将类与类的距离定义为类与类之间变量的最短距离，最长距离法是将类与类的距离定义为类与类之间变量的最长距离。

2.基于变量距离的模糊聚类

在现实生活中，事物的分类往往是模糊不清、没有明显界线的。对于此类聚类问题，就需要我们借助模糊数学的理论并结合传统意义上的聚类分析方法，得到一个新的聚类方法——模糊聚类。

6.2.3变量降维

1.主成分分析（PCA）

将众多原始变量变为少数几个相互独立的线性组合形成的变量（主成分），线性组合后的的主成分方差变得最大，使得主成分之间显示出最大的个别差异性。

其中系数a要满足 $V(y_1)=a_1'\sum a_1$ 最大，此时对应第一主成分，还希望达到， $cov(y_1,y_2)=0$ .
在提取主成分后，新的主成分变量可能不太容易解释，为了尽可能地对新变量去噪，可采用主成分旋转来完成。常用的主成分旋转有两种：正交旋转（使选择的成分仍旧保持不相关，常用的正交旋转为方差极大旋转，它试图使载荷矩阵每列只有少数几个很大的载荷，其他都是很小的载荷）和斜交旋转（使选择的成分变得相关）。

2.因子分析

6.2.4 R语言实例代码

1.基于变量距离的层次聚类

（1）计算变量相关性
cor(x,y=NULL,method=‘pearson’) ##‘pearson、kendall、spearman’
（2）层次聚类
hclust(d,method) ##d为dist类数据类型，可以用as.dist()转换。向量的内积作为距离，默认为欧氏距离。层次聚类方法有：single（最短距离法）、complete（最长距离法）、median（中间距离法）、mcquitty（相似法）、average（类平均法）、centroid（重心法）和ward.D（离差平方和法）

#函数功能：依据变量相似性利用层次聚类法进行聚类
#df：原始数据，必须为数据框
#k：需要聚类的个数（可以先随便设定，然后逐步调整）
varcluster_hc<-function(mydf,k,method='average'){
    cordist<-as.dist(1-cor(mydf))   #计算变量相关性，并转换成距离对象
    hcl<-hclust(cordist,method)   #对距离进行层次聚类
    plclust(hcl,hang=-1)      #画出树状图
    rel<-rect.hclust(hcl, k, border="red")      #用红框画出分类的效果
    varnames<-c()      #输出变量类别
    for (i in 1:length(rel)){
        varnames<-c(varnames,names(rel[i][[1]]))
    }
    classid<-rep(1:k,unlist(lapply(rel,length)))
    varclass<-data.frame(varname=varnames,corclass=classid)
    return(varclass)
}
varcluster_hc(mtcars,3)    #用mtcars数据为例，分成3类，可以用碎石图等方法确定需要聚成几类

步骤为，先计算变量相关系数》计算距离并转换为dist类型调用hclust函数》生成树状图》输出变量分类结果

2.模糊聚类

#函数功能：根据相关系数矩阵，利用模糊聚类方法实现变量聚类
#mydf：原始数据，必须为数据框类型
#class_level：设定lamda的值，取值范围：-1~1.随着lamda的值越大，聚类的个数也越大。
library(plyr)
fuzzycluster<-function(mydf,class_level){
    #模糊矩阵合成
    fuzzycombine<-function(fmatrix){
       n<-nrow(fmatrix)
       rresmatrix<-matrix(,n,n)
       for (i in 1:n){
           for (j in 1:n){
              rresmatrix[i,j]<-max(pmin(fmatrix[i,],fmatrix[,j]))
            }
       }
       return(rresmatrix)
   }

   #计算模糊等价关系
   fuzzyequal<-function(fmatrix){
      n<-length(fmatrix)
      r_1<-fmatrix
      i<-0
      num<-1
      while(i==0){
        r_2<-fuzzycombine(r_1)
        if(sum(r_1==r_2)/n==1){
           i<-1
        } else{
           r_1<-r_2
           num<-num*2
        }
     }
     return(list(r_1,num))
   }

   #根据模糊等价关系得到的截矩阵，进行聚类
   classcluster<-function(r_lamda_loc){
        blist<-list()
        blist_num<-1

        while(nrow(r_lamda_loc)!=0){
            r_first<-unique(unlist(r_lamda_loc[1,]))
            bl_f<-r_first
            bl_t<-c()
            bl_2<-c()
            rowmatch_l<-c()

            while(length(bl_f)!=0){
               for (i in 1:length(bl_f)){
                  rowmatch<-which(r_lamda_loc==bl_f[i],arr.ind=TRUE)[,1]
                  bl<-unique(unlist(r_lamda_loc[rowmatch,]))
                  bl_2<-unique(c(bl_2,bl))
                  bl_t<-unique(c(bl_t,bl_f[i]))
                  rowmatch_l<-unique(c(rowmatch_l,rowmatch))
               }

              if(length(rowmatch_l)!=0){
                 r_lamda_loc<-r_lamda_loc[-rowmatch_l,]
              }

              rowmatch_l<-c()

             bl_f<-bl_2[!(bl_2%in%bl_t)]
             if(length(bl_f)==0 | nrow(r_lamda_loc)==0){
                blist[[blist_num]]<-bl_2
                blist_num<-blist_num+1
                break
             }
           }
        }
        return(blist)
   }

   if(class_level>=1){
       message("pls input class_level lower than 1!")
   }

   #计算相关矩阵
   cormatrix<-cor(mydf)

   #输出变量及对应的id
   varname<-attributes(cormatrix)[[2]][[1]]
   id<-c(1:length(varname))
   vardf<-data.frame(varname=varname,id=id)

   #计算模糊相似矩阵
   fuzzysimilarmatrix<-(1+cormatrix)*0.5

   #计算模糊等价关系
   fuzzy_matrix<-fuzzyequal(fuzzysimilarmatrix)   
   res_lamda<-fuzzy_matrix[[1]]>class_level

   #计算模糊聚类
   r_lamda_loc<-as.data.frame(which(res_lamda == 1 & lower.tri(res_lamda,diag=TRUE) == 1, arr.ind = TRUE))
   blist<-classcluster(r_lamda_loc)
   #把模糊聚类结果和变量整合，最终输出变量聚类结果
   varlist<-c()
   classlist<-c()

   for (i in 1:length(blist)){
       varnum<-blist[[i]]
       class<-rep(i,length(varnum))
       varlist<-c(varlist,varnum)
       classlist<-c(classlist,class)
   }

   class_res<-data.frame(id=varlist,fuzzyclass=classlist)
   fuzzyres<-join(vardf,class_res)
   return(fuzzyres)
}

根据模糊等价关系得到截矩阵》聚类》贪婪算法每次解决一个类别的变量聚类》循环

3.主成分分析

principal(x,nfactor=主成分个数，rotate=旋转方法(默认为最大方差旋转varimax),scores=F是否需要计算主成分得分)

library(psych)
pca_eigen<-function(df,cumproplevel=0.85){   ##cumproplevel:主成分累计贡献方差阈值
    corrx<-cor(df)   #计算相关矩阵
    colnum<-length(df)  #原始向量变量个数
    eigenresult<-eigen(corrx)   #求相关矩阵特征值和特征向量
    eigenvalue<-eigenresult$values   #求相关矩阵特征值
    eigenvector<-eigenresult$vectors
    plot(eigenvalue,type='b',main='Eigen for the Data')   #画碎石图
    abline(h=1,col='blue')
    
    prop.eigen<-eigenvalue/colnum  #计算每个主成份的方差贡献率
    cum.prop<-cumsum(prop.eigen)   #计算累计方差贡献率

    #判断达到累计贡献方差阀值的主成份个数
    if(sum(cum.prop<=cumproplevel)==0){
        tsprint<-paste("第一主成份方差贡献超过",cumproplevel*100,'%',sep='')
        principal_cnt<-1
    } else
    {
        tsprint<-paste(sum(cum.prop<=0.85)+1,"个主成份方差累计贡献超过",cumproplevel*100,'%',sep='')
        principal_cnt<-sum(cum.prop<=0.85)+1
    }

    #创建结果矩阵
    iocomponents<-matrix(rep(0,3*colnum),nrow=3,ncol=colnum)
    iocomponents[1,]<-eigenvalue
    iocomponents[2,]<-prop.eigen
    iocomponents[3,]<-cum.prop

    rowname<-c("eigenvalue","prop.eigen","cum.prop")

    colname<-c()
    for(i in 1:colnum){
       colname<-c(colname,paste("comp",i,sep=''))
    }

    dimnames(iocomponents)<-list(rowname,colname)

    #整个结果到一个列表输出
    result<-list(主成份情况=tsprint,主成分个数=principal_cnt,主成份结果=iocomponents,特征向量=eigenvector)
    return(result)
}


#用原始数据作为输入，得到主成分个数
setwd("C:\\Users\\用户路径")
pca<-read.csv("pcatest.csv",header=TRUE,stringsAsFactors=FALSE)
pca_index<-pca_eigen(pca)
##碎石图判断主成分个数

###关于主成分旋转
#用相关矩阵作为输入
pc<-principal(Harman23.cor$cov, nfactors=2,rotate='none')
pc
#用方差极大旋转法（它试图对载荷阵的列进行去噪，使得每个成分只是由一组有限的变量来解释）
rc<-principal(Harman23.cor$cov, nfactors=2,rotate="varimax")
rc
#输出主成分得分
round(unclass(rc$weights),2)

PC1：成分载荷，指观测变量与主成分的相关系数，成分载荷可用来解释主成分的含义。
h2：成分公因子方差，即主成分对每个变量的方差解释度。
u2：成分唯一性，即方差无法被主成分解释的比例(1-h2)。
SS loadings：与主成分相关联的特征值，指的是与特定主成分相关联的标准化后的方差值（在本例中，第一主成分的值为4.67）。
Proportion Var：每个主成分对整个数据集的解释程度。此处可以看到，第一主成分解释了58%的方差。
PC1=0.28height+0.3arm.span+0.3forearm+0.28lower.leg-0.06*weight（数值为标准化后的数据）

##关于主成分的R函数
###########  prcomp函数  ################
#prcomp函数是对变量矩阵(相关矩阵)采用SVD方法计算其奇异值（原理上是特征值的平方根），函数帮助中描述为函数结果中的sdev。prcomp函数输入参数为变量矩阵（x）,center中心化 默认为true，scale标准化 默认为false，建议改为true，rank主成份个数。prcomp函数输出有sdev（各主成份的奇异值），rotation（特征向量，回归系数），x（score得分矩阵）。
	iris.pca<-prcomp(iris[,-5],scale=T,rank=4,retx=T) #相关矩阵分解
	#scale表示要标准化，retx表四返回score
	summary(iris.pca) #方差解释度
	iris.pca$sdev #特征值的开方 ，平方后代表的是每个主成分可以解释的数据差异
	iris.pca$rotation #特征向量，回归系数
	iris.pca$x #样本得分score

#princomp函数：princomp以计算相关矩阵或者协方差矩阵的特征值为主要手段。princomp函数输出有主成份的sd,loading,score,center,scale.
data(wine) #三种葡萄酿造的红酒品质分析数据集
wine.pca<-princomp(wine,cor=T,scores=T) 
#默认方差矩阵(cor=F),改为cor=T则结果与prcomp相同
summary(wine.pca) #各主成份的SVD值以及相对方差
wine.pca$loading #特征向量，回归系数
wine.pca$score
screenplot(wine.pca) #方差分布图
biplot(wine.pca,scale=F) #碎石图,直接把x与rotation绘图，而不标准化

详细的Rcode可以看R语言 PAC分析与可视化.

4.因子分析

library(psych)
mtc<-mtcars[,c(1,3,4,5,6,7)]  #获取数据
corr<-cor(mtc)  #计算相关矩阵
ss<-fa.parallel(corr,n.obs=30,fa="both",n.iter=100)  #平行法碎石图
1<-ss$nfact  #确定因子个数
factanal(mtc,factors=factornum,rotation = 'varimax')   #正交旋转 因子之间独立
factanal(mtc,factors=factornum,rotation = 'promax')   #斜交旋转 因子之间相关性
fa<-factanal(mtc,factors=1,rotation = 'promax',scores = "regression")
fa$scores    #斜交旋转且输出因子得分

loadings为因子载荷矩阵，p-value对应的原假设为H0:两因子是充分的。也可以用于判断因子个数的选择合理性。

6.3项目实践

6.3.1变量筛选

#导入测试数据
tot<-read.csv(“运营指标数据.csv”)
tot_df<-tot[,-1]

#执行层次聚类和模糊聚类
corres<-varcluster_hc(tot_df,5)
fuzzyres<-fuzzycluster(tot_df,0.885)
#整合两种聚类效果
varclust<-join(fuzzyres[,-2],corres)
varclust[order(varclust $corc l a ss, v a rc l u s t$ fuzzyclass),]
##根据聚合的情况结合实际业务分析得到这些指标中最具代表性、业务上最容易解释的，制作起来最方便的指标即可。

6.3.2变量降维

1.主成分分析

library(psych)
tot<-read.csv("运营指标数据.csv")
tot_df<-tot[,-1]

#根据前面分类效果，初步变量筛选
var<-c('fltorderamount','ordercnt_outland',
       'ordercnt_atoutland','pship_uv','pgroup_uv',
       'ios_active','ordercnt','htlordercnt','trnordercnt',
       'ttdordercnt','actordercnt','uv' ,'uv_h5','fn_uv',
       'hn_uv','act_uv','bus_uv','pticket_uv','train_uv',
       'total_uid','active'
      )
tot_res<-tot_df[,var]

#得到主成分个数
pca_eigen(tot_res)

#用方差极大旋转法得到主成分得分
rc<-principal(tot_res,nfactors=4,rotate="varimax")
#输出主成分得分
round(unclass(rc$weights),2)

PC1=-0.06orderamount-0.01ordercnt_outland-0.12*ordercnt_atoutland
……

2.因子分析

library(psych)
corr<-cor(tot_res)   #计算相关矩阵
ss<-fa.parallel(corr,n.obs=30,fa="both",n.iter=100)   #平行法碎石图
factornum<-ss$nfact   #确定因子个数
factanal(tot_res,factors=factornum,rotation = 'varimax')    #正交旋转  PC actual data
factanal(tot_res,factors=factornum,rotation = 'promax')     #斜交旋转 FA actual data
#用斜交旋转，并输出因子得分（由平行碎石图判断选取方法）
fa<-factanal(tot_res,factors=factornum,rotation = 'promax',score="regression")
fa$score

3.16RabbitMQ入门实战 plusk rabbitmq 分布式
RabbitMQ基本概念：RabbitMQ是遵循AMQP（AdvancedMessageQueueProtocol）协议，即高级消息队列协议实现的，AMQP协议是一个标准协议，如果想写一个原生的消息队列的话也可以遵守该协议去开发。结合AMQP协议的模型图我们可以去理解RabbitMQ的运行机制：生产者（Publisher，图中最左边）：发送消息到交换机交换机（Exchange）：接收消息，并决定转
C语言经典算法之二叉树的后序遍历（递归实现） JJJ69 C语言经典算法算法 c语言开发语言数据结构
目录前言A.建议B.简介一代码实现二时空复杂度A.时间复杂度：B.空间复杂度：三优缺点A.优点：B.缺点：四现实中的应用前言A.建议1.学习算法最重要的是理解算法的每一步，而不是记住算法。2.建议读者学习算法的时候，自己手动一步一步地运行算法。tips：文中的（如果有）对数，则均以2为底数B.简介在C语言中，二叉树的后序遍历（PostorderTraversal）是一种按照“左子树-右子树-根节点
云原生边缘计算：分布式智能的时代黎明桂月二二云原生边缘计算分布式
引言：从集中式算力到万物智联的范式裂变AT&T边缘节点部署超5000个，特斯拉自动驾驶系统每节点200TOPS算力。国家电网通过边缘计算实现毫秒级电网故障隔离，菜鸟物流分拣效率提升400%。IDC预测2027年边缘基础设施支出将达亿，宝马汽车工厂设备预测性维护准确率达9亿运维成本。一、边缘计算范式进化论1.1算力拓扑结构演变世代大型主机中心化云计算分布式雾计算去中心化边缘计算泛在化神经形态计算体计
设计模式-责任链模式小九没绝活设计模式设计模式责任链模式 java
核心思想责任链模式通过将多个处理对象（Handler）连接成一条链，允许请求在链上传递，直到被某个对象处理或链终止。核心目标是解耦请求发送者与接收者，让多个对象都有机会处理请求，增强系统的灵活性和可扩展性。模式结构角色职责抽象处理者定义处理请求的接口（Handler），通常包含设置下一个处理者的方法具体处理者实现抽象处理者接口，判断是否能处理请求，否则传递给下一个处理者客户端创建处理链，并向链的头
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
基于51单片机设计的呼吸灯鱼弦单片机系统合集 51单片机嵌入式硬件单片机
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）基于51单片机设计的呼吸灯是一种常见的LED灯效应果，通过控制LED的亮度逐渐增加和减小，模拟人类呼吸的效果。下面将对其原理、应用场景、算法实现、代码实现等进
实现图片压缩功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于imagePackerssApi实现了图片压缩功能，并将压缩后的图片转成base64格式。开发者可将压缩后的图片用于arkui或者H5中进行图片展示。实现图片压缩功能源码链接效果预览使用说明打开应用，展示选择图片并压缩按钮，点击按钮，拉起系统相册，相册里选择图片或者拍照获取图片，选择完毕后点击完成，即可返回应用主页面，展示压缩后的图片。实现思路构造sel
在嵌入式系统中实现低功耗MQTT协议：从协议解析到硬件优化 W说编程物联网嵌入式网络编程物联网网络协议 c语言嵌入式硬件
在嵌入式系统中实现低功耗MQTT协议：从协议解析到硬件优化1.引言：物联网时代的低功耗挑战随着物联网设备的爆炸式增长，设备续航与网络可靠性成为嵌入式系统设计的核心矛盾。据统计，70%的物联网设备因功耗问题导致维护成本倍增。核心需求：在维持TCP/IP协议栈功能的前提下，将设备待机功耗降至μA级；确保弱网环境（如2G/NB-IoT）下的数据传输可靠性。本文将以MQTT协议为例，详解在STM32+LW
实现图片处理功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本项目基于OpenHarmony三方库ImageKnife进行图片处理场景开发使用：支持不同类型的本地与网络图片展示。支持拉起相机拍照展示与图库照片选择展示。支持图片单一种变换效果。支持本地/在线图片格式：JPG、PNG、SVG、GIF、DPG、WEBP、BMP实现图片处理功能源码链接效果预览使用说明下载安装根目录下的oh-package.json5中depend
实现系统分享功能鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例基于ShareKit能力实现了宿主应用分享图片的功能。开发者可结合具体业务场景设定目标应用并处理分享内容。实现系统分享功能源码链接效果预览使用说明点击“查看并下载图片”按钮，从网络上下载图片。点击“系统分享”按钮，选择图片，在底部选择shareget可拉起接受方应用，分享图片。实现思路分享图片使用request.downloadFile接口，根据开发者自己设
C# 的 abstract 关键字 visual-studio
*abstract修饰符。抽象的。描述（类、方法、属性、索引和事件）的实现不完整或未实现。如果一个类是抽象的，表明其只能为一个基类，而不能实例化。只有修饰为abstract的类才能具有修饰为abstract的成员。派生类必须完整实现其基类中未实现的方法、属性、索引和事件。下面构建一个基类（Ti）。描述不同的体需要的不同的描述方式。//////一个体。基类，必须被其他类继承。///abstractc
用结构体类型实现复数的加、减、乘、除运算，每种运算用函数完成 Stimpay c语言算法
任务描述本关任务：编程实现两个复数的加、减、乘、除运算。相关知识用函数来实现复数之间的加减乘除，有两种方法返回计算结果：使用结构体指针作函数的形参，将函数的计算结果返回；将函数的计算结果作为函数返回值返回。编程要求根据提示，在右侧编辑器补充代码，实现两个复数的加、减、乘、除运算，将函数的计算结果作为函数返回值返回，复数之间的加法、减法、乘法和除法分别用不用的函数来实现。具体要求如下：函数input
用指针实现数组元素循环移动 Stimpay 算法数据结构 c语言
任务描述本关任务：编写程序，用指针实现以下功能，n个整数存入一维数组中，将该数组循环左移m位。如一个长度为10的数组中原来的元素顺序为0123456789，则循环左移3个位置后元素的顺序为3456789012。相关知识为了完成本关任务，有两种算法思想：一种是使用辅助数组实现数据移动；另一种是不使用辅助数组，只需一个中间变量就可实现数据移动。使用辅助数组实现数据移动创建一个同样大小辅助数组，存放临时
FPGA——DDS原理及代码实现
FPGA——DDS原理及代码实现一、DDS各参数意义如图，一个量化的32点的正弦波，也就是说一个ROM里存了32个这样的数据，每次读出一个数据要1ms，分别读出1,2,3...30,31,32,共32个点，读取完整的正弦波需要1ms*32=32ms的时间该正弦波参数为>周期T=1ms*32=32ms,>频率为f=1/T=1/(1ms*(32/1))在读出一个数据时间不变（1ms）的情况下，想要让读
C++ 结构型设计模式十七12138 C++c++设计模式
C++设计模式自己理解整理笔记结构型-适配器模式适配器模式（AdapterPattern）是一种结构型设计模式，它的主要作用是将一个类的接口转换成客户希望的另一个接口，使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。适配器模式主要有两种实现方式：类适配器模式和对象适配器模式。类适配器类适配器通过多重继承实现，这种方式利用了继承优点直接调用：由于适配器类继承了被适配类，所以可以直接调用被适
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
Flutter 适配HarmonyOS NEXT：调用原生功能实现相册选取与拍照
Flutter适配鸿蒙系统：调用原生功能实现相册选取与拍照项目背景我们的移动端项目基于Flutter开发，为控制开发周期与成本，采用了HarmonyOSNEXT（简称鸿蒙）的Flutter兼容库，并更新了部分三方库为鸿蒙的Flutter兼容库。在图片视频选择与拍摄功能上，我们之前调用的是Android和iOS的原生方法，现在需要为鸿蒙开发一套原生配合使用的方案。遇到的问题鸿蒙的Flutter兼容库
申请 Let's Encrypt 的免费 TLS 证书实现网站的 https 访问 python
因为这个使用apt安装的python第三方包的版本为什么这么滞后？原因，所以我不是用sudo把证书弄到系统路径，而是选择到普通用户路径下面╭─pon@aliyun2core2GB~/certbot╰─➤tree.├──config│ ├──accounts│ │ └──acme-v02.api.letsencrypt.org│ │ └──directory│ │ └──9401598
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
多种弹窗实现方法鸿蒙示例代码
本文原创发布在华为开发者社区。介绍本示例介绍以下五种常见的弹窗场景化案例。应用启动时的隐私政策和用户协议弹窗网络请求完成的结果提示弹窗应用返回上一级页面的退出确认弹窗个人信息填写的信息弹窗应用使用过程中出现的付费类广告弹窗弹窗场景化源码链接效果预览使用说明进入应用会立马弹出一个隐私协议窗口，点同意关闭该窗口，点不同意退出应用。点击网络请求完成的结果提示弹窗，会弹出一个等待的子窗口弹窗，网络请求完毕
python面试题详解 __wishing__ python
十道经典面试题（python）1.一行代码实现累加1-100之和print(sum(range(1,101)))输出结果：5050分析：利用sum函数进行累加。range控制序列。2.一行代码实现列表去重#声明需要去重的列表list1=[1,1,2,2,3,3,4,4]list1=list(set(list1))</
golang接口用法-代码案例 JavaPub-rodert golang golang 开发语言后端
文章目录Go语言中接口（interface）的含义接口的常见应用场景示例1示例2（Dog和Cat）使用场景-多数据库Go语言中接口（interface）的含义接口在Go语言中是一种类型，它定义了一组方法的集合。一个类型只要实现了接口中定义的所有方法，就认为该类型实现了该接口。接口不关心具体的实现细节，只关心方法的签名（即方法的名称、参数和返回值类型）。接口可以看作是不同类型之间的桥梁，它允许不同类
Flink 通过 Chunjun Oracle LogMiner 实时读取 Oracle 变更日志并写入 Doris 的方案 roman_日积跬步-终至千里 #flink 实战 flink oracle 大数据
文章目录一、技术背景二、关键技术1、OracleLogMiner2、Chunjun的LogMiner关键流程3、修复ChunjunOracleLogMiner问题一、技术背景在大数据实时同步场景中，需要将Oracle数据库的变更数据（CDC）采集并写入ApacheDoris，以支持数据分析、BI报表、实时数据仓库等应用。本方案基于Flink+Chunjun，通过OracleLogMiner解析Re
Rust语言介绍和猜数字游戏的实现栖林_ Rust rust 游戏开发语言
文章目录Rust语言介绍和猜数字游戏的实现cargo是什么使用Rust编写猜数字Rust语言介绍和猜数字游戏的实现Rust语言是一种系统编程语言，核心强调安全性、并发性以及高性能，由类似于C/C++的底层控制能力，性能也非常接近，Rust有一些特性所有权系统，这个可以自动管理内存，无需垃圾回收器，保证数据的安全零成本抽象，高层抽象不会带来运行时的开销，运行时的效率会很高线程安全，在编译阶段就能防止
Webpack常见面试题总结 xiangzhihong8 React Native 前端 webpack 前端 javascript
一、谈谈你对Webpack的理解1.1背景Webpack的目标是实现前端项目的模块化，从而更高效地管理和维护项目中的每一个资源。在早期的前端项目中，我们通过文件划分的形式来实现模块化，也就是将每个功能及其相关状态数据各自单独放到不同的JS文件中。约定每个文件是一个独立的模块，然后再将这些js文件引入到页面，一个script标签对应一个模块，然后再调用模块化的成员。比如：但这种模块化开发的弊端也十分
计算机专业毕业设计指南晴天毕设课程设计毕业设计开发语言 java
毕业设计是计算机专业学生展示综合能力的重要环节，它不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将为你提供一份详细的毕业设计指南，帮助你从选题到答辩顺利完成毕业设计。如果有什么问题可以点击文章末尾名片咨询哦一、毕业设计流程概述毕业设计通常包括以下几个阶段：选题需求分析系统设计编码实现测试与优化论文撰写答辩准备每个阶段都有其重要性，下面将逐一详细说明。二、详细步骤1.选题选题是毕业设计
【C++】面向对象的三大特性：封装、继承、多态（3） _Yeps 【C++】基础知识解析 c++算法
1、面向对象的三大特性：封装、继承、多态——【C++】面向对象的三大特性：封装、继承、多态（1）详见以上链接，点击蓝字。2、C++的封装是如何实现的？——【C++】面向对象的三大特性：封装、继承、多态（2）详见以上链接，点击蓝字。3、C++的继承是如何实现的？在C++中，继承是通过:（冒号）+访问控制修饰符（public、protected、private）实现的。class父类{//父类的成员}
Java WebSocket与项目页面（通常是HTML + JavaScript）之间建立连接并传输数据 hh_fine java websocket html
JavaWebSocket与项目页面（通常是HTML+JavaScript）之间建立连接并传输数据1.创建JavaWebSocket服务器：使用JavaWebSocketAPI创建一个WebSocket服务器端点。2.在HTML页面中使用JavaScript连接WebSocket：通过JavaScript的WebSocketAPI与JavaWebSocket服务器建立连接。3.双向数据传输：实现服
《Flutter从入门到实战：手把手构建跨平台应用（万字深度解析）》前端极客探险家 flutter
目录标题前言：为什么选择Flutter？一、Flutter基础篇：环境搭建与核心概念1.1开发环境配置1.2项目结构深度解析二、核心机制：Widget与渲染原理2.1Widget树构建原理2.2状态管理方案对比三、企业级开发实战3.1工程化架构设计3.2典型功能实现四、进阶开发技巧4.1性能优化方案4.2平台特定代码集成五、项目实战：开发企业级Todo应用（深度扩展版）5.1项目初始化与工程化配置
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

看书标记【R语言数据分析项目精解：理论、方法、实战 6】

看书标记——R语言

Chapter 6 变量筛选技术

6.1项目背景、目标和方案

6.1.1项目背景

6.1.2项目目标

6.1.3项目方案

6.2项目技术简介

6.2.1变量相关性

1.定类变量和定类变量

2.定序变量与定类变量

3.定距（连续型）变量与定距变量

4.定类变量与定序变量

6.2.2变量筛选

1．基于变量距离的层次聚类

2.基于变量距离的模糊聚类

6.2.3变量降维

1.主成分分析（PCA）

2.因子分析

6.2.4 R语言实例代码

1.基于变量距离的层次聚类

2.模糊聚类

3.主成分分析

4.因子分析

6.3项目实践

6.3.1变量筛选

6.3.2变量降维

1.主成分分析

2.因子分析

你可能感兴趣的:(R语言资料实现,r语言,数据分析,开发语言)