weixin_53368990

R语言学习

文章目录

- - - 绘图基本知识
    - - 1、基本几何对象类型和映射参数
      - 2、绘图细节~标量控制
      - 3、绘图细节~文字控制
      - 4. 统计变换
      - 5. 位置调整
      - 6.坐标系
      - 7、其它
      - 8、常见绘图patterns
      - 频数分布直方图
        
        散点图——–查看两个因素之间的相关性
        
        箱线图
        
        条形图
    - 创建向量和保存向量
    - - 读取和保存文件
        
        向量命名
        
        用字符向量给保存的文件命名
        
        data.frame 转化为 list
        
        行名转换为一列
        
        了解向量结构
        
        获取特定向量（子集）
        
        构建向量（未整理）
        
        符号
    - 字符处理
    - 常见函数（未整理）
    - - 数学运算函数
        
        运行内存
    - 常见R包
    - - R包汇总
        
        dplyer包处理数据和关系数据
    - 条件执行
    - - 1. if-else结构
      - 2. ifelse结构
      - 3. switch结构
    - 循环
    - - 1、for 循环
      - 语法`for (var in seq) statement`
      - 2、其它 for 循环模式
      - 3、while 循环体
      - 函数编写
    - 统计学

Rstudio 快捷键

快捷键	定义
shift + alt + k	查看所有快捷键
Ctrl + 1/2/3/4/5/6	切换至不同的页面
ctrl + “-”	整体页面缩小
ctrl + shift + “=”	整体页面放大

绘图基本知识

1、基本几何对象类型和映射参数

geom_point(size = 3, shape = 1, data = best_in_class) # 该函数还在了一个data，与常用的geom_point()不同
geom_bin2d() #2维热图
geom_hex() # 用六边形表示的2维热图
geom_freqpoly() # 频率多边形图，binwidth = 表示
abline(data, lm(mpg~wt)) # 添加了一条最优拟合曲线，method = "lm"
geom_boxplot() # 箱线图，类似与直方图，也是需要在x轴上分组
geom_histogram() # 只有x轴需要指定
geom_line() # 按照x坐标的大小顺序依次连接各个观测值
geom_rug()# 边际地毯图
geom_density(data, aes(x = , fill = )) # 密度曲线，是否需要有y轴
geom_text() # 文本注释
geom_violin() # 小提琴图
geom_smooth()  #
geom_vline() # 竖直线
geom_hline() #函数添加参考线
geom_vline() #函数添加参考线
geom_rect() #函数在我们感兴趣的数据点周围绘制一个矩形
geom_segment()# 函数及arrow 参数绘制箭头，指向需要关注的数据点
facet_grid(am ~ vs) # 小面化
facet_wrap() # 在一个图中，分出更多的小图，每一小图为一组，以免数据全部集合在一张图上看不出区别，常用于散点图
ggpaired(ToothGrowth, x = "supp", y = "len",
         color = "supp", line.color = "gray", line.size = 0.4,
         palette = "jco")+
  stat_compare_means(paired = TRUE) # 配对并检验
aes() # 指定每个变量扮演的角色，不在aes()内的图形属性映射，则统一为一个常数
aes(x = colname1)
aes(x = data[,1]) # x指代并不一定是列名，也可以用标量
aes(group = ) #对数据进行分组，指定分组变量，可以用于x和y轴都是连续型变量情况下对数据分组

2、绘图细节~标量控制

ggpubr::show_point_shapes()  #x
xlim(10,20) # 一个从10到20的连续型标量，也可以是一个离散型标度或者日期型标度
ylim(20,10) # 一个从20到10的反转后连续型标量
expand() #控制溢出量
scale_x_continuous(breaks = seq(15, 40, by = 5), #也可以控制离散型的结果顺序
                   limits = c(12,20) #修改纳入的定义域的大小，即对纳入统计图形的变量的取值
                   ) #修改标度
scale_y_continuous() #修改标度
scale_x_discrete() # 用于因子
scale_y_discrete() # 用于因子
scale_x_log10() # 等同于scale_x_continuous(trans = "log10")
scale_x_continuous(labels = NULL) #不显示刻度标签
scale_color_brewer(palette = "Set1") ##预先指定分得清的颜色集
scale_fill_brewer(palette = "Set1")
scale_colour_hue() #离散型的默认的配色方案
scale_color_discrete() # 用于因子
scale_colour_manual(values = c(Republican = "red", Democratic = "blue"))# 数据值和颜色间的映射，用于离散型变量，对aes(colour = 变量)中colour指定颜色
scale_color_gradient(low = "white", high = "black") #或scale_fill_gradient() # 对于连续的颜色标度,low = , high = 
scale_color_gradient2() #表示分散性的颜色标度
scale_color_viridis() #来自viridis包
scale_fill_viridis()
set_default_scale() #更改默认的标度

3、绘图细节~文字控制

text(locator(1),labels="Here") #鼠标添加文本位置
identify(swiss[,1:2],labels=rownames(swiss))
labs(x = , y = , tittle = paste("xx"), subtitle = ,caption = , colour = , fill = ) #添加标题，对于colour和fill是改变图例的名称
xlab() # x轴的标签 ，注意与labels = “” 的区别
ylab() #
rotate_x_text(angle = 45) #标签旋转角度
pch = # 形状
linetype = # 线的类型，linetype = 2，表示虚线
binwidth =  ## 直方图的宽度，连续型数据在坐标轴上的分组长度（每一组的长度）
width = # 箱线图的宽度
notch = # 表示方块图是否应为缺口
se = FALSE #置信界限被抑制/去除
geom_text()
hjust=  vjust = #用于控制标签的对齐方式，共有九种组会 
geom_label()
ggrepel::geom_label_repel()#防止重叠，size= , label.size= ,的区别
theme(legend.position = "none") #不显示图例，theme(legend.position=c(.1,.8))，分别距离左侧边缘10%和底部边缘80%的部分
theme() #可以调整字体、背景、颜色和网格线，也可以分别调节
theme_bw() #theme_xx()基本主题有8种
guides() #控制单个图例的显示

plot2 <- LabelPoints(plot = plot1, points = top10, repel = TRUE) #标记出指定点的标签
## 添加标签
 ggrepel::geom_label_repel(aes(label = seurat_clusters),  #选择显示在图内的标签
                            data = class_avg, #标签数据，该数据含有x和y轴数据，以及
                            size = 5,
                            label.size = 1,
                            segment.color = NA
  )

4. 统计变换

stat_identity() #
aes(y = ..density..) #使用统计转换生成的变量，需在两边用..
aes(x = cell_type, y = ..count..)
geom_bar( mapping = aes(x = cut, y = ..prop.., group = 1) )

5. 位置调整

position="jitter" #表示点抖防止完全重复，多用于散点图中

6.坐标系

coord_cartesian(xlim = , ylim = ) #放大图形中的某部位，但是不改变标度的定义域，与xlim(limits = ) 不相同，也与标度的转换有所不同
coord_flip() #颠倒x轴和y轴
coord_trans(x = exp_trans(10), y = exp_trans(10))
coord_equal() # 控制相同标度

7、其它

dev.new() # 打开一个空白图形窗口
dev.off()# 关闭窗口
ggsave()#保存图像fig.width、fig.height、fig.asp、out.width 和out.height
save(p, file = "plot.Rdata") # 保存图形对象，这种方式使之可以再次更改,需要加file = 
load("plot.rdata") # 加载图形，以再次修改

8、常见绘图patterns

频数分布直方图

## 绘制频数直方图，观察观察数据特点，是否为直方图
MyHistogram <- function(data, #数据集
                        argu1,## 映射x轴
                        binwidth  ##设置组距
                        ){ggplot(data = data)+
    geom_histogram(aes(x = data[,which(colnames(mx) == argu1) ### 获取目标列名的标量
    ] ),
    binwidth = binwidth, ## 设置组距 
    alpha = 0.9, fill = "#69b3a2"
    )  +
    labs( x = paste0(argu1," expression (FPKM)")) +
    theme(panel.grid =element_blank())+   # 去除网格
    theme(panel.border = element_blank(),
          panel.background = element_blank()) +   ## 删去外层边框
    theme(axis.line = element_line(size=1, colour = "black"))  #绘画x和y轴
}
MyHistogram(mx,"HMGCR", 0.5)
MyHistogram(mx,"EZH2", 0.2)
MyHistogram(mx,"DNMT1", 0.2)
MyHistogram(mx,"IFNG", 0.05)
ggsave("dd.png")


### 编写函数
myHistrogram <- function(data1,argu1){  # argu1 为标量
  ggplot(data1) +
    geom_histogram(aes(x = data1[,argu1]))
}
###
MyHistogram <- function(data, #数据集
                        argu1,## 映射x轴
                        binwidth  ##设置组距
                        ){ggplot(data = data)+
    geom_histogram(aes(x = data[,which(colnames(mx) == argu1) ### 获取目标列名的标量
    ] ),
    binwidth = binwidth, ## 设置组距 
    alpha = 0.9, fill = "#69b3a2"
    )  +
    labs( x = argu1)
}

散点图——–查看两个因素之间的相关性

### 散点图-----------
ggplot(data = mx,mapping = aes( x = HMGCR, y = DNMT1))  +
  geom_point(shape = 21,position="jitter") +
  geom_smooth()+ 
  theme(panel.grid =element_blank())+   # 去除网格
  theme(panel.border = element_blank(),
        panel.background = element_blank()) +   ## 删去外层边框
  theme(axis.line = element_line(size=1, colour = "black"))  #绘画x和y轴
   

## 编写散点图函数
MyPoint <- function(data, # 数据集
                    argu1, #映射x轴
                    argu2  #映射y轴
                    ){
  ggplot(data = data,mapping = aes( x = data[,argu1], y = data[,argu2]))  +
    geom_point(shape = 21,position="jitter") +
    geom_smooth(method="lm", ## 拟合方法，默认的是
                se = FALSE) +
    labs(x = paste0(argu1," expression (FPKM)"), 
         y = paste0(argu2," expression (FPKM)")) +
    theme(panel.grid =element_blank())+   # 去除网格
    theme(panel.border = element_blank(),
          panel.background = element_blank()) +   ## 删去外层边框
    theme(axis.line = element_line(size=1, colour = "black")) +  #绘画x和y轴
  ggpubr::stat_cor(method = "pearson" #
                   )  ## 求相关系数和p值
}
MyPoint(mx, "HMGCR", "DNMT1")
MyPoint(mx, "HMGCR", "EZH2")
MyPoint(mx, "DNMT1", "EZH2")
MyPoint(mx, "EZH2", "DNMT1")
MyPoint(mx, "HMGCR", "IFNG")
MyPoint(mx, "IFNG", "EZH2")
MyPoint(mx, "IFNG", "DNMT1")
ggsave("dd.png")

箱线图

### 按组别观察，绘制箱线图

ggplot(data = mx, mapping = aes(x = mx[,"group"], y = mx[,"EZH2"])) +
  geom_boxplot(aes(color = mx[,"group"])) +
  labs(x = paste0("group"," by HMGCR expression"), 
       y = paste0("EZH2"," expression (FPKM)"),
       color = paste0("group")) +
  theme(panel.grid =element_blank())+   # 去除网格
  theme(panel.border = element_blank(),
        panel.background = element_blank()) +   ## 删去外层边框
  theme(axis.line = element_line(size=1, colour = "black")) +  #绘画x和y轴
  stat_compare_means(method = "wilcox.test" #默认的统计检验方法为"wilcox.test"，也可以用”t.test"
  )


## 编写箱线图函数
MyBoxplot <- function(data,  #数据集
                    argu1, #映射x轴，为分组信息，类别数据,通常写出“group”
                    argu2, #映射y轴
                    argu3  #指定统计检验方法，如"wilcox.test"
){
  ggplot(data = data, mapping = aes(x = data[,argu1], y = data[, argu2])) +
    geom_boxplot(aes(color = data[,argu1])) +
    labs(x = paste0(argu1," by HMGCR expression"), 
         y = paste0(argu2," expression (FPKM)"),
         color = paste0(argu1)) +
    theme(panel.grid =element_blank())+   # 去除网格
    theme(panel.border = element_blank(),
          panel.background = element_blank()) +   ## 删去外层边框
    theme(axis.line = element_line(size=1, colour = "black")) +  #绘画x和y轴
    stat_compare_means(method = argu3 #默认的统计检验方法为"wilcox.test"，也可以用”t.test"
    ) 
}
MyBoxplot(mx,"group","EZH2","wilcox.test")
MyBoxplot(mx,"group","EZH2","t.test")
MyBoxplot(mx,"group","DNMT1","wilcox.test")
MyBoxplot(mx,"group","DNMT1","t.test")
MyBoxplot(mx,"group","IFNG","wilcox.test")
MyBoxplot(mx,"group","IFNG","t.test")
ggsave("ddd.png")


### 两组之间比较
### 按组别观察，绘制箱线图

ggplot(data = mx, mapping = aes(x = mx[,"group"], y = mx[,"EZH2"])) +
  geom_boxplot(aes(color = mx[,"group"])) +
  labs(x = paste0("group"," by HMGCR expression"), 
       y = paste0("EZH2"," expression (FPKM)"),
       color = paste0("group")) +
  stat_compare_means(method = "wilcox.test" #默认的统计检验方法为"wilcox.test"，也可以用”t.test"
  )


## 编写箱线图函数
MyBoxplot <- function(data,  #数据集
                    argu1, #映射x轴，为分组信息，类别数据,通常写出“group”
                    argu2, #映射y轴
                    argu3  #指定统计检验方法，如"wilcox.test"
){
  ggplot(data = data, mapping = aes(x = data[,argu1], y = data[, argu2])) +
    geom_boxplot(aes(color = data[,argu1])) +
    labs(x = paste0(argu1," by HMGCR expression"), 
         y = paste0(argu2," expression (FPKM)"),
         color = paste0(argu1)) +
    stat_compare_means(method = argu3 #默认的统计检验方法为"wilcox.test"，也可以用”t.test"
    ) 
}
MyBoxplot(mx,"group","EZH2","wilcox.test")
MyBoxplot(mx,"group","EZH2","t.test")
MyBoxplot(mx,"group","DNMT1","wilcox.test")
MyBoxplot(mx,"group","DNMT1","t.test")
MyBoxplot(mx,"group","IFNG","wilcox.test")
MyBoxplot(mx,"group","IFNG","t.test")
ggsave("ddd.png")

MyBoxplot(mx,"group","HMGCR","wilcox.test")

条形图

## 用条形图也可以观察因子变量的频数分布
ggplot(data = phe, mapping = aes(x = cell_type)) +
  geom_bar(aes(fill = cell_type)) +
  labs(y = "the numer of cells") +
    theme(panel.grid =element_blank())+   # 去除网格
    theme(panel.border = element_blank(),
          panel.background = element_blank()) +   ## 删去外层边框
    theme(axis.line = element_line(size=1, colour = "black")) +  #绘画x和y轴
  theme(axis.text.x = element_text(angle = 45,size = 8))+
  coord_flip()
## 编写函数
MyBar <- function(data,   #数据集
                  argu1 #映射x轴，x为无序类型数据
){
  ggplot(data = data, mapping = aes(x = data[,argu1])) +
    geom_bar(aes(fill = data[,argu1])) +
    labs(x = paste0(argu1),
         y = "the numer of cells",
         fill = paste0(argu1) ) +
    theme(panel.grid =element_blank())+   # 去除网格
    theme(panel.border = element_blank(),
          panel.background = element_blank()) +   ## 删去外层边框
    theme(axis.line = element_line(size=1, colour = "black")) +  #绘画x和y轴
    theme(axis.text.x = element_text(angle = 45,size = 8))+
    coord_flip() 
}
MyBar(phe,"cluster")
MyBar(phe,"cell_type")
ggsave("bar1.png")

### 按count大小排序
ph1 <- phe %>% 
  count(cell_type) #先获取count数据
ggplot(data = ph1, mapping = aes(x = reorder(cell_type, n), y = n)) +
  geom_bar(aes(fill = cell_type), stat = "identity") +
  labs(y = "the numer of cells") +
  theme(axis.text.x = element_text(angle = 45,size = 8))+
  coord_flip()
## 编写函数

创建向量和保存向量

读取和保存文件

{
options(stringsAsFactors = FALSE )
setwd("D:\\R_analysis\\scRNA")
library(tidyverse)
library(ggpubr)
library(nycflights13)
library(stringr)
library(forcats)
}
setwd() # 设置工作路径
gene <- read.csv("gene.csv",header = TRUE)
matrix <- read.csv("symbol.LIHC.tumor.FPKM_no1.csv", row.names = 1, header = TRUE) 

### 读取Rdata格式
load("HCC_log_tpm_expression_matrix.Rdata")

### 读取txt格式，使用read.table()，使用read.csv()读取txt会失去数据结构

###读取csv格式用read.CSV

files=dir()                             #获取目录下所有文件
files=grep("txt$", files, value=T)      #提取.txt结尾的文件
rm(object) #变量名
rm(list = ls())
options(stringsAsFactors = FALSE ) # 非自动将字符转换为因子
read.table(file.choose(),##读取文件，以弹出模式
           skip = 1,##  跳过前面行，是把需要变为列名的一行之下，如第85行变为列名，则需要编写为skip = 86) 
           row.names = 1, # 第一列为行名
           sep = "", ## 字符以空格分开
           header = TRUE # 第一行变为列名
)

### data.tableb
TestDT <- fread("test.txt", sep = "\t",header = FALSE, na.strings = "NA")

向量命名

rename(data, colnames == colnamse2, ...) # 改变列名
colnames(rslt1) <- c("GSVA_score", "GSVA_score1")

用字符向量给保存的文件命名

d <- c("dgh","dg")
write.csv(d,file = paste0(d[1],"csv", collapse = ".")) #文件名为dgh.csv

data.frame 转化为 list

我们要实现如下转化

每一列作为list的一个元素
每一行作为list的一个元素
对行进行分组，每一组作为list的一个元素

df <- data.frame(x=1:4,y=2:5,z=rep(1:2,2))
a <- as.list(df) # 每一列对应list的一个元素
b <- list(df) # 一整个数据框成为list的一个元素
c <- split(df, 1:4) # 每一行作为list的一个元素
d <- split(df, df$z) # 按照z列进行分组

行名转换为一列

targetedGeneName_group$patient <- row.names(targetedGeneName_group) #获取分组数据，并加入一列patient，以便后续合并

了解向量结构

head() #查看前五行
tail() #查看最后五行
str()  #
attributes()

获取特定向量（子集）

构建向量（未整理）

# 构建向量 ----

c() # 创建单个向量（仅包含一种类型的元素），若书输入了不同的元素，都会统一转换为最复杂的元素类型
dim(x) <- c(a, b, ... )# 赋予向量x的维度
matrix(data = ,nrow = ,ncol = ) #构建x行有列的矩阵
array(c(), dim = ) # 构建一个n维数组
list() # 列表,()里面还可以包含list，不会自动向量循环
geneList=list() #创建一个空的list
data.frame() # 
b <- data.frame(c(1,4,5),c("dg","dhfa", "dagj"), stringsAsFactors = T) #StringAsFactors = F, 表示不要转化为l
tibble(colnames =, colnames2 = , ....) # 用创建tibble,是数据框来的
tribble(~x,~y,~z,) #
print(data,n = 10, width = Inf) # 打印10行，所有列
rename(data, colnames == colnamse2, ...) # 改变列名
select(data, colname1, colnames2, everything()) #将一些指定的列放在前面
colnames(data_HMGCR_GROUP) <- colnames2 # 不会说把colnames(data_HMGCR_GROUP) <- 赋值给data_HMGCR_GROUP
fix(data) # 交换出互动编辑器来改动
colnames(data)=data[1,] # 第一行变成列名
rbind() # 加入一行
unite(mtcars, "vs_am", vs, am) #多列合成一列
factor(x, levels = y) #创建因子，x为需要转变为因子的向量，y为涉及好顺序的列表
as.factor() # 与上个factor的区别
readr::parse_factor() # 可以显示错误信息
intersect() #取向量之间的交集
union() # 并集
setdiff(x, y) # 找x中不同于y的元素
setequal(x, y) # 判断x与y是否相同
levels(x) <- C("A","B") # 了解x中的排序 
purrr::set_names() # 向量命名
dplyr::filter() #函数在tibble 中筛选行。
x[] # 取子集函数，x为向量,[]内可以为数值向量，逻辑向量，命名向量“”，对应高维“，”则取列
x[[]] # 只提取单个元素,在列表中用与[]区别更加重要。[]在列表中取子集的结果依然是列表,而[[]]则会从列表中删除一个层次等级.x[[1]][[1]]
data[[]][] #先在列表中取出一个向量，再次对去除的向量取一个元素
x$ # 等同于[[]]
  .$ #为在管道中取子集
  a<-c()
for(i in 1:n){
  a<-c(a,i)
} ##在向量中加入单个元素
str() # 重点关注列表结构
sort() # 对向量内的元素进行排序
attr() # 函数来读取和设置单个特性值
attributes() #函数同时查看所有特性值
stringr::str_
wrap() #函数来自动换行
writeLines() #写出字符
is.vector() #用来测试某个对象是否为原子型向量。


# as.logical()、as.integer()、as.double() 或as.character() 向量转换

# 一般可以通过比较运算符来构建逻辑向量
1:10 %% 3 == 0
c(TRUE, TRUE, FALSE, NA)

符号

# 常见符号以及意义----
c(x : y) #x到y的整数
na.rm = TRUE/FALSE #是否去除NA
# 符号
Inf #为最大值，无穷大值，或者 最靠边的值，和+Inf一样
-Inf #
\n # 手动为标签符号文本换行
"a\b" # 即a和b分为为不同行，注意加“”
# 算术运算符：+、-、*、/、^
# 模运算符：%/%（整数除法） 和 %% （求余）
# 比较运算符号> , >= , < , <=,!=, == 
# 布尔运算符：& 表示“与”、| 表示 “或”、! 表示“非”
x %in% y #x 是y 中的一个值
NA # 逻辑型
NA_integer_ # 整型
NA_real_ # 双精度型
NA_character_ # 字符型
!is.na(x) # 取向量x中所有非取石值，结果为逻辑型向量

字符处理

# 字符处理-----
starts_with("abc") #匹配以“abc”开头的名称
ends_with("xyz") #匹配以“xyz”结尾的名称。
contains("ijk") #匹配包含“ijk”的名称。
matches("(.)\\1") #选择匹配正则表达式的那些变
num_range("x", 1:3)#匹配x1、x2 和x3
# 字符串取子集，与上面的匹配不一样
str_sub(data, start, end) #，若是负数则表示从后往前数
str_to_lower() #函数将文本转换为小
str_to_upper()
str_to_title()
str_sort() 
str_order() 
str_sort(x, locale = "en") # 英语
gsub("-", "_", cell_prop[,1]) # 将字符串中的-替换为_


grep("OX",rownames(cells_AUC@assays@data$AUC),value = T)  # 返回含有“OX"d
#parse_*()函数族


\ # 想要在字符串中包含一个单引号或双引号，可以使用\ 对其进行“转义”
#\\ #如果想要在字符串中包含一个反斜杠，就需要使用两个反斜杠：\\
# writeLines() #这个打印与print()的区别,去掉字符串两边的""
#\n 换行符和制表符\t，
str_length() # 每个字符串的长度
str_c("x", "y", ....) # 组合两个或更多字符串，没有sep=等于默认没有间隔
str_c("x", "y", sep = ", ") #使用sep 参数来控制字符串间的分隔方式
str_replace_na(x) #是NA转换为"NA",即成为字符串
str_c(c("x", "y", "z"), collapse = ", ") # 将字符向量合并为字符串，可以使用collapse() 函数
str_view(x, "an")
str_view(x, ".a.") # 可以匹配任意字符（除了换行符）

常见函数（未整理）

# 常见函数以及其意义-----
names(xx) <- x # 命名，只是names(xx)的话只是展现xx的名称属性，只是敲xx的话，同时显示其名称属性（有的话）
names(xx) <- NULL #删除名称属性
identical(colnames(matrix),rownames(HCC_cell_metadata)) ##判断两个数据框的其中一个行名和令一个的列名是否
which(row.names(data3)== "NA.1") #which()查找原子向量中某些元素地标量
names() # 显示名称
typeof() # 确定向量的类型
class() # 与typeof() 有一定区别,class()是其属性，属性有三种：名称，维度，类
unclass() #查看R是如何存储因子，展现list的内容

sapply(fit, class)#返回该类每个成分的对象
unlist() #将一个向量列表转换为单个向量
purrr::flatten_dbl() # 更加严格的转换方式
length() # 确定向量的长度,对应数据框则告知列的数量，对应list则告知
ncol() # 向量的列的数量
vector(modle,lth) #向量类型，长度
seq_along() #在for循环中用到
seq(x,y, by = n) #x 与y 之间按n长度分割
cut() #函数将连续型变量转换为分类变量
dplyr::near() #容忍一些数据误差
mean(x)# 取均数
median()# 求中位数
sd()# 标准误差
IQR()# 四分位距
mad() # 绝对中位差
# 秩的度量：min(x)、quantile(x, 0.25) 和max(x)
# 定位度量：first(x)、nth(x, 2) 和last(x)
n_distinct(x) 计算出唯一值的数量
not_cancelled %>% count() # 
# 逻辑值的计数和比例：sum(x > 10) 和 mean(y == 0)
rank(desc(arr_delay)) #rank()与运算符
# cumsum()、cumprod()、 commin() 和cummax() ：计算累加和、累加积、累加最小值和累加最大值的函数
# 对数函数：log()， log2() 和log10()
rep(x,n) # x重复n 次，x可以为一个元素，也可以是一种向量。each=n表示第一个元素先重复n次，再下一个
rnorm() #
sample(x, size, replace = FASLE/TRUE) #在0至x之间取size个整数
runif(n,min = x, max = y) #随机在x与y之间选举n个数
n <- sum(is.na(df)) #数据框中的缺失值数量
is.na() # 判断一个元素是否为缺失值
sum(is.na()) #判断缺失值的个数
is.finite()
is.infinite()
is.nan()

数学运算函数

apply(x, MARGIN, FUN, ...) #对数据框的全部行或列进行运算，margin = 1 表示行，margin = 2 表示列。trim=0.2 表示忽略最高和最低20%的数据
sweep() #
stack()
aggregate()
transform()
lapply() #

运行内存

pryr::object_size() # 查看占内存大小
gc() #释放内存
memory.size()
memory.limit()

常见R包

R包汇总

名称	功能
ggpubr	绘图；加入检验统计数值

dplyer包处理数据和关系数据

### dplyr包处理数据和关系数据-----
filter(data, colnames == xx, colnames == xe, ....)# 双等号（==）后面可以观测值，也可以是表达式
filter(flights, month == 11 | month == 12) ### 不能携程 month == 11 | 12
filter(flights, month %in% c(11, 12)) # 这种格式就可以不用到==
filter(flights, !(arr_delay > 120 | dep_delay > 120)) #只要函数名在表达式中即可
arrange(data, colnames, colnames2, ....) # 对数据框中的行按一定方式排序，与sort()区别是什么？
arrange(flights, desc(arr_delay)) # 在列名前加desc（）则改变为降序
select(data, colnames, colnames2, ...) #在该数据框中选出指定的列成为新的数据框
select(flights, year:day) # 选择“year”和“day”之间的所有列
select(flights, -(year:day)) # 加了-表示 选择不在“year”和“day”之间的所有列（不包括“year”和“day”）
select(flights, time_hour, air_time, everything()) # 改变列的先后顺序，即air_time排列在第一列
mutate(data, new_colnames = xx, new_colnames2 = ,...) #增加新变量
transmute() # 添加新变量且只保存新变量的新数据框
min_rank(y) # 在同样的位置上标记排列顺序而已
min_rank(desc(y))
row_number(y)
dense_rank(y)
percent_rank(y)
cume_dist(y)
group_by(data, colnames =xx, colnames2 = xxx, ...) # 在数据框中按某些变量或着其组，分为组，虽没有生成新数据框，但是告诉数据框哪些行成为一组
group_by(data, colnames =xx, colnames2 = xxx, ...) %>% summarise(count = n(), colnames3 = mean(colnames3, na.rm = TRUE), colnames3 = sum(colnames3)) #先分组后在按变量对每一组的某一变量统计,na.rm = TRUE表示去除缺失值
sum(!is_na()) # 非缺失值的计数
daily %>% ungroup() #取消分组，()内什么都不用填

## 处理关系数据重要的是发现每个table中的各自主键和外键，以及是否需要代理键。留意重复键
left_join(x, y, by = "xxx") #保存x表
right_join()
full_join() # 保存x和y中的所有观测值，没有匹配则用NA填充
inner_join(x,y, by = "xx") # 内链接，得到的是一张新table
left_join(x, y, by = NULL) # 或者不填by，是自然链接，使用所有公共变量
left_join(x, y, by = c("a" = "b")) 
semi_join(x, y)# 保留x 表中与y 表中的观测相匹配的所有观测。
anti_join(x, y)# 丢弃x 表中与y 表中的观测相匹配的所有观
anti_join() #检查外键是否与另一张表的主键相匹配
intersect(x, y) # 返回既在x 表，又在y 表中的观测。
union(x, y) # 返回x 表或y 表中的唯一观测。
setdiff(x, y) # 返回在x 表，但不在y 表中的观测。

条件执行

1. if-else结构

语法：if (cond) statement

if (cond) statement1 else statement2

示例：

if (is.character(grade)) grade <- as.factor(grade) # statement是grade <- as.factor(grade)
if (!is.factor(grade)) grade <- as.factor(grade) else print("Grade already
is a factor")
#或者
if (!is.factor(grade)){
 grade <- as.factor(grade)
} else{
print("Grade already
is a factor")}

2. ifelse结构

语法：ifelse(cond, statement1, statement2)

示例：

ifelse(score > 0.5, print("Passed"), print("Failed"))
outcome <- ifelse (score > 0.5, "Passed", "Failed")

3. switch结构

语法：switch(expr, ...)

循环

1、for 循环

语法`for (var in seq) statement`

案例一，原子向量

df <- tibble(
  a = rnorm(10),
  b = rnorm(10),
  c = rnorm(10),
  d = rnorm(10)
)
output <- vector("double", ncol(df)) # 1. 输出.或是循环过程用到向量前面没有的话，需要创建一个空的向量，用vector()函数
for (i in seq_along(df)) { # 2. 序列。seq_along()取出向量的所有标量，并且每循环一次i的值是有所不同的。
  output[[i]] <- median(df[[i]]) # 3. 循环体
}  #注意不要漏掉括号和大括号
output

这一段代码output[[i]] <- median(df[[i]])中的i是代表向量中的标量，从而指定赋值在向量中的具体位置

案例二，数据框，合并函数

df <- tibble(
  a = rnorm(10),
  b = rnorm(10),
  c = rnorm(10),
  d = rnorm(10)
)
rescale01 <- function(x) {
  rng <- range(x, na.rm = TRUE)
  (x - rng[1]) / (rng[2] - rng[1])
}
df$a <- rescale01(df$a)
df$b <- rescale01(df$b)
df$c <- rescale01(df$c)
df$d <- rescale01(df$d)

# 更改为for循环体
df <- tibble(
  a = rnorm(10),
  b = rnorm(10),
  c = rnorm(10),
  d = rnorm(10)
)
rescale01 <- function(x) {
  rng <- range(x, na.rm = TRUE)
  (x - rng[1]) / (rng[2] - rng[1])
}
for (i in seq_along(df)) {  #数据框，这是表示列数
df[[i]] <- rescale01(df[[i]]) #这里的i如何理解？
}

2、其它 for 循环模式

for (nm in names(xs))  #names(xs)提取数据框中的列名，用名字继续循环

3、while 循环体

语法：while (cond) statement

while (condition) {
# 循环体
} #由条件和循环体两部分构成

for (i in seq_along(x)) {
# 循环体
}
# 等价于
i <- 1
while (i <= length(x)) {
# 循环体
i <- i + 1 #注意是循环体末尾需要加入该语句
}

for 循环和 while循环的区别

for循环中的条件是判断序列是否执行完，而序列终究是有限的。而while循环中的条件确实可以随意构建，只要statement中的变量值依旧不能在condition中为加，则一直会执行statement。故while可以无限循环，需要涉及好condition，防止计算机停不下来。
while可以改造为for循环，但是for循环不一定能够变为while循环。
for中的i在statement中自动+1，即i <- i +1

函数编写

### 函数基本格式 ----
f <- function(){
    ## Do something interesting
}

统计学

##注意变量分为离散型、有序和连续型
summary()#函数来获取描述性统计量
sapply(x, FUN, options)#
apply(array, margin, ...)#
fivenum() #
describe() #Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数，以及五个最大的值和五个最小的值
stat.desc(x, basic=TRUE, desc=TRUE, norm=FALSE, p=0.95) #来源pastecs包
aggregate()# 分组获取描述性统计量
by(data, INDICES, FUN) # 可以一次返回若干个统计量
table()#函数生成简单的频数统计,table(A, B),，xtabs()
prop.table() #将这些频数转化为比例值,使用prop.table()*100转化为百分比
with()
t.test() #获取置信区间

# 检验方法
compare_means(formula, data, method = "wilcox.test", paired = FALSE,
              group.by = NULL, ref.group = NULL, ...) # 均值比较和检验
stat_compare_means(mapping = NULL, comparisons = NULL hide.ns = FALSE,
                   label = NULL, #指定一个字符串，表示标签类型。可为：“p.signif”（显示显著性水平），“p.format”（显示格式化的P值）
                   label.x = NULL, label.y = NULL, #指定一个数值，表示显示标签的绝对坐标位置
                   ...)#对ggplot2的扩展，可将均值比较后的P值添加到ggplot图形中，如箱形图、点图、条形图和折线图等
t.test(measure1,mu=0.58,alternative="greater")# 单样本均值检验
t.test(y ~ x, data) #独立样本的t检验，均值,y为数值型向量，x为二分型向量
t.test(y1, y2，var.equal=F) #y1和y2均为数值型向量
var.equal=TRUE #假定方差相等
t.test(y1, y2, paired=TRUE) # 非独立样本的t检验，with(UScrime, t.test(U1, U2, paired=TRUE))
cor(as.numeric(fat),as.numeric(situation),method="spearman") #计算相关性
cor(height,weight)
cor.test.2.sample()#两个样本
cov() # 计算协方差
sigma2.test(weights,var0=10) #单样本的方差检验
var.test(measure.SPORT.1,measure.SPORT.0)
prop.test(10,147,0.1,alternative="less",correc=FALSE) #比例的检验
binom.test(10,147,0.1,alternative="less")#小样本
chisq.test()# 独立性的卡方检验
shapiro.test(data1$express) #正态分布检验

omparisons = NULL hide.ns = FALSE,
label = NULL, #指定一个字符串，表示标签类型。可为：“p.signif”（显示显著性水平），“p.format”（显示格式化的P值）
label.x = NULL, label.y = NULL, #指定一个数值，表示显示标签的绝对坐标位置
…)#对ggplot2的扩展，可将均值比较后的P值添加到ggplot图形中，如箱形图、点图、条形图和折线图等
t.test(measure1,mu=0.58,alternative=“greater”)# 单样本均值检验
t.test(y ~ x, data) #独立样本的t检验，均值,y为数值型向量，x为二分型向量
t.test(y1, y2，var.equal=F) #y1和y2均为数值型向量
var.equal=TRUE #假定方差相等
t.test(y1, y2, paired=TRUE) # 非独立样本的t检验，with(UScrime, t.test(U1, U2, paired=TRUE))
cor(as.numeric(fat),as.numeric(situation),method=“spearman”) #计算相关性
cor(height,weight)
cor.test.2.sample()#两个样本
cov() # 计算协方差
sigma2.test(weights,var0=10) #单样本的方差检验
var.test(measure.SPORT.1,measure.SPORT.0)
prop.test(10,147,0.1,alternative=“less”,correc=FALSE) #比例的检验
binom.test(10,147,0.1,alternative=“less”)#小样本
chisq.test()# 独立性的卡方检验
shapiro.test(data1$express) #正态分布检验

你可能感兴趣的:(r语言,生物信息学,1024程序员节)

R语言中的函数32：seq_along() zoujiahui_2018 #R语言中的函数 r语言开发语言
介绍seq_along函数在R语言中用于生成一个整数序列，其长度与给定对象的长度相同。这个函数特别有用，当你想要创建一个索引序列来遍历一个向量或列表时。用法seq_along(x)参数x:任何R对象（如向量、列表等）。返回值:返回一个从1到x的长度的整数序列。示例#创建一个向量vec<-c("a","b","c")#使用seq_along生成索引indices<-seq_along(vec)pri
使用R语言绘制山脊图的ggridges包心之飞翼 r语言开发语言 R语言
使用R语言绘制山脊图的ggridges包山脊图（ridgeplot）是一种用于可视化多个分布或变量之间关系的图表类型。在R语言中，可以使用ggridges包来创建漂亮的山脊图。本文将介绍如何使用ggridges包绘制山脊图，并提供相应的源代码供参考。首先，确保已经安装了ggridges包。可以使用以下代码来安装：install.packages("ggridges")安装完毕后，加载ggridge
Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
$ operator is invalid for atomic vectors什么意思滚菩提哦呢
"$operatorisinvalidforatomicvectors"意思是在对原子向量使用"$"操作符时是无效的。"$"操作符是R语言中用于访问数据框(dataframe)中的列的常用操作符。但是，原子向量(atomicvector)是R中的一种基本数据类型，它是一个长度固定的向量，并且所有元素都是相同的数据类型。因此，在对原子向量使用"$"操作符时是无效的，因为原子向量没有列的概念。例如，下
5-R循环 qwy715229258163 R语言 r语言 python 算法
R循环有的时候，我们可能需要多次执行同一块代码。一般情况下，语句是按顺序执行的：函数中的第一个语句先执行，接着是第二个语句，依此类推。编程语言提供了更为复杂执行路径的多种控制结构。循环语句允许我们多次执行一个语句或语句组，下面是大多数编程语言中循环语句的流程图：R语言提供的循环类型有:repeat循环while循环for循环R语言提供的循环控制语句有：break语句Next语句循环控制语句改变你代
R语言可视化散点图实战：为每一个数据点都绘制指示线段或者都不绘制、ggrepel包 statistics.insight r语言开发语言数据挖掘机器学习
R语言可视化散点图实战：为每一个数据点都绘制指示线段或者都不绘制、ggrepel包目录R语言可视化散点图（scatterplot）、为每一个数据点都绘制指示线段或者都不绘制、ggrepel包来帮忙#ggrepel包的安装和加载#为每一个数据点都绘制指示线段或者都不绘制#文本标签相互排斥，远离数据点，远离绘图区域（面板）的边缘。#ggrepel包的安装和加载#从CRAN安装install.packa
三菱PLC大型项目实战指南：从零基础到成功实施 Mountain and sea 三菱plc入门系列学习自动化
三菱PLC大型项目实战指南：从零基础到成功实施作为一名刚入门的电气工程师，想要通过一个大型项目来实践三菱PLC可能会感到有些挑战，但这是一个非常有意义的过程。以下将详细介绍如何从零基础开始，一步步完成一个大型项目，并最终成功实施。一、前期准备学习基础知识了解PLC的基本组成：首先，熟悉三菱PLC的基本结构，包括中央处理单元（CPU）、程序存储器、数据存储器和输入输出端口。掌握Ladder语言：三菱
22章9节：使用 R Markdown 和 Shiny 结合R语言进行数据报告和交互式应用的创建 DAT｜R科学用R探索医药数据科学 r语言开发语言大数据人工智能 r语言-4.2.1
R语言是数据科学领域中广泛应用的编程语言之一，它的强大之处不仅在于数据分析能力，还体现在其丰富的可视化和报告生成功能上。在数据分析的过程中，生成报告、展示结果和与他人共享工作成果是非常重要的任务。Shiny是一个用于构建交互式Web应用的R包，它能够将R语言的分析能力与动态、互动的Web界面结合起来，允许用户与数据交互、实时更新结果。在本文中，我们将探讨如何使用RMarkdown和Shiny结合R
Java虚拟机：JVM介绍啊Q老师 #JVM篇 Java开发技术从零到壹 JVM概述 JVM架构
1024程序员节日快乐！愿您我的代码永远没有bug，人生永远没有bug！JVM概述JVM架构概述JVM（JavaVirtualMachine，Java虚拟机），是Java语言的运行环境，是运行所有Java程序的抽象计算机（一个虚构出来的计算机，通过在实际的计算机上仿真模拟各种计算机功能来实现）。JVM的主要功能是执行Java字节码，JVM是Java程序的中间表示形式，是Java程序从源代码到实际运
4-R判断语句 qwy715229258163 R语言 r语言 python 开发语言
R判断语句判断结构要求程序员指定一个或多个要评估或测试的条件，以及条件为真时要执行的语句（必需的）和条件为假时要执行的语句（可选的）。下面是大多数编程语言中典型的判断结构的一般形式：R语言提供了以下类型的判断语句：if语句if…else语句switch语句1.if语句一个if语句由一个布尔表达式后跟一个或多个语句组成。语法格式如下：if(boolean_expression){//布尔表达式为真将
ProtoBuf 官方文档（二）- 语法指引（proto2） n大橘为重n C++ProtoBuf protobuf rpc 序列化数据结构
翻译查阅外网资料过程中遇到的比较优秀的文章和资料，一是作为技术参考以便日后查阅，二是训练英文能力。此文翻译自ProtocolBuffers官方文档LanguageGuide部分翻译为意译，不会照本宣科的字字对照翻译以下为原文内容翻译语法指引（proto2）本指南介绍如何使用protocolbuffer语言来构造protocolbuffer数据，包括.proto文件语法以及如何从.proto文件生成
R语言机器学习与临床预测模型77--机器学习预测常用R语言包武昌库里写JAVA 面试题汇总与解析 spring log4j java 开发语言算法
R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的R语言学习资料都在这里，快来收藏关注【科研私家菜】01预测模型常用R包常见回归分析包:rpart包含有分类回归树的方法;earth包可以实现多元自适应样条回归;mgev包含广义加性模型回归;Rweka包中的MSP函数可用于回归。pls包中的plsr函数实现偏最小二乘和主成分回归。stats包中的ppr函数实现投影寻踪分析，同时包括线性回归的方
Perl 语言入门学习指南：探索高效脚本编程的奥秘我的运维人生简约运维 perl Perl编程脚本语言文本处理 Perl基础语法
引言Perl，全称PracticalExtractionandReportLanguage，是一种功能强大的编程语言，特别擅长于文本处理、报告生成以及系统自动化管理任务。自1987年诞生以来，Perl凭借其灵活性、强大的内置功能库和广泛的社区支持，在Web开发、生物信息学、网络管理等多个领域发挥着重要作用。本文旨在为初学者提供一份Perl语言入门学习指南，帮助大家快速掌握这门强大的脚本语言。一、P
R语言文本分析天龙八部 waterHBO R语言 r语言开发语言
起因，目的:前面有人对“倚天屠龙记”进行分析，我这里只是进行模仿而已。完整的文件，已经绑定了，反正读者可以找一下。案例背景小说《天龙八部》是金庸先生所著的武侠小说，也是“射雕三部曲”的前传。全书共50章，字数超过一百万字。故事发生在北宋末年，以大理国、大辽、西夏、吐蕃和北宋五国之间的纷争为背景，讲述了乔峰、虚竹、段誉三位主角的江湖恩怨和爱恨情仇。小说中融入了丰富的历史元素和深刻的人生哲理，展现了人
ggalign：热图等复杂组合图及图形数据对齐的 ggplot2 扩展万木春❀ r语言
ggalign一个R语言绘图工具ggplot2的高级扩展，它专注于在多个图形之间对齐观察值，利用vctrs包中的“numberofobservations”或NROW()函数，确保图形组织的一致性。无论是自包含排序图形的对齐，还是在多个图形中应用一致的分组和排序（如k-means聚类），ggalign都可以帮助简化这一过程。文档：Aggplot2ExtensionforConsistentAxis
R语言数据分析案例：使用R进行销售数据分析 ByteWhisper r语言数据分析开发语言 R语言
R语言数据分析案例：使用R进行销售数据分析数据分析在现代业务决策中起着重要的作用。R语言作为一种功能强大且广泛使用的数据分析工具，为分析师提供了许多有用的功能和库。在本案例中，我们将使用R语言来分析销售数据，帮助我们了解销售趋势、客户行为以及产品表现。首先，让我们导入所需的库，并加载我们的销售数据集。#导入库library(dplyr)library(ggplot2)#加载数据集sales_dat
gseapy python包GO、KEGG富集(注释)分析 loong_XL 生信 python golang 开发语言
文档案例参考：https://gseapy.readthedocs.io/en/latest/gseapy_example.html#Over-representation-analysis-by-Enrichr-web-services简介：富集分析是一种常见的生物信息学分析方法，通过比较一个给定的基因集（如一组显著差异表达基因）与已知的生物过程、通路或功能的数据库，来发现哪些过程、通路或功能与
R语言如何对excel数据进行操作安宁ᨐ r语言 excel 开发语言
在R语言中，可以使用`readxl`包来读取和操作Excel数据。首先，需要安装`readxl`包，可以使用以下命令安装：```install.packages("readxl")```安装完成后，加载`readxl`包：```library(readxl)```读取Excel文件：```data<-read_excel("path_to_excel_file.xls")```其中，`path_t
使用R语言进行数据框操作代码创造者 r语言开发语言 R语言
使用R语言进行数据框操作数据框（DataFrames）是R语言中一种常用的数据结构，它类似于表格，可以用于存储和处理结构化数据。本文将介绍如何使用R语言进行数据框的操作，包括创建数据框、添加和删除列、选择和过滤数据等常见操作。创建数据框首先，我们需要了解如何创建一个数据框。下面的代码演示了如何使用data.frame函数创建一个包含学生信息的数据框：#创建数据框students<-data.fra
Java 大视界 -- Java 大数据在生物信息学中的应用与挑战（67）青云交大数据新视界 Java 大视界大数据生物信息学基因序列分析蛋白质结构预测数据质量计算资源机器学习
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Rust代写 OCaml代做 Go R语言 SML Haskell Prolog DrRacket Lisp matlabgoodboy rust golang r语言
Rust：Rust是一种注重性能和安全性的系统编程语言。它具有严格的内存管理，能够防止许多常见的内存错误。Rust作业可能涉及编写高效的算法、处理并发问题、与操作系统接口等。OCaml：OCaml是一种函数式编程语言，具有强大的类型系统和模块系统。它适合用于开发高性能、高可靠性的应用程序。OCaml作业可能涉及编写函数、处理数据结构、实现算法等。Go：Go（又称Golang）是一种编译型、并发型，
r语言 xml html,R语言读取XML文件-xml文件 bean.Xu r语言 xml html
XML文件简介在计算机领域，XML(extensiblemarkuplanguage)指的是可扩展标记语言，类似于HTML，它设计的宗旨是传输数据，而不是显示数据，所以这也是它和HTML的一个明显的差别。另外一个差别是XML的标签没有被预定义，我们可以根据自己的需要自行设计标签名字，所以具有自我描述性。一个具体的例子以上就是一个XML的例子，它拥有发送者和接受者，标题，内容等信息，所以自我描述非常
datapasta包学习-可复制网页、Excel表格等其他来源的数据至Rstudio中凑齐六个字吧科研工具数据挖掘
datapasta是一个R语言中用于优化数据复制和粘贴（copy-paste）的R包，旨在简化数据导入和转换过程，减少手动格式调整的需求，提高数据整理的效率。功能介绍将Excel/CSV/表格数据快速粘贴到R代码：可将剪贴板中的数据直接转换为data.frame、tibble、vector等格式，无需手动整理格式。从R数据转换为文本格式（适用于论文、报告）：支持将R变量（如data.frame、向
R语言：将R语言中的Seurat数据对象转换为Python能处理的h5ad格式 S.GJ r语言 python 开发语言
背景在基因组学数据分析场景下，有些数据被保存为了R语言中的Seurat对象格式，我们的需求是将Seurat对象格式的数据转换为Python能处理的h5ad格式。R处理代码###1.准备工作#1.1readr包安装install.packages("readr")#1.2Seurat包安装#略#1.3SeuratDisk包安装remotes::install_github("mojaveazure/
【cran Archive R包的安装方式】遗落凡尘的萤火-生信小白 r语言开发语言
cranArchiveR包的安装方式添加链接描述1.包被cran移除2.包要求的R语言版本与你电脑上的版本不相符ad=archive包的网址或者是下载到工作目录下，ad等于文件名install,packages(adrepos=NULL)
R语言 Rstudio 安装包报错：安装包‘ ’时出现非零退出状态数据智团 r语言开发语言 R语言
问题描述：在使用R语言和RStudio时，尝试安装包时遇到了报错信息：“installationofpackage‘’hadnon-zeroexitstatus”。这个错误提示表明在安装特定的R包时出现了问题，导致安装过程未能成功完成。解决方法：出现这个错误的原因可能有多种，下面将介绍几种常见的解决方法。检查包名和版本：确保在安装包时提供了正确的包名，并且该包存在于CRAN（Comprehensi
R语言|1.2 R语言的工作空间管理 wqqqqqq_ R语言 r语言开发语言
#R语言|1.2R语言的工作空间管理工作空间是R的工作环境。退出R时，如果选择保存工作空间，R将会在工作空间所在文件夹中创建两个文件，“.Rhistory”，其中保存R中输入的任何命令，另一个为".Rdata"是将工作空间中的所有对象都保存在其中。工作目录(workingdirectory)，用来读取文件和保存结果的一个文件夹。我们可以使用函数getwd()查看当前的工作目录，也可以使用函数set
R语言环境下载和RStudio安装教程 CyberXZ r语言开发语言 R语言
R语言环境下载和RStudio安装教程R语言是一种广泛应用于统计计算和数据分析的编程语言。它提供了丰富的统计和图形功能，被广泛用于数据科学、机器学习和数据可视化等领域。本教程将向您介绍如何下载和安装R语言环境以及RStudio集成开发环境。步骤1：下载R语言环境首先，您需要下载R语言环境。请按照以下步骤进行操作：在您的Web浏览器中打开R官方网站（https://www.r-project.org
Elixir语言的物联网蔺曲韵包罗万象 golang 开发语言后端
使用Elixir语言构建物联网应用引言物联网（IoT）是当今技术发展的热门领域，它涉及各种设备的互联互通，这些设备能够收集和交换数据。随着智能家居、智能城市、工业自动化等应用场景的逐步普及，如何高效地构建和管理这些设备之间的通信已经成为一个重要的问题。在众多编程语言中，Elixir以其并发、可靠性和分布式特性，逐渐成为构建物联网应用的一个优秀选择。本文将详细探讨Elixir在物联网项目中的应用，包
Elixir语言的安全开发沈韶珺包罗万象 golang 开发语言后端
Elixir语言的安全开发引言在当今这个互联网高度发展的时代，软件的安全性变得越来越重要。随着网络攻击的增多，软件漏洞的频繁暴露，开发者面临着前所未有的安全挑战。Elixir，作为一种现代化的函数式编程语言，以其高并发、分布式和容错的特点，迅速获得了开发者的青睐。然而，尽管Elixir语言本身带来了许多安全优势，安全开发仍然是一个复杂而关键的过程。本文将探讨Elixir语言的安全开发，包括其安全特
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st