R基本函数学习 190330

library(sqldf)
library(tcltk)
library(ggplot2)

  • library()和install.packages()

install用于联网、在线安装、本地安装

install.packages('package_name')

library()在R语言中用来加载第3方包

library(my_package)

working_directory = "C:/Users/实验"
setwd(working_directory)

  • getwd(),获取当前工作目录
    setwd(),设置当前工作目录(改变)
    括号内的参数是字符串,需要引号

ab_exp_id = '实验调整_20190305'
file_name = paste(working_directory, "/", ab_exp_id,".csv",sep="")
data_tmp<- read.csv(file_name)

  • paste(),多字符串使用 paste() 函数来组合。它可以将任意数量的参数组合在一起
  • <-赋值,注意和=及<<-的用法区别

data_tmp$profit <- data_tmp$commission - data_tmp$final_subtract - real_cash_rate*data_tmp$final_cashback

  • $:取某个object(数据框,list比如lm object,etc)的某个部分

data_tmp$dt<-as.character(data_tmp$dt)

  • as.numeric 转化为数值型
  • as.logic 转化为逻辑型
  • as.complex 转化为复数型
  • as.character 转化为字符型
  • as.array 转化为数组
  • as.data.frame 转化为数据框

exp_id<-unique(data_tmp$ab_exp_id)

  • unique(),返回对象的不同值

exp_report <- merge(data_exp_A,data_exp_B)

  • merge 连接两个数据,官方参考文档语法
merge(x, y, by = intersect(names(x), names(y)),
      by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all,
      sort = TRUE, suffixes = c(".x",".y"),
      incomparables = NULL, ...)

x,y 要合并的两个数据集
by,用于连接两个数据集的列,intersect(a,b)值向量a,b的交集,names(x)指提取数据集x的列名
by = intersect(names(x), names(y)) 是获取数据集x,y的列名后,提取其公共列名,作为两个数据集的连接列, 当有多个公共列时,需用下标指出公共列,如names(x)[1],指定x数据集的第1列作为公共列
也可以直接写为 by = ‘公共列名’ ,前提是两个数据集中都有该列名,并且大小写完全一致,R语言区分大小写
by.x,by.y:指定依据哪些行合并数据框,默认值为相同列名的列
all,all.x,all.y:指定x和y的行是否应该全在输出文件
sort:by指定的列(即公共列)是否要排序
suffixes:指定除by外相同列名的后缀
incomparables:指定by中哪些单元不进行合并

data_tmp_exp <- subset(data_exp_ab,exp == i)

  • subset(),条件筛选函数

options(digits = 2)

  • 数字位数的设置,options(digits=n),n一般默认情况下是7位,但实际上的范围是1~22,可以随意设置位数。
options(digits=10)

eg:R的整数表示能力设为10位。

你可能感兴趣的:(R基本函数学习 190330)