Kingsley_W

【R语言】字符串处理

在挖掘分析的过程当中对字符串的处理是极为重要的，且出现也较为频繁，R语言作为当前最为流行的开源数据分析和可视化平台，虽然文本的处理并不是它的强项, 但是R语言还是包含大量的字符串操作工具，本章着重整理了部分常用字符处理函数及其使用方法。

5.1 基本字符操作

1）字符长度统计

length(x)函数 — 返回向量x的长度，或者说向量中元素的个数；

nchar(x)函数 — 返回向量x中的每个元素的字符个数，对于非字符元素会得到不可预料的结果。

– 举例1：

x <-c("R", "Rstudio", "Revolution R")

# 返回3，向量x中共有3个元素

length(x)

# 返回1 7 12，向量x中每个元素的字符个数

nchar(x)

– 举例2：

# 返回1，空向量长度为1

length("")

# 返回0，空向量字符长度为0

nchar("")

# 非字符元素NA，返回错误结果2

nchar(NA)

2）字符大小写转换

toupper(x)函数 — 将字符矩阵x内各元素转化为大写形式；

tolower(x)函数 — 将字符矩阵x内各元素转化为小写形式；

casefold(x，upper = FALSE)函数 — 将字符矩阵x内各元素转化为大写或小写形式，默认为转换为小写，当upper =TRUE时转换为大写；

– 举例1：

x <- c("r", "rstudio", "revolutionR", NA)

# 转化x中的各元素为大写形式，NA依然返回NA

toupper(x)

# 转化x中的各元素为小写形式，NA依然返回NA

tolower(x)

# 转化x中的各元素为小写形式，默认upper = FALSE，NA依然返回NA

casefold(x)

# 转化x中的各元素为大写形式，设置upper = TRUE，NA依然返回NA

casefold(x, upper = TRUE)

5.2 字符串连接

字符串连接是较为常见的字符操作，在此R提供了强大的paste函数，它不仅可以实现字符串的连接，也可以实现字符向量的连接，无论是字符向量还是字符串，在连接前paste会把对象首先转换为字符而后进行连接，另外，当向量连接时，较短的向量会循环使用。

1） paste 函数

基本语法:

paste (..., sep = " ", collapse = NULL)

参数sep表示连接的分隔符，默认为一个空格，参数collapse作为合并成一个字符串时的分隔符，详情请见以下应用实例：

– 举例1：

x <- "Hello"; y <- "world"

paste(x, y)

#不设置sep，默认以空格分割

paste("A", 1:4)

#设置sep，去掉空格分隔符

paste("A", 1:4, sep = "")

– 举例2：

#字符向量的连接,较短的字符循环被使用

paste(c("a", "b"), 1:3, sep = "")

– 举例3：

#连接前隐式转换为字符串

name <- c("Kingsley", "William","Tom");

age <- c(30, 20, 10);

person <- data.frame(name, age)

#返回结果"NJc(1,3, 2)" "NJc(30, 20,10)"

paste("NJ", person, sep ="")

注: 数据框内的字符串会默认转换为因子（依赖于stringsAsFactors参数的设置，默认为True，即字符会被转换为因子类型），然后paste连接的时候会进行隐式转换，默认转换为字符型连接，所以使用paste函数时，有时候并不能得到想要的结果。

– 举例4：

#使用collapse参数, collapse的使用可使连接后的字符组成一个字符串

#返回字符串A1,A2,A3,A4

paste("A", 1:4, sep ="" ,collapse = ",")

2） paste0 函数

基本语法：

paste0(..., collapse = NULL)

参数意义paste与函数相同, 不同之处在于sep默认设置为空字符。

– 举例1：

#结果中没有空格分隔符

paste0("A", 1:4)

3） sprintf函数

基本语法:

sprintf(fmt,...)

sprintf表示字符串“打印”，把若干元素按照给定的格式组合赋值给字符串。fmt表示包含格式字符的字符向量，sprintf中的参数会循环使用。

– 举例1：

#以固定长度输出月份的名称，fmt被循环使用，长度不足在字符前面补空格

sprintf("%09s", month.name)

#以固定长度输出月份的名称，fmt被循环使用,长度不足在字符后面补空格

sprintf("%-9s", month.name)

– 举例2：

#向量元素按顺序组合

sprintf(c("Name:%s", "Age: %s"), c("Kingsley", "30"))

– 举例3：

#以指定格式输出圆周率

sprintf("%f",pi)

sprintf("%.3f",pi)

sprintf("%1.0f",pi)

sprintf("%5.1f",pi)

sprintf("%05.1f",pi)

sprintf("%+f",pi)

sprintf("%f", pi)

sprintf("%-10f",pi) # left justified

sprintf("%e",pi)

sprintf("%E",pi)

sprintf("%g",pi)

sprintf("%g", 1e6 * pi) # -> exponential

sprintf("%.9g",1e6 * pi) # -> "fixed"

sprintf("%G",1e-6 * pi)

4） cat函数

基本语法:

cat(... , file ="", sep = " ", fill = FALSE, labels = NULL,

append = FALSE)

cat函数用于连接字符串并输出到文件，默认file为空直接输出；sep表示连接的分隔符，默认为一个空格；fill逻辑值，为FALSE只有显式地使用“\n”才会换行输出，为TRUE只要达到选择宽度即可换行；labels为行标签，只在fill = TRUE时有效，若设定的行数小于实际行数，则会循环使用。append逻辑值，为FALSE会覆盖之前的输出，否则在原来内容后添加新输出。

– 举例1：

#连接字符串，此处A不会循环使用

cat("A", 1:4, sep= " ")

– 举例2：

#换行输出到文件abc.txt，每行都有相应的行标签

cat(paste(letters, 100*1:26), file = "abc.txt", fill = T, labels = paste0("{",1:10, "}:"))

5.3 字符匹配

R语言有多重方法判断特定元素（vector）在另一个元素（vector）中是否存在匹配的元素。下面逐一介绍各种方法：

1. match函数族

match函数族用于匹配字符时返回匹配或部分匹配的元素下标，匹配参数不支持正则表达式。

1) match函数

基本语法：

match(x, table,nomatch = NA_integer_, incomparables = NULL)

其中参数nomatch表示不匹配时的返回值（默认为NA，强制为integer型），incomparables指定不能用来匹配的值（vector），因此incomparables中配置的值，即使x在table中得到匹配也会由nomatch代替。match函数要求完全匹配。

– 举例1：

#return 2，字符mn匹配字符向量第二个元素的值

match("mn",c("ab", "mn", "xy"), nomatch = NA)

– 举例2：

#return 1，字符mn匹配字符向量第一以及第二个元素的值，返回第一个元素下标

match("mn",c("mn", "mn", "xy"), nomatch = NA)

– 举例3：

#return NA，incomparables包含了字符值mn，因此即使匹配也返回NA

match("xy",c("ab", "mn", "xy"), nomatch = NA,incomparables = c("mn", "xy"))

函数%in%，实际可表示为match函数，不同的是返回值为逻辑向量

"%in%"<- function(x, table) match(x, table, nomatch = 0) > 0

– 举例1：

#返回长度为10的逻辑向量，存在的为TRUE，不存在为FALSE

1:10 %in%c(1,3,5,9)

– 举例2：

#返回sstr中存在于26个字符中的元素，包括大小写

sstr <-c("c","ab","B","bba","c",NA,"@","bla","a","Ba","%")

sstr[sstr %in%c(letters, LETTERS)]

2) pmatch函数

基本语法:

pmatch(x, table,nomatch = NA_integer_, duplicates.ok = FALSE)

其中参数nomatch表示不匹配时的返回值（默认为NA，强制为integer型），

duplicates.ok表示table里面的元素是否可以适用多次。 pmatch函数是一个部分匹配函数, 依次从x里面挑出元素, 对照table进行匹配, 若匹配上则从table中剔除匹配上的值（部分匹配要求从元素的开始进行匹配，若x出现在table元素的中间不予匹配）, 不再参与下次匹配, duplicate.ok可设置是否剔除; 对于某一个元素, 匹配一共分成三步：

l 如果可以完全匹配, 则认为匹配上了, 返回table中的位置;

l 不满足上述条件, 如果是唯一部分匹配, 则返回table中的位置;

l 不满足上述条件, 则认为没有值与其匹配上.

– 举例1：

#return2，完成匹配第二个元素，忽略第一个元素的部分匹配

pmatch("me", c("mean", "me","mode"))

– 举例2：

#return1，唯一部分匹配，返回匹配的元素下标

pmatch("me", c("mean", "mae","mode"))

– 举例3：

#returnNA，部分匹配多个值返回NA

pmatch("m",   c("mean", "median", "mode"))

– 举例4：

#returnNA，mn出现在元素的中间不是从元素头开始，因此不予匹配

pmatch("mn",   c("mean", "amnb", "mode"))

– 举例5：

#duplicate.ok为FALSE，匹配后剔除，因此第一次完全匹配后table中的第二

#个元素被剔除，第二次只能取部分匹配的值，因此返回NA,2，1

pmatch(c("", "ab", "ab"), c("abc", "ab"), dup = FALSE)

– 举例6：

#duplicate.ok为TRUE，table中元素可使用多次，因此第一次完全匹配后#table的第二个元素未被剔除，第二次认可使用，因此返回NA,2，2

pmatch(c("", "ab", "ab"), c("abc", "ab"), dup = FALSE)

3) charmatch 函数

基本语法:

charmatch(x,table, nomatch = NA_integer_)

与pmatch功能类似可用于部分匹配，如果同时存在完全匹配和部分匹配则取完全匹配值的下标，对于多个完全配合或者多个部分匹配的情况返回0值，没有匹配的返回nomatch所设置的值。

– 举例1：

#return2，完成匹配第二个元素，忽略第一个元素的部分匹配

charmatch("me", c("mean", "me","mode"))

– 举例2：

#return1，唯一部分匹配，返回匹配的元素下标

charmatch("me", c("mean", "mae","mode"))

– 举例3：

#return 0，部分匹配多个值返回0

charmatch("m",   c("mean", "median", "mode"))

– 举例4：

#returnNA，mn出现在元素的中间不是从元素头开始，因此不予匹配

charmatch("mn",   c("mean", "amnb", "mode"))

– 举例5：

#匹配后元素仍可重复使用，return 0,2,2

charmatch(c("", "ab", "ab"), c("abc", "ab"))

2. grep函数族

与match函数不同，grep函数族可通过正则表达式在给定的对象中搜索文本。其中，grep输出向量的下标或值，grepl返回匹配与否的逻辑值。regexpr，gregexpr和regexec可以查找到某些字符在字符串中出现的具体位置和字符串长度信息，可以用于字符串的提取操作。

1） grep函数

基本语法：

grep(pattern, x, ignore.case= FALSE, perl = FALSE, value = FALSE,

fixed = FALSE, useBytes = FALSE, invert =FALSE)

grepl(pattern, x,ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

grepRaw(pattern,x, offset = 1L, ignore.case = FALSE,value = FALSE, fixed = FALSE, all = FALSE,invert = FALSE)

pattern为字符串表示的正则表达式，或者字符串（fixed = TRUE），ignore.case逻辑值，FALSE表示大小写敏感，TRUE不敏感；perl逻辑值，是否使用Perl风格的正则表达式，FALSE表示不使用，TRUE表示使用；value逻辑值，FALSE返回匹配元素的下标，TRUE返回匹配的元素值；fixed逻辑值，FALSE表示正则表达式匹配，TRUE为精确匹配；useBytes逻辑值，FALSE表示按字符匹配，TRUE表示按字节匹配；invert逻辑值，FALSE 查找匹配值，TRUE返回不匹配元素下标或值（根据value值）；offset指定匹配开始位置，all逻辑值，TRUE返回所有匹配值，FALSE返回第一个匹配值。

– 举例1：

#查找含有字符o或者r的字符串，返回匹配的下标

grep("[or]",c("Tom", "Jerry", "Mickey"))

#查找含有字符o或者r的字符串，返回不匹配的下标

grep("[or]",c("Tom", "Jerry", "Mickey"), invert = TRUE)

#点好(.)匹配任意字符，返回下标

grep("e.r",c("pear", "cherry", "apple"))

#点好(.)匹配任意字符,value设置为TRUE，返回匹配的值

grep("e.r",c("pear", "cherry", "apple"), value = TRUE)

#$匹配一个字符串的结尾，返回以y结尾的字符串

grep("y$",c("year", "Jerry", "Mickey"))

#^匹配一个字符串的开始，返回以y开始的字符串

grep("^y",c("year", "Jerry", "Mickey"))

#匹配以c开头(不一定要求是字符串第一个字符)，接着方括号中任意一个字符，最

#后以t结尾

grep("c[aeiou]t",c("cat", "pcut", "apple"))

#[^a]表示匹配任意不是a的元素

grep("c[^a]t",c("cat", "pcut", "apple"))

#匹配a或者u

grep("c(a|u)t",c("cat", "pcut", "apple"))

#匹配字符串pp，{n}表示匹配n个字符

grep("ap{2}",c("cat", "pcut", "apple"))

#匹配字符串anan，{n}表示匹配n个字符

grep("(an){2}",c("cat", "pcut", " banana"))

#?匹配前面的子表达式零次或一次

grep("c(a)?t",c("cat", "pct", "apple"))

#*匹配前面的子表达式任意次,可匹配任意次的c和a

grep("ca*t",c("cat", "pct", "cct", "caaaat"))

#+匹配前面的子表达式一次或多次（大于等于1）,只能匹配a

grep("ca+t",c("cat", "pt", "cct", "caaaat"))

– 举例2：

#查找含有字符o或者r的字符串，返回与向量长度相同的逻辑向量

grepl("[or]",c("Tom", "Jerry", "Mickey"))

– 举例3：

#返回第一次出现o或者r的下标

grepRaw("[or]","Tomorrow")

#设置all = TRUE，返回所有的o和r的位置下标

grepRaw("[or]","Tomorrow", all = TRUE)

#从位置3开始向后搜索匹配

grepRaw("[or]","Tomorrow", all = TRUE, offset = 3)

注意: 若原字符为非字节形式，会强制使用charToRaw先字节化。例如 :

charToRaw("Tomorrow")

2） regexpr、gregexpr和regexec函数

返回匹配结果的具体位置以及字符串长度信息，可以用于字符串的提取操作。

基本语法：

regexpr(pattern,text, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

gregexpr(pattern,text, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

regexec(pattern,text, ignore.case = FALSE, fixed = FALSE,

useBytes =FALSE)

– 举例1：

#返回匹配向量包括字符的位置及匹配长度(只匹配第一次出现的)，不匹配返回-1

regexpr("ca*t",c("cat", "pct", "cctdcat", "caaaat","ddd"))

#返回匹配列表包含字符的位置及匹配长度(匹配多次)，不匹配字符返回-1

gregexpr("ca*t",c("cat", "pct", "cctdcat", "caaaat","ddd"))

#返回匹配列表包含字符的位置及匹配长度(只匹配第一次出现的)，不匹配返回-1

regexec("ca*t",c("cat", "pct", "cctdcat", "caaaat","ddd"))

regmatches函数，可以提取regexpr, gregexpr 或regexec函数中匹配或者不匹配(invert = TRUE)的字符

基本语法：

regmatches(x, m,invert = FALSE)

– 举例1：

#提取使用regexpr匹配的实际字符

x <- c("cat","pct", "cctdcat", "caaaat", "ddd")

m <-regexpr("ca*t", x)

regmatches(x, m)

3） agrep函数

根据广义Levenshtein编辑距离进行字符串模糊匹配(adist函数可用于计算Levenshtein编辑距离)。

基本语法：

agrep(pattern, x,max.distance = 0.1, costs = NULL,

ignore.case = FALSE, value = FALSE, fixed= TRUE,

useBytes = FALSE)

agrepl(pattern,x, max.distance = 0.1, costs = NULL,

ignore.case = FALSE, fixed = TRUE,useBytes = FALSE)

max.distance表示允许的最大Levenshtein编辑距离。

– 举例1：

#返回最大编辑距离小于等于3的字符值

#返回1,2

agrep("lasy",c("1 lazy", "lmansky", "1 LAZY"), max = 3)

#返回"1 lazy"

agrep("lasy",c("1 lazy", "lmansky", "1 LAZY"), max = 2, value= T)

– 举例2：

#返回匹配的逻辑向量

agrepl("lasy",c("1 lazy", "lmansky", "1 LAZY"), max = 3)

5.4 字符串提取/替换/拆分

1. 字符串提取

以下函数可用于字符串提取，同时substr和substring也可用于字符串替换。

1） substr函数

基本语法:

substr(x, start,stop)

对字符串x截取从start到stop的子字符串。

– 举例1：

#Return:jing，截取字符串第4位到第7为的字符

substr("Nanjing", 4, 7)

#Return:jing，截取字符串第4位到第10为的字符,stop超出字符长度，

#只取值到字符末尾

substr("Nanjing", 4, 10)

#Return:空字符，start超出字符串长度

substr("Nanjing", 8, 10)

– 举例2：

#截取字符向量，对于位置向量长度不足会循环使用

#位置向量为1：4, 2:5, 3:4, 1:5，两个位置向量都循环取值

substr(rep("abcdef", 4), 1:3, 4:5)

– 举例3：

#替换原字符串1-3的字符

add <- "Nanjing"

substr(add, 1, 3) <- "Bei"

2） substring函数

基本语法:

substring(text,first, last = 1000000L)

对字符串x截取从first到last的子字符串，last默认值为1000000，可以不传参。

– 举例1：

#Return:jing，截取字符串第4位到第7为的字符

substring("Nanjing", 4, 7)

#Return:jing，截取字符串第4位到末尾的子字符串，未设置last取默认值

substring("Nanjing", 4)

– 举例2：

#下标向量循环使用截取字符串

substring("Nanjing", 1:2, 1:6)

#未设置last截取字符串

substring("Nanjing", 1:6)

– 举例3：

#替换原字符串1-3的字符

add <- "Nanjing"

substring(add, 1, 3) <- "Bei"

3） strtrim函数

基本语法:

strtrim(x,width)

对字符串x从开头截取指定width的子字符串，参数均可循环使用。对于中文字符，一个字符的长度为2，因此width也要设置为2倍宽度。

– 举例1：

#Return:Nan，从头开始截取定宽字符

strtrim("Nanjing", 3)

– 举例2：

#Return:字符，中文字符宽度需设置为2倍

strtrim("字符操作函数",4)

2. 字符串替换

sub和gsub为字符串替换函数，通过正则表达式设置灵活的匹配规则，返回被替换后的字符串，两者唯一的差别在于前者匹配第一次符合模式的字符串，后者匹配所有符合模式的字符串，也就是说在替换的时候前者只替换第一次符合的，后者可替换所有符合的。

1) sub和gsub函数

sub和gsub函数用于字符串替换，其中sub只替换第一次匹配的字符，而gsub会替换所有满足条件的匹配。由于R语言操作都是传值不传址，所以替换操作只是替换了原字符向量的copy，如果完全替换还需要再通过赋值操作。

基本语法：

sub(pattern,replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

gsub(pattern,replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

replacement参数表示需要替换的内容。

– 举例1：

#以字符www替换第一次匹配的字符

sub("ca*t","www", c("cat", "pct", "cctdcat","caaaat", "ddd"))

#以字符www替换所有匹配的字符

gsub("ca*t","www", c("cat", "pct", "cctdcat", "caaaat","ddd"))

2) chartr函数

基本语法：

chartr(old, new,x)

把字符串x中的字符按照old到new进行替换，字符串old和new要求长度一致，且按顺序匹配替换。

– 举例1：

#替换字符一一对应进行映射

chartr("Nan","Bei", "Nanjing")

– 举例2：

#替换过程同时生效，由于原字符不存在B，因此不会进行B->F转换

chartr("NB","BF", "Nanjing")

3. 字符串拆分

基本语法：

strsplit(x,split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

strsplit根据split拆分字符串x，并返回子字符串组成的长度与x相同的列表, 分隔符split包括正则表达式，当fixed= TRUE时，需要精确匹配，为FALSE（默认），则使用正则表达式匹配，除非使用反斜杠（\）转义。perl用于判断是否使用更强大的perl正则表达式，useBytes = TRUE 表示byte-by-byte按字节匹配， FALSE为character-by-character字符匹配（默认）。

– 举例1：

#以分隔符-分割字符串

strsplit("JiangSu-Nanjing-Gaoxin","-")

– 举例2：

#点好(.)为正则表达式表示任意字符,因此不能正确分割字符串

strsplit("JiangSu.Nanjing.Gaoxin",".")

#设置fixed为TRUE，精确匹配点好

strsplit("JiangSu.Nanjing.Gaoxin",".", fixed = TRUE)

#使用反斜杠（\）转义

strsplit("JiangSu.Nanjing.Gaoxin","\\.")

#使用通配符[]，表示含有点号的字符

strsplit("a.b.c","[.]")

– 举例3：

#以下三种情况相同，把字符串分解为一个一个单个字符

strsplit("JiangSu-Nanjing-Gaoxin",NULL)

strsplit("JiangSu-Nanjing-Gaoxin","")

strsplit("JiangSu-Nanjing-Gaoxin",character(0))

– 举例4：

#\s表示空白字符（包括空格、制表符、换行符等）

strsplit("JiangSuNanjing Gaoxin", "\\s")

strsplit("JiangSu\nNanjing\nGaoxin","\\s")

– 举例5：

#使用分隔符”-”,对字符向量分解

person <-c("Tom-30", "Jerry-20", "Bob-18")

strsplit(person,"-")

5.5 字符编码转换

字符编码即编码字符集和实际存储数值之间的转换关系。字符集规定了某个文字对应的二进制数字存放方式（编码）和某串二进制数值代表了哪个文字（解码）的转换关系。R语言提供的一些字符编码函数。

1) Encoding函数

Encoding函数用于读取和设置字符向量的编码。R字符串可以使用包括 "latin1" ， "UTF-8" 或 "bytes"的编码格式。由于ASCII 字符串对各种编码表示的形式相同，所以Encoding获取的编码方式为unknown。

– 举例1：

x <-"fa\xE7ile"

#字符编码为unknown

Encoding(x)

#设置字符编码为latin1

Encoding(x) <-"latin1"

2) iconv函数

字符编码转换，转换过程中并不会做太多的校验，因此放源编码不合法时，常常不能正确转换，基本语法:

iconv(x, from ="", to = "", sub = NA, mark = TRUE, toRaw = FALSE)

from为源编码；to为目标编码；sub用于替换不能转换的字节（默认为NA），如果本身为字节类型，则使用16进制字节形式替换。mark逻辑值，指明返回的字符向量是否申明编码类型，默认为TRUE即返回编码类型；toRaw逻辑值，指明是返回字符向量还是字节向量。

– 举例1：

x <-"fa\xE7ile"

#设置字符编码为latin1

Encoding(x) <-"latin1"

#转换latin1字符编码为UTF-8

iconv(x, "latin1","UTF-8")

– 举例2：

x <-"fa\xE7ile"

Encoding(x) <-"latin1"

#转换为字节型输出

iconv(x, "latin1","UTF-8", toRaw = T)

charToRaw(iconv(x,"latin1", "UTF-8"))

注意:

iconvlist() 可用于输出不同环境支持的编码类型

从当前语言环境选择合适的编码名称。

localeToCharset(locale =Sys.getlocale("LC_CTYPE"))

5.6 字符串处理包stringr

相较于R语言基本的字符操作，stringr包提供了更加灵活易用的字符操作方式。

1. 统计匹配的字符数

基本语法：

str_count(string,pattern = "")

– 举例1：

x <-c("R", "Rstudio", "Revolution R")

#统计字符向量中每个字符串中字符R的个数

str_count(x,pattern = "R")

– 举例2：

#不能正确统计元字符的个数

str_count(c("a.","...", ".a.a"), ".")

#使用fixed函数

str_count(c("a.","...", ".a.a"), fixed("."))

#使用反斜杠转义

str_count(c("a.","...", ".a.a"), "\\.")

#使用[.]同样有效

str_count(c("a.","...", ".a.a"), "[.]")

– 举例3：

#使用空字符串返回每个字符串的字符个数，相当于nchar

x <-c("R", "Rstudio", "Revolution R")

str_count(x,pattern = "")

2. 字符长度统计

基本语法：

str_length(string)

– 举例1：

x <-c("R", "Rstudio", "Revolution R", NA)

#统计每个字符串的字符个数，相当于nchar,不同的是NA不会计数依然返回NA

str_length(x)

3. 字符串转换

基本语法：

str_to_upper(string,locale = "")

str_to_lower(string,locale = "")

str_to_title(string,locale = "")

– 举例1：

x <-c("r", "rstudio", "revolution R", NA)

#转换为全小写，NA依然返回NA

str_to_lower(x)

#转换为全大写，NA依然返回NA

str_to_upper(x)

#转换为首字符大写，NA依然返回NA

str_to_title(x)

4. 字符串连接

基本语法：

str_c(..., sep ="", collapse = NULL)

参数sep表示连接的分隔符，默认为空字符，参数collapse作为合并成一个字符串时的分隔符。

– 举例1：

x <-"Hello"; y <- "world"

str_c(x, y)

str_c(x, y, sep= ",")

– 举例2：

#以逗号连接为一个字符串

str_c("A",1:4, collapse = ",")

– 举例3：

#NA不参与连接，依然输出NA

str_c(c("A","B", NA, "C"), 1:4)

5. 字符串匹配

1) str_match函数

基本语法：

str_match(string,pattern)

str_match_all(string,pattern)

– 举例1：

#返回实际匹配字符组成的字符矩阵，只包含第一个匹配的字符,不匹配值返回NA

str_match(c("pear,ear","cherry", "apple"), "e.r")

– 举例2：

#返回字符矩阵组成的list，包含所有匹配的字符，不匹配值返回空字符

str_match_all(c("pear,ear","cherry", "apple"), "e.r")

2) str_extract函数

基本语法：

str_extract(string,pattern)

str_extract_all(string,pattern, simplify = FALSE)

simplify默认值为FALSE，返回字符向量组成的列表，为TRUE则返回字符矩阵。

– 举例1：

#返回实际匹配字符组成的字符向量，只包含第一个匹配的字符,不匹配值返回NA

str_extract(c("pear,ear","cherry", "apple"), "e.r")

– 举例2：

#匹配所有满足条件字符，不匹配值返回空字符

#simplify = FALSE(默认)，返回字符向量组成的list

str_extract_all(c("pear,ear","cherry", "apple"), "e.r")

#simplify= TRUE，返回字符向量组成的matrix

str_extract_all(c("pear,ear", "cherry","apple"), "e.r", simplify = TRUE)

3) str_detect函数

基本语法：

str_detect(string,pattern)

返回与string等长的逻辑向量，类似于grepl。

– 举例1：

fruit <-c("apple", "banana", "pear","pinapple")

#返回与string向量长度相同的逻辑矩阵，包含所有匹配的元素

str_detect(fruit,"a")

str_detect(fruit,"^a")

str_detect(fruit,"a$")

str_detect(fruit,"b")

str_detect(fruit,"[aeiou]")

1) str_subset函数

基本语法：

str_subset(string,pattern)

返回匹配的字符串值，类似于grep(pattern, x, value = TRUE)。

– 举例1：

fruit <-c("apple", "banana", "pear","pinapple")

#返回匹配的所有字符串值

#相当于fruit[str_detect(fruit,"[lr]")]

str_subset(fruit,"[lr]")

2) str_locate函数

基本语法：

str_locate(string,pattern

str_locate_all(string,pattern)

查找匹配的字符，返回数值矩阵，第一列为匹配字符的起始位置，第二列为终止位置。str_locate_all返回由数值矩阵组成的列表。

– 举例1：

#返回第一个匹配字符的位置矩阵，不匹配值和NA值返回NA

str_locate(c("pear,ear","cherry", "apple", NA), "e.r")

– 举例2：

#返回全部匹配字符位置矩阵组成的列表，不匹配值返回空，NA依然返回NA

str_locate_all(c("pear,ear","cherry", "apple", NA), "e.r")

6. 字符串复制

基本语法：

str_dup(string, times)

– 举例1：

#按位置复制字符串，NA不会复制

str_dup(c("pear,ear","cherry", "apple", NA), c(1:4))

7. 字符串补充

基本语法：

str_pad(string,width, side = c("left", "right", "both"), pad =" ")

string为字符串或字符串向量；width为字符串填充后的长度；side为填充方向，both两边填充，left左边填充，right右边填充；pad: 用于填充的字符，默认为空格。

– 举例1：

#两边填充字符*直到宽度为10

str_pad(c("pear,ear","cherry", "apple", NA), 10, "both", pad ="*")

8. 字符串去空格

基本语法：

str_trim(string, side = c("both","left", "right"))

去除包括空格，\t和\n等字符。

– 举例1：

#删除字符串左边的空格

str_trim(" \t\npear \t \n ", "left")

– 举例2：

#删除字符串右边的空格

str_trim(" \t\npear \t \n ", "right")

– 举例3：

#删除字符串两边的空格，不设置side默认为both

str_trim(" \t\npear \t \n ", "both")

9. 字符串截取/替换/拆分

1) str_sub函数

基本语法：

str_sub(string, start = 1L,end = -1L)

str_sub(string, start = 1L,end = -1L) <- value

对字符串string截取从start到end的子字符串。

– 举例1：

#Return:jing，截取字符串第4位到第7为的字符

str_sub("Nanjing", 4, 7)

#Return:jing，截取字符串第4位到第10为的字符,stop超出字符长度，

#只取值到字符末尾

str_sub("Nanjing", 4, 10)

#Return:空字符，start超出字符串长度

str_sub("Nanjing", 8, 10)

– 举例2：

#截取字符向量，对于位置向量长度不足会循环使用

#位置向量为1：4, 2:5, 3:4, 1:5，两个位置向量都循环取值

str_sub(rep("abcdef", 4), 1:3, 4:5)

– 举例3：

#end可以设置为负值

str_sub("Nanjing", 3, -2)

– 举例4：

#替换原字符串1-3的字符

add <- "Nanjing"

str_sub(add, 1, 3) <- "Bei"

2) word函数

基本语法:

word(string,start = 1L, end = start, sep = fixed(" "))

用于从语句中提取单词(字符串)。string为字符串或字符串向量；start为数值向量给出提取的开始位置；end为数值向量给出提取的结束位置；sep为单词间分隔符。

– 举例1：

fruit <-c("apple red", "banana yellow", NA)

#默认以空格为分隔符，取第一个位置的字符

word(fruit, 1)

#默认以空格为分隔符，取第二个位置的字符

word(fruit, 2)

word(fruit, -1)

– 举例1：

fruit <-c("apple.red", "banana.yellow", NA)

#以点好.为分隔符，取第一个位置的字符

word(fruit, 1,sep = fixed("."))

3) str_replace函数

基本语法：

str_replace(string, pattern,replacement)

str_replace_all(string,pattern, replacement)

str_replace_na(string,replacement = "NA")

找到匹配的字符，并用给定的字符串进行替换。

– 举例1：

fruit <- c("apple", "banana", "pear", "pinapple", NA)

#替换字符串中第一次出现的a或p

str_replace(fruit, "[ap]", "*")

#替换字符串中所有的a或p

str_replace_all(fruit, "[ap]", "*")

– 举例2：

#替换NA为NA字符串

str_replace_na(c(NA, "NA", "apple"))

#替换NA为字符*

str_replace_na(c(NA, "NA", "apple"), "*")

4) str_split函数

基本语法：

str_split(string, pattern, n= Inf)

str_split_fixed(string,pattern, n)

对字符串进行拆分，n为分割的字符串个数。

– 举例1：

#使用反斜杠（\）转义

str_split("JiangSu.Nanjing.Gaoxin","\\.")

#分解为两个字符串

str_split("JiangSu.Nanjing.Gaoxin","\\.", 2)

#使用通配符[]，表示含有点号的字符

str_split("a.b.c","[.]")

#设置fixed为TRUE，精确匹配点好

str_split_fixed("JiangSu.Nanjing.Gaoxin","\\.", 3)

– 举例3：

#把字符串分解为一个一个单个字符，不支持NULL以及character(0)

str_split("JiangSu-Nanjing-Gaoxin","")

– 举例4：

#使用分隔符”-”,对字符向量分解

person <-c("Tom-30", "Jerry-20", "Bob-18")

#返回list对象

str_split(person,"-")

10. 字符串编码转换

基本语法：

str_conv(string, encoding)

– 举例1：

x <-"fa\xE7ile"

#设置字符编码为latin1

str_conv(x,"latin1")

11. 字符串值排序

基本语法：

str_order(x, decreasing =FALSE, na_last = TRUE, locale = "", ...)

str_sort(x, decreasing =FALSE, na_last = TRUE, locale = "", ...)

decreasing逻辑值，指定排序方向，默认为升序；na_last逻辑值，NA值的存放位置， TRUE放到最后，FALSE放到最前，NA表示过滤NA值排序；locale设置按那种语言习惯排序。

– 举例1：

fruit <- c("pear","apple", "pinapple", "banana", NA)

#按英文排序

str_sort(fruit,locale = "en")

#返回排序后的下标

str_order(fruit,locale = "en")

#过滤NA后排序

str_sort(fruit,locale = "en", na_last = NA)

12. 字符串输出

基本语法：

str_wrap(string, width = 80,indent = 0, exdent = 0)

string为字符串或字符串向量；width设置行宽；indent设置段落首行的缩进值；exdent设置段落非首行的缩进值。类似于strwrap函数。

– 举例1：

thanks_path<- file.path(R.home("doc"), "THANKS")

thanks <-str_c(readLines(thanks_path), collapse = "\n")

thanks <-word(thanks, 1, 3, fixed("\n\n"))

#默认输出

cat(str_wrap(thanks),"\n")

#设置宽度为40

cat(str_wrap(thanks,width = 40), "\n")

#设置宽度为60，首行缩进2个字符

cat(str_wrap(thanks,width = 60, indent = 2), "\n")

#设置宽度为60，非首行缩进2个字符

cat(str_wrap(thanks,width = 60, exdent = 2), "\n")

#设置宽度为0，每个单词为一行输出

cat(str_wrap(thanks,width = 0, exdent = 2), "\n")

你可能感兴趣的:(R语言)

R语言应用实战-基于R语言的判别分析：fisher判别法，距离判别法以及Bayers判别法（附源代码）文宇肃然 R语言实战应用案例精讲 R语言数据分析分类回归深度学习
前言判别分析（DiscriminatAnalysis)是多变量统计分析中用于判别样本所属类型的一种统计分析法。它所要解决的问题是在一些已知研究对象用某种方法已经分成若干类的情况下确定新的样本属于已知类别的哪一类。判别分析在处理问题时，通常要给出一个衡量新样品与各已知类型接近程度的描述统计模型即判别函数，同时也指定一种判别规则，借以判定新的样本归属。以下是我为大家准备的几个精品专栏，喜欢的小伙伴可自
HMSC联合物种分布模型中环境变量、物种属性、系统发育、数据分层设置综合案例 weixin_贾地理遥感生态模型物种分布生物多样性 Hmsc模型物种属性系统发育群落生态贝叶斯统计混合效应
联合物种分布模型（JointSpeciesDistributionModelling，JSDM）在生态学领域，特别是群落生态学中发展最为迅速，它在分析和解读群落生态数据的革命性和独特视角使其受到广大国内外学者的关注。在学界不同研究团队研发出不同的联合物种模型，其中由芬兰的Ovaskainen教授领导的团队研发的R语言程序包Hmsc发展势头最为强劲。Hmsc是物种群落分层模型的缩写(Hierarch
r语言面板数据回归_R语言之回归分析你的麦克疯 r语言面板数据回归
回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛，下列表格向我们展示了回归的不同类型以及其用途。本章为R语言回归分析之上部分，主要向读者们展示如何运用R语言完成ols(普通最小二乘)回归：简单线性回归、多项式回归、多元线性回归的语言编程示例，以及检验回归分析中统计假设的方法。回归类型用途简单线性用一个量化的解释变量来预测一
【R语言数据分析】基于R语言对中、美两国GDP分析（R语言大作业） m0_73866147 数据分析大数据 r语言
目录一、研究意义二、数据来源三、读取数据读取数据代码运行结果截图四、数据分析绘制箱线图建立箱线图代码运行结果截图五、建立回归模型建立回归模型代码运行结果截图有关于相关系数的计算与检验六、回归分析确定回归方程七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间数据可视化八、总结一、研究意义GDP作为衡量一个国家经济发展的重要指标，被赋予了非常重要的意义，深刻反映着当下经济发展的现状。中美
R语言中的偏最小乘回归（Partial Least Squares Regression, PLSR）和判别分析（Discriminant Analysis, 程序才子 r语言回归开发语言 R语言
R语言中的偏最小乘回归（PartialLeastSquaresRegression,PLSR）和判别分析（DiscriminantAnalysis,DA）偏最小乘回归（PartialLeastSquaresRegression,PLSR）与判别分析（DiscriminantAnalysis,DA）是R语言中常用的数据建模和预测技术。它们可以用于解决回归问题和分类问题。本文将介绍PLSR和DA的基本
判别分析在R语言中的实现 FgVector r语言开发语言
判别分析是一种常用的统计方法，用于将样本数据分配到已知类别中。在R语言中，我们可以使用多个包来实现判别分析，例如MASS、caret和lda等。本文将介绍如何使用R语言实现判别分析，并提供相应的源代码。安装和加载所需的包首先，我们需要安装并加载需要的R包。在R控制台中执行以下命令：install.packages("MASS")#安装MASS包install.packages("caret")#安
R语言中的函数32：seq_along() zoujiahui_2018 #R语言中的函数 r语言开发语言
介绍seq_along函数在R语言中用于生成一个整数序列，其长度与给定对象的长度相同。这个函数特别有用，当你想要创建一个索引序列来遍历一个向量或列表时。用法seq_along(x)参数x:任何R对象（如向量、列表等）。返回值:返回一个从1到x的长度的整数序列。示例#创建一个向量vec<-c("a","b","c")#使用seq_along生成索引indices<-seq_along(vec)pri
使用R语言绘制山脊图的ggridges包心之飞翼 r语言开发语言 R语言
使用R语言绘制山脊图的ggridges包山脊图（ridgeplot）是一种用于可视化多个分布或变量之间关系的图表类型。在R语言中，可以使用ggridges包来创建漂亮的山脊图。本文将介绍如何使用ggridges包绘制山脊图，并提供相应的源代码供参考。首先，确保已经安装了ggridges包。可以使用以下代码来安装：install.packages("ggridges")安装完毕后，加载ggridge
Anaconda3 介绍和安装 gorgor在码农 #python入门基础 python conda
介绍Anaconda是一个开源的Python和R语言发行版，专注于数据科学、机器学习和科学计算，主要面向数据科学和机器学习领域。它集成了大量常用的科学计算库（如NumPy、Pandas、Matplotlib、Scikit-learn等），并提供了强大的包管理工具Conda和环境管理功能，适合快速部署和管理复杂的开发环境。特点：预装丰富库：包含250+常用的数据科学工具包，无需手动安装。跨平台支持：
$ operator is invalid for atomic vectors什么意思滚菩提哦呢
"$operatorisinvalidforatomicvectors"意思是在对原子向量使用"$"操作符时是无效的。"$"操作符是R语言中用于访问数据框(dataframe)中的列的常用操作符。但是，原子向量(atomicvector)是R中的一种基本数据类型，它是一个长度固定的向量，并且所有元素都是相同的数据类型。因此，在对原子向量使用"$"操作符时是无效的，因为原子向量没有列的概念。例如，下
5-R循环 qwy715229258163 R语言 r语言 python 算法
R循环有的时候，我们可能需要多次执行同一块代码。一般情况下，语句是按顺序执行的：函数中的第一个语句先执行，接着是第二个语句，依此类推。编程语言提供了更为复杂执行路径的多种控制结构。循环语句允许我们多次执行一个语句或语句组，下面是大多数编程语言中循环语句的流程图：R语言提供的循环类型有:repeat循环while循环for循环R语言提供的循环控制语句有：break语句Next语句循环控制语句改变你代
R语言可视化散点图实战：为每一个数据点都绘制指示线段或者都不绘制、ggrepel包 statistics.insight r语言开发语言数据挖掘机器学习
R语言可视化散点图实战：为每一个数据点都绘制指示线段或者都不绘制、ggrepel包目录R语言可视化散点图（scatterplot）、为每一个数据点都绘制指示线段或者都不绘制、ggrepel包来帮忙#ggrepel包的安装和加载#为每一个数据点都绘制指示线段或者都不绘制#文本标签相互排斥，远离数据点，远离绘图区域（面板）的边缘。#ggrepel包的安装和加载#从CRAN安装install.packa
三菱PLC大型项目实战指南：从零基础到成功实施 Mountain and sea 三菱plc入门系列学习自动化
三菱PLC大型项目实战指南：从零基础到成功实施作为一名刚入门的电气工程师，想要通过一个大型项目来实践三菱PLC可能会感到有些挑战，但这是一个非常有意义的过程。以下将详细介绍如何从零基础开始，一步步完成一个大型项目，并最终成功实施。一、前期准备学习基础知识了解PLC的基本组成：首先，熟悉三菱PLC的基本结构，包括中央处理单元（CPU）、程序存储器、数据存储器和输入输出端口。掌握Ladder语言：三菱
22章9节：使用 R Markdown 和 Shiny 结合R语言进行数据报告和交互式应用的创建 DAT｜R科学用R探索医药数据科学 r语言开发语言大数据人工智能 r语言-4.2.1
R语言是数据科学领域中广泛应用的编程语言之一，它的强大之处不仅在于数据分析能力，还体现在其丰富的可视化和报告生成功能上。在数据分析的过程中，生成报告、展示结果和与他人共享工作成果是非常重要的任务。Shiny是一个用于构建交互式Web应用的R包，它能够将R语言的分析能力与动态、互动的Web界面结合起来，允许用户与数据交互、实时更新结果。在本文中，我们将探讨如何使用RMarkdown和Shiny结合R
4-R判断语句 qwy715229258163 R语言 r语言 python 开发语言
R判断语句判断结构要求程序员指定一个或多个要评估或测试的条件，以及条件为真时要执行的语句（必需的）和条件为假时要执行的语句（可选的）。下面是大多数编程语言中典型的判断结构的一般形式：R语言提供了以下类型的判断语句：if语句if…else语句switch语句1.if语句一个if语句由一个布尔表达式后跟一个或多个语句组成。语法格式如下：if(boolean_expression){//布尔表达式为真将
ProtoBuf 官方文档（二）- 语法指引（proto2） n大橘为重n C++ProtoBuf protobuf rpc 序列化数据结构
翻译查阅外网资料过程中遇到的比较优秀的文章和资料，一是作为技术参考以便日后查阅，二是训练英文能力。此文翻译自ProtocolBuffers官方文档LanguageGuide部分翻译为意译，不会照本宣科的字字对照翻译以下为原文内容翻译语法指引（proto2）本指南介绍如何使用protocolbuffer语言来构造protocolbuffer数据，包括.proto文件语法以及如何从.proto文件生成
R语言机器学习与临床预测模型77--机器学习预测常用R语言包武昌库里写JAVA 面试题汇总与解析 spring log4j java 开发语言算法
R小盐准备介绍R语言机器学习与预测模型的学习笔记你想要的R语言学习资料都在这里，快来收藏关注【科研私家菜】01预测模型常用R包常见回归分析包:rpart包含有分类回归树的方法;earth包可以实现多元自适应样条回归;mgev包含广义加性模型回归;Rweka包中的MSP函数可用于回归。pls包中的plsr函数实现偏最小二乘和主成分回归。stats包中的ppr函数实现投影寻踪分析，同时包括线性回归的方
R语言文本分析天龙八部 waterHBO R语言 r语言开发语言
起因，目的:前面有人对“倚天屠龙记”进行分析，我这里只是进行模仿而已。完整的文件，已经绑定了，反正读者可以找一下。案例背景小说《天龙八部》是金庸先生所著的武侠小说，也是“射雕三部曲”的前传。全书共50章，字数超过一百万字。故事发生在北宋末年，以大理国、大辽、西夏、吐蕃和北宋五国之间的纷争为背景，讲述了乔峰、虚竹、段誉三位主角的江湖恩怨和爱恨情仇。小说中融入了丰富的历史元素和深刻的人生哲理，展现了人
ggalign：热图等复杂组合图及图形数据对齐的 ggplot2 扩展万木春❀ r语言
ggalign一个R语言绘图工具ggplot2的高级扩展，它专注于在多个图形之间对齐观察值，利用vctrs包中的“numberofobservations”或NROW()函数，确保图形组织的一致性。无论是自包含排序图形的对齐，还是在多个图形中应用一致的分组和排序（如k-means聚类），ggalign都可以帮助简化这一过程。文档：Aggplot2ExtensionforConsistentAxis
R语言数据分析案例：使用R进行销售数据分析 ByteWhisper r语言数据分析开发语言 R语言
R语言数据分析案例：使用R进行销售数据分析数据分析在现代业务决策中起着重要的作用。R语言作为一种功能强大且广泛使用的数据分析工具，为分析师提供了许多有用的功能和库。在本案例中，我们将使用R语言来分析销售数据，帮助我们了解销售趋势、客户行为以及产品表现。首先，让我们导入所需的库，并加载我们的销售数据集。#导入库library(dplyr)library(ggplot2)#加载数据集sales_dat
R语言如何对excel数据进行操作安宁ᨐ r语言 excel 开发语言
在R语言中，可以使用`readxl`包来读取和操作Excel数据。首先，需要安装`readxl`包，可以使用以下命令安装：```install.packages("readxl")```安装完成后，加载`readxl`包：```library(readxl)```读取Excel文件：```data<-read_excel("path_to_excel_file.xls")```其中，`path_t
使用R语言进行数据框操作代码创造者 r语言开发语言 R语言
使用R语言进行数据框操作数据框（DataFrames）是R语言中一种常用的数据结构，它类似于表格，可以用于存储和处理结构化数据。本文将介绍如何使用R语言进行数据框的操作，包括创建数据框、添加和删除列、选择和过滤数据等常见操作。创建数据框首先，我们需要了解如何创建一个数据框。下面的代码演示了如何使用data.frame函数创建一个包含学生信息的数据框：#创建数据框students<-data.fra
Rust代写 OCaml代做 Go R语言 SML Haskell Prolog DrRacket Lisp matlabgoodboy rust golang r语言
Rust：Rust是一种注重性能和安全性的系统编程语言。它具有严格的内存管理，能够防止许多常见的内存错误。Rust作业可能涉及编写高效的算法、处理并发问题、与操作系统接口等。OCaml：OCaml是一种函数式编程语言，具有强大的类型系统和模块系统。它适合用于开发高性能、高可靠性的应用程序。OCaml作业可能涉及编写函数、处理数据结构、实现算法等。Go：Go（又称Golang）是一种编译型、并发型，
r语言 xml html,R语言读取XML文件-xml文件 bean.Xu r语言 xml html
XML文件简介在计算机领域，XML(extensiblemarkuplanguage)指的是可扩展标记语言，类似于HTML，它设计的宗旨是传输数据，而不是显示数据，所以这也是它和HTML的一个明显的差别。另外一个差别是XML的标签没有被预定义，我们可以根据自己的需要自行设计标签名字，所以具有自我描述性。一个具体的例子以上就是一个XML的例子，它拥有发送者和接受者，标题，内容等信息，所以自我描述非常
datapasta包学习-可复制网页、Excel表格等其他来源的数据至Rstudio中凑齐六个字吧科研工具数据挖掘
datapasta是一个R语言中用于优化数据复制和粘贴（copy-paste）的R包，旨在简化数据导入和转换过程，减少手动格式调整的需求，提高数据整理的效率。功能介绍将Excel/CSV/表格数据快速粘贴到R代码：可将剪贴板中的数据直接转换为data.frame、tibble、vector等格式，无需手动整理格式。从R数据转换为文本格式（适用于论文、报告）：支持将R变量（如data.frame、向
R语言：将R语言中的Seurat数据对象转换为Python能处理的h5ad格式 S.GJ r语言 python 开发语言
背景在基因组学数据分析场景下，有些数据被保存为了R语言中的Seurat对象格式，我们的需求是将Seurat对象格式的数据转换为Python能处理的h5ad格式。R处理代码###1.准备工作#1.1readr包安装install.packages("readr")#1.2Seurat包安装#略#1.3SeuratDisk包安装remotes::install_github("mojaveazure/
【cran Archive R包的安装方式】遗落凡尘的萤火-生信小白 r语言开发语言
cranArchiveR包的安装方式添加链接描述1.包被cran移除2.包要求的R语言版本与你电脑上的版本不相符ad=archive包的网址或者是下载到工作目录下，ad等于文件名install,packages(adrepos=NULL)
R语言 Rstudio 安装包报错：安装包‘ ’时出现非零退出状态数据智团 r语言开发语言 R语言
问题描述：在使用R语言和RStudio时，尝试安装包时遇到了报错信息：“installationofpackage‘’hadnon-zeroexitstatus”。这个错误提示表明在安装特定的R包时出现了问题，导致安装过程未能成功完成。解决方法：出现这个错误的原因可能有多种，下面将介绍几种常见的解决方法。检查包名和版本：确保在安装包时提供了正确的包名，并且该包存在于CRAN（Comprehensi
R语言|1.2 R语言的工作空间管理 wqqqqqq_ R语言 r语言开发语言
#R语言|1.2R语言的工作空间管理工作空间是R的工作环境。退出R时，如果选择保存工作空间，R将会在工作空间所在文件夹中创建两个文件，“.Rhistory”，其中保存R中输入的任何命令，另一个为".Rdata"是将工作空间中的所有对象都保存在其中。工作目录(workingdirectory)，用来读取文件和保存结果的一个文件夹。我们可以使用函数getwd()查看当前的工作目录，也可以使用函数set
R语言环境下载和RStudio安装教程 CyberXZ r语言开发语言 R语言
R语言环境下载和RStudio安装教程R语言是一种广泛应用于统计计算和数据分析的编程语言。它提供了丰富的统计和图形功能，被广泛用于数据科学、机器学习和数据可视化等领域。本教程将向您介绍如何下载和安装R语言环境以及RStudio集成开发环境。步骤1：下载R语言环境首先，您需要下载R语言环境。请按照以下步骤进行操作：在您的Web浏览器中打开R官方网站（https://www.r-project.org
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST