R语言——字符串提取函数

1、substr函数:提取指定位置的字符

根据身份证号计算年龄:

# 读入数据
id_number <- readxl::read_excel("D:/身份证.xlsx",sheet="Sheet1")

R语言——字符串提取函数_第1张图片

# 提取出生年份
year1 <- substr(id_number$身份证号,7,10)
# year2 <- substring(id_number$身份证号,7,10) 也是一样的

在这里插入图片描述

# 计算年龄
year <- format(Sys.time(),"%Y")  #若是输入的日期,可以使用as.Date函数将输入的日期转变为日期型,在提取出生日期

age <- as.numeric(year)-as.numeric(year1)
age

在这里插入图片描述

2、str_extract函数:提取首个匹配模式的字符

# 因为身份证号有规律,可以通过指定字符串中的字符位置提取规定的值;若不知道字符串的位置,可通过stringr包中的str_extract函数提取,可使用正则表达式匹配。
str_extract(id_number$身份证号,

你可能感兴趣的:(R语言——字符串提取函数)