R中名词空格

【01】空格替代名词

rm(list = ls())
library(tidyverse)
library(stringr)
library(htmlwidgets,htmltools)
sentences
noun <- "(a|the|an) ([^ ]+)"
has_noun <- sentences %>%
  str_subset(noun) %>%
  head(10)
AA <-tibble(sentence = sentences) %>%
  tidyr::extract(
    sentence, c("article", "noun"), "(a|the) ([^ ]+)",
    remove = FALSE
  )
view(AA)
AA <- na.omit(AA)  ##删除有NA的行。
AA$sentence <-   str_replace(AA$sentence,AA$noun, " ____ ")  #替代:AA$noun用____替代。

效果展示:

image.png

noun <- "(a|the|an) ([^ ]+)" :定冠词+空格+任意单词。
任意单词也可以写成:([A-Za-z]+)
image.png

去除NA的行后:
image.png

最终效果。
image.png

【02】 交换 words 中单词的首字母和末尾字母,其中哪些字符串仍然是个单词?

library(tidyverse)
library(stringr)
library(htmlwidgets,htmltools)
BB000 <- str_replace_all(words, "^([A-Za-z])(*)([A-Za-z])$", "\\3\\2\\1")
intersect(BB000, words)

你可能感兴趣的:(R中名词空格)