这年头没有火眼金睛,不敢教R语言了

问题背景

https://mp.weixin.qq.com/s/DFIwVwrgN4s-FK4WjWuO3Q

在这一篇推文里,我写了怎么正确显示坐标轴顺序。

不调整的话横坐标默认是这样:



调整正确的是这样:


然而有位学员搬砖的时候报了错。

示例流程

1.生成示例数据

if(!require(tidyr)) install.packages("tidyr")
#> Loading required package: tidyr
library(tidyr)

x=matrix(rnorm(2200,mean=1.5,sd = 0.2),ncol = 22)
test=as.data.frame(x)
colnames(test)=paste0("chr",1:22)
test2 <- gather(test,key = "chr",value = "values")
head(test2,3)
#>    chr   values
#> 1 chr1 1.173558
#> 2 chr1 1.749868
#> 3 chr1 1.374387
table(test2$chr)
#> 
#>  chr1 chr10 chr11 chr12 chr13 chr14 chr15 chr16 chr17 chr18 chr19  chr2 
#>   100   100   100   100   100   100   100   100   100   100   100   100 
#> chr20 chr21 chr22  chr3  chr4  chr5  chr6  chr7  chr8  chr9 
#>   100   100   100   100   100   100   100   100   100   100

2.调整横轴对应列的顺序

关键代码是:

test2$chr <- factor(test2$chr,levels=paste0("chr",1:22),ordered = TRUE)

3.出图

顺利做出了正确的图

if(!require(ggplot2))install.packages("ggplot2")
#> Loading required package: ggplot2
library(ggplot2)
p1 <- ggplot(test2,aes(x = chr, y = values)) + 
  geom_boxplot()+
  theme_bw()+
  theme(axis.text.x = element_text(angle=50,vjust = 0.5))
p1

翻车现场

这么简单的代码,发生了报错。

错误代码

options(stringsAsFactors = F)
a <-data.frame(case=paste("S",c(1:50)),values=runif(50)) 
a$case <- factor(a$case,levels=paste0("S",1:50),ordered = TRUE)
plot(a$case,a$values)

warning和报错信息

#> Warning in min(x): no non-missing arguments to min; returning Inf
#> Warning in max(x): no non-missing arguments to max; returning -Inf
#> Error in plot.window(xlim = xlim, ylim = ylim, log = log, yaxs = pars$yaxs): need finite 'ylim' values

有报错,请搜索

直接复制到必应搜索,可以看到这个链接:
https://stackoverflow.com/questions/21349368/error-in-plot-window-need-finite-xlim-values

总结一下答案的意思,其实就是数据全是NA。一检查,果不其然,全是NA。

a$case
#>  [1]              
#> [15]              
#> [29]              
#> [43]        
#> 50 Levels: S1 < S2 < S3 < S4 < S5 < S6 < S7 < S8 < S9 < S10 < ... < S50

为何都是NA

这样一个简单的报错竟然花了我十几分钟时间去解决,我先后测试了这个数据有没有问题,分别用ggplot2和plot作图,plot支不支持因子型数据,然后又看了因子水平是不是不能有空格。

(叫苦不迭,我根本没有学过基础包作图,我是直接学的ggplot2啊啊啊啊,而且因子挖的坑,早就被哈德雷叔叔填平了,如果不是在后面的教学中必须要讲基础包,我可能碰都不碰它。)

火眼金睛

全是NA的原因非常简单,因子水平和内容完全不对应,内容用的函数是paste,水平用的函数却成了paste0。

paste0("S",1:50)
#>  [1] "S1"  "S2"  "S3"  "S4"  "S5"  "S6"  "S7"  "S8"  "S9"  "S10" "S11"
#> [12] "S12" "S13" "S14" "S15" "S16" "S17" "S18" "S19" "S20" "S21" "S22"
#> [23] "S23" "S24" "S25" "S26" "S27" "S28" "S29" "S30" "S31" "S32" "S33"
#> [34] "S34" "S35" "S36" "S37" "S38" "S39" "S40" "S41" "S42" "S43" "S44"
#> [45] "S45" "S46" "S47" "S48" "S49" "S50"
paste("S",1:50)
#>  [1] "S 1"  "S 2"  "S 3"  "S 4"  "S 5"  "S 6"  "S 7"  "S 8"  "S 9"  "S 10"
#> [11] "S 11" "S 12" "S 13" "S 14" "S 15" "S 16" "S 17" "S 18" "S 19" "S 20"
#> [21] "S 21" "S 22" "S 23" "S 24" "S 25" "S 26" "S 27" "S 28" "S 29" "S 30"
#> [31] "S 31" "S 32" "S 33" "S 34" "S 35" "S 36" "S 37" "S 38" "S 39" "S 40"
#> [41] "S 41" "S 42" "S 43" "S 44" "S 45" "S 46" "S 47" "S 48" "S 49" "S 50"

改正

其实想让这个代码正确运行异常简单,就加一个零而已。

a<-data.frame(case=paste0("S",c(1:50)),values=runif(50)) 
a$case <- factor(a$case,levels=paste0("S",1:50),ordered = TRUE)
plot(a$case,a$values)

后记

对于新手来说很多细微的小错误,却是越不过去的大坎。当你回过头去看看,会发现曾经的错误其实特别简单。

看别人的错误代码真要命啊。前面写paste,后面写paste0。虽然单独拿出来都没错,但是凑在一起就不对了。

/(ㄒoㄒ)/~~

如果一个人愿意花时间帮你找你写的代码报错原因,那。。。她心情一定很好。

看完这代码,心情怎么样就不一定了。比如我现在就想暴走。

你可能感兴趣的:(这年头没有火眼金睛,不敢教R语言了)