gdc下载后数据整理需要的基础代码--你需要的是自省再调整脚步

gdc下载后数据量的巨大,一般让4~8g的小电脑难以撑过去,如何在只选取小文本来查看数据格式和核对是否符合预计值,是很需要基础函数的帮助的。如何轻松举一反三,都有赖于对基础函数的熟练掌握。突然会让我有一种觉醒,面对个性化的数据我处理得总不顺手顺心,可能不是水逆,可能不是我学的包不够多,应该是我没对基础函数有意识上的认知,且没有对它们进行刻意练习。
日后需要进步得不浪费时间,我觉得应日常自省不会的点在哪里,list出来,逐个去突破。是因为数据、包或函数过于新奇从没涉猎,还是缺乏记忆,还是缺乏理解,还是缺乏练习,还是缺乏基础背景知识的认知。
练习时应搭配几个函数一起,套合一起去做刻意练习。
一般的操作必备(持续整理和更新):
1.简练你的操作和日后工作量,将简单的数据集,或操作打包装为function;
2.循环语句练习 lapply(), sapply(),for循环的差异;
3.字符串处理:string包,strngr::str_to_upper(),substr() 等;
4.筛选、过滤数据:x %in% y, match()函数
5.整合数据:dplyr包,dplyr::inner_join(), cbind(), merge()的差异
6.逻辑值判断:ifelse,
7.数据定位:which()

你可能感兴趣的:(gdc下载后数据整理需要的基础代码--你需要的是自省再调整脚步)