第二讲 数据结构入门实战练习

第二讲 数据结构入门实战练习_第1张图片

第一部分:猴子课程学习简要

数据分析系统的四个步骤:
1、房子设计—设计结构
2、从哪开始盖房子—R环境
3、准备材料—数据结构
4、组合材料—算法

盖房子=材料+整合材料
程序=数据结构+算法

R是运行环境,RStudio是开发工具。

数据结构有哪些:
1、向量;2、矩阵;3、数组;4、数据框;5、列表;6、因子

学习数据结构的方法论:
1、定义
2、如何使用

第二部分:课程学习练习

一、定义向量练习

第二讲 数据结构入门实战练习_第2张图片
第二讲 数据结构入门实战练习_第3张图片

二、建立矩阵练习

第二讲 数据结构入门实战练习_第4张图片
第二讲 数据结构入门实战练习_第5张图片

三、访问数据元素练习

第二讲 数据结构入门实战练习_第6张图片
第二讲 数据结构入门实战练习_第7张图片

四、病人数据建立矩阵

第二讲 数据结构入门实战练习_第8张图片
第二讲 数据结构入门实战练习_第9张图片

五、绘制病人年龄柱状图

第二讲 数据结构入门实战练习_第10张图片
第二讲 数据结构入门实战练习_第11张图片

六、定义一个3维数组练习

第二讲 数据结构入门实战练习_第12张图片
第二讲 数据结构入门实战练习_第13张图片

七、定义病人数据框练习

第二讲 数据结构入门实战练习_第14张图片
第二讲 数据结构入门实战练习_第15张图片

八、查找部分数据练习

第二讲 数据结构入门实战练习_第16张图片
第二讲 数据结构入门实战练习_第17张图片
第二讲 数据结构入门实战练习_第18张图片

九、新增加第5个病人数据

第二讲 数据结构入门实战练习_第19张图片
第二讲 数据结构入门实战练习_第20张图片

十、增加入院时间列数据

第二讲 数据结构入门实战练习_第21张图片

十一、获取病人数目方法

第二讲 数据结构入门实战练习_第22张图片
第二讲 数据结构入门实战练习_第23张图片

第三部分:课后作业实战

猴子老师说的非常正确,程序必须是多动手实践,尤其是对我这代码小白来说。实践、实践、再实践。
一、练习从文件夹中读取.xlsx类型的病例数据文件。


#实践练习-病例数据
#从文件夹读取数据excel数据
#载入readxl包
library(readxl)
#从文件中读取病例数据.xlsx文件
patient.data <- read_excel("~/百度云同步盘/数据分析/R-DATA/病例数据.xlsx")
patient.data

第二讲 数据结构入门实战练习_第24张图片

二、练习用数据框存储病例数据。

#用数据框存储数据
#病人编号1
patient1 <- c(1,2,3,4)
#姓名1
name1 <- c("猴子","李同","王五","张三")
#年龄1
age1 <- c(29,34,28,52)
#糖尿病类型1
diabetes1 <- c("1型糖尿病","2型糖尿病","1型糖尿病","2型糖尿病")
#病情1
status1 <- c("较差","较好","显著较好","较差")
#病情EN
statusEN <- c("Poor","Improved","Excellent","Poor")
patientdata1 <- data.frame(patient1,name1,age1,diabetes1,status1,statusEN,stringsAsFactors = FALSE)
patientdata1

第二讲 数据结构入门实战练习_第25张图片

三、完成有多少病人和患“2型糖尿病”病人的数据分析。

#数据分析任务一:有多少个病人患糖尿病
patientNum <- nrow(patientdata1)
patientNum
#分析的结果为4个病人
#数据分析任务二:有哪些病人患“2型糖尿病”
diatetestype <- patientdata1[patientdata1$diabetes1=="2型糖尿病",]
diatetestype

第二讲 数据结构入门实战练习_第26张图片

第四部分:学习心得

第二讲 数据结构入门实战练习_第27张图片

学习过程中一些陆续遇到几个困难点,经过请教别人以及google搜索,我自己努力的挣扎专研,终于得以解决,先说明如下,如果大家在学习中也到过此类问题,希望能给你一点点启示作用。
1、在绘制病人年龄的柱状图时,出来的柱状图标题文字是乱码,刚开始以为我的代码有问题,反复操作,还是如此,经求主发现是程序默认字体问题(使用的MAC系统),需要在绘制图形前定义字体。

第二讲 数据结构入门实战练习_第28张图片

添加设置字体代码:par(family="PingFangSC-Regular"),我设置的系统的苹方字体,当然你可以根据你的电脑系统安装的字体,设置不同的字体。可以在系统的字体库中查找安装的字体哦。设置完执行下,乱码问题就完美解决了。
2、是在读取excel文件时,根据介绍,把.xlsx格式另保存为.csv格式,然后用read.csv(file,n ),但是不知道问什么,MAC系统上始终不成功,提示文件路径不正确。经过变通思维,换另一种方法。用library(readxl)命令,载入。
读取excel的包,再使用read_excel(file)直接读取。

#载入readxl包
library(readxl)
#从文件中读取病例数据.xlsx文件
patient.data <- read_excel("~/百度云同步盘/数据分析/R-DATA/病例数据.xlsx")
patient.data

3、编程是严谨的,需要非常细心的输入,有时由于一个标点符号的问题,就无法得到正确的结果。所有细心输入必要原则。

4、遇到问题多去不耻下问,当然更多的是学会用google搜索,学会用搜索找到自己需要的问题的答案也是一种能力的锻炼。有事问谷哥吧。然后,就是要加油学习英文,只有在国外的网站上可以找更多最新的东西。

经过数据结构入门的学习,发现自己慢慢的喜欢上了编程,尤其当输入一行行代码后,出现自己想要的结果的那种喜悦感。感谢大家的指导,也给我自己一个(经过拧着头皮的学习了几天,终于有点成就感)。相信坚持继续下去,会有更大的收获——学会大数据编程、学会用搜索、学会用英语、学会写作。

“理论的力量关键体现在行动上。”

让我们行动起来吧!!!

2017年03月10日

作者:壹亮3278(微信号:yiliang3278),移动互联网产品设计、产品经理,数据分析的学习者。不断自我迭代,自我升级,希望和知识爱好者共同进步,让我们用成长去遇见美好的未来!!!

————“自律是成功的基石。”————


《数据分析学习之路系列》系列
大数据之数据分析精进之路:起跑
00-R语言的认识、下载和安装
01-R语言入门
R语言实战—02-创建数据集

你可能感兴趣的:(第二讲 数据结构入门实战练习)