基于Python的数据处理与可视化(学习笔记1)

基于Rstudio的Python环境配置

至今,Python和R语言是当前众多科研工作者青睐的两种数据处理与可视化的分析语言。鉴于本人熟练于R语言的操作,基于Python的数据处理与可视化学习思路将借鉴R语言的数据操作思路进行后续学习。简而言之,基于Python的数据处理与可视化学习将涉及三个环节,即数据输入,数据的分析与可视化以及数据的保存。

另外,同R语言类似,Python也需要一个解释器,便于科研工作者学习与交流。由于Python解释器众多,同样本人熟练于R语言的操作,后续的Python学习将借助于Rstudio作为解释器。下面将是Rstudio解释器、R语言以及相关Python学习包的安装以及准备工作。

1、R语言安装:

R语言包下载路径:https://www.r-project.org/

可根据自己的系统,选择不同的安装版本。如Mac版本:R4.1

R语言Mac版本下载界面如下: 

R语言安装:双击R语言pkg文件即可,可默认安装。

2、Rstudio安装:

Rstudio安装包下载路径:https://www.rstudio.com/

同理,根据自己的系统选择不同的安装版本。如Mac版本:Rstudio

Rstudio Mac版本下载界面如下:

3、R包reticulate安装: R interface to Python

1)根据自己的系统,可自行下载reticulate包,实现本地安装。该包下载路径为reticulate1.2.0

2)在线安装:install.packages("reticulate")

3)reticulate包调用命令:

library(reticulate)  ##调用reticulate包

repl_python()   ##在 R 会话中嵌入的 Python REPL


4)基于reticulate包安装python包:py_install("pandas")  ##安装pandasy包


以上,基于Rstuido作为Python解释器的准备工作就绪。接下来将是Python中numpy、panda和matplotlib三大工作的学习。

你可能感兴趣的:(基于Python的数据处理与可视化(学习笔记1))