数据分析环境平台搭建
一、Conda环境介绍
1、简介
1.1、conda环境和virtualenv虚拟环境的区别
- conda创建的是一个独立python解释器,独立模块管理的目录结构
- virtualenv创建的是一个共享python解释器,独立模块管理的目录结构
1.2、安装方法
- 下载miniconda
- 推荐使用国内镜像进行下载:
- 国内一般使用清华源和中科大源
- 中科大: http://mirrors.ustc.edu.cn/help/anaconda.html
- 清华: https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
- 配置模块仓库下载镜像源
$ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
$ conda config --set show_channel_urls yes
1.2 创建新的conda环境
$ conda create -n 环境名 python=3.6
1.2.1 查看conda环境
$ conda info -e
1.2.2 切换conda环境
$ source activate 环境名
1.2.3 删除conda环境
$ conda remove -n 环境名 --all
1.3 模块安装
- conda install 模块名
- 从conda源中寻找模块下载文件,自动下载模块的所有依赖文件
- pip install 模块名
二、Anaconda和Conda的关系
- Anaconda是一个python的数据领域的发型版本
- 预装了150个以上的Packages
- 自带了IDE工具
三、Jupyter Notebook的使用
3.1 启动程序
$ jupyter notebook
3.2 使用方法
3.2.1 命令模式
- Enter : 转入编辑模式
- Shift-Enter : 运行本单元,选中下个单元
- Ctrl-Enter : 运行本单元,选中当前单元
- Alt-Enter : 运行本单元,在下面插入一单元
- Y : 单元转入代码状态
- M :单元转入markdown状态
- A : 在上方插入新单元
- B : 在下方插入新单元
- dd :删除当前cell
3.2.2 编辑模式
3.3 魔术方法
3.3.1 外部文件
使用下面命令运行外部python文件(默认是当前目录,最好加上绝对路径)
%run *.py
3.3.2 时间统计
用下面命令计算statement的运行时间:
%time statement
用下面命令计算statement的平均运行时间:
%timeit statement
timeit会多次运行statement,最后得到一个更为精准的预期运行时间