关键字:docker
jupyter notebook
pytorch
spotlight
原载地址:https://www.jianchengss.com/2018/02/11/Docker-使用jupyter-notebook基础镜像搭建自己的PyTorch开发环境/
转载请注明出处!
使用基础镜像jupyter/datascience-notebook,因为它预装了常用的模块:pandas, matplotlib, scipy, seaborn, scikit-learn, scikit-image, sympy, cython, patsy, statsmodel, cloudpickle, dill, numba, bokeh
;
docker run -it --rm -p 8888:8888 jupyter/datascience-notebook:281505737f8a
其中
docker run
是使用一个镜像生成一个运行的容器;
-it
指交互模式,启动后终端在运行着的容器里面,与之对应的有-d
后端运行模式,启动后终端交互在实体机,要想进入容器需要使用命令docker exec -it container-name bash
docker exec -it container-name
意为交互模式进入正在运行的一个容器,bash
意为进入容器后使用的命令,这里用的是bash,这样进入容器后就能执行shell;
--rm
意为退出shell的时候自动删除容器,常在测试的时候使用,这样不用每次修改去删除已有的容器;
-p 8888:8888
指的是端口映射,前面的是实体机的端口,后面是容器里面暴露出的端口,两边端口可以不一样,这样同一个镜像可以启动多个对应不同端口的服务;
jupyter/datascience-notebook:281505737f8a
是镜像名字,冒号后面的是tag,类似于版本的概念,如果不显式的给出tag每次都回从hub上拉取latest的镜像,如果网络环境不好的话比较费时间,推荐显式给出tag,这样每次构建都会使用已有的镜像。
启动后就可以在终端看到:
[I 04:01:05.691 NotebookApp] Running the core application with no additional extensions or settings
[I 04:01:05.692 NotebookApp] Serving notebooks from local directory: /home/jovyan
[I 04:01:05.692 NotebookApp] 0 active kernels
[I 04:01:05.692 NotebookApp] The Jupyter Notebook is running at:
[I 04:01:05.692 NotebookApp] http://[all ip addresses on your system]:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a
[I 04:01:05.692 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[C 04:01:05.692 NotebookApp]
Copy/paste this URL into your browser when you connect for the first time,
to login with a token:
http://localhost:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a
此时是停在容器里面,打开浏览器 访问http://localhost:8888/?token=0a3331628e0e35f94eb0ad543faeb3e396fbccfa3ff06e5a
即可打开基本的jupyter notebook 环境,后面的token是随机生成的;
# Python脚本生成密码
import IPython
IPython.lib.passwd()
输入密码生成token
test的token:sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563
docker run -d -p 8888:8888 jupyter/datascience-notebook start-notebook.sh --NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'
这时访问http://localhost:8888/
会出现输入密码的页面,输入正确的密码才能进入jupyter。
docker提供-v
参数使实体机和容器共享目录,这对于有状态的服务很有用,目录挂载添加参数:
-v /home/jason/jason/docker/notebook:/home/jovyan/work
docker run -it --rm -p 8888:8888 -v /home/jason/jason/docker/notebook:/home/jovyan/work jupyter/datascience-notebook start-notebook.sh --NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'
这样在jupyter里新建的notebook都会出现在实体机指定的目录里。由于这个镜像的原因 需在work目录下新建才能在实体机看到。
因为没有合适的pytorch镜像,自己编辑Dockerfile:
新建文件Dockerfile
并编辑内容:
FROM jupyter/datascience-notebook:281505737f8a
MAINTAINER Jason.W. "[email protected]"
# 下面是按官网的方法安装spotlight
#RUN pip --no-cache-dir install --upgrade install http://download.pytorch.org/whl/cu75/torch-0.2.0.post3-cp36-cp36m-manylinux1_x86_64.whl
#RUN pip --no-cache-dir install --upgrade torchvision
# pytorch
RUN conda install pytorch torchvision -c soumith
# spotlight(https://github.com/maciejkula/spotlight)
RUN conda install -c maciejkula -c soumith spotlight=0.1.2
在Dockerfile目录里运行命令:docker build -t jianchengss/datascience-pytorch:0.1 .
这样就生成了image:jianchengss/datascience-pytorch:0.1
可以运行docker images
查看本机上所有的image。
docker run -it --rm -p 8888:8888 -v ~/workspace/python/notebooks-pytorch:/home/jovyan/work --privileged=true jianchengss/datascience-pytorch:0.1 start-notebook.sh --NotebookApp.password='sha1:6587feaef3b1:6b243404e4cfaafe611fdf494ee71fdaa8c4a563'
经过以上步骤,测试完成后既可以执行最终运行的命令 注意 token换成自己的
docker run -d -p 8588:8888 -v ~/workspace/python/notebooks-pytorch:/home/jovyan/work --privileged=true --name=pytorch jianchengss/datascience-pytorch:0.1 start-notebook.sh --NotebookApp.password='sha1:7aee2f913c8e:17d40f203cbd5c9820f302894a92724c3de9fba6'
-it --rm
换成了 -d
,比之前多的参数有:
--name=pytorch
,意为给container取一个名字,好区分和管理,缺省的话名字为一串随机的字符串。
--privileged=true
出现文件夹访问权限的时候添加该属性
此时运行docker ps
即可查看运行着的容器:
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
3bd3e30e9ab3 jianchengss/datascience-pytorch:0.1 "tini -- start-notebo" 4 seconds ago Up 3 seconds 0.0.0.0:8588->8888/tcp pytorch
容器启动后有时候需要进入容器操作,比方说查看信息或者安装新的软件,此时执行docker exec -it pytorch bash
docker stop container-name # 停止运行着的容器
docker rm container-name # 删除已有的容器,要先停止
docker rmi image-name # 删除已有的镜像