把jupyter-notebook装进docker里

吃可爱长大的小学妹 提交于 2019-12-17 19:43:11

【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>

jupyter-notebook是我很喜欢的工具,搭环境稍显麻烦,其实jupyter web形式的使用方式,最好的部署方式是在云上,一次部署到哪里都可以使用,岂不快哉。现在各家云服务器还挺贵的,docker出来后,我就琢磨把jupyter-notebook放到容器中。

Docker及系统

已经安装好的同学可以忽略这一节。我喜欢用ubuntu,所以host 系统是ubuntu,docker容器中的系统也是ubuntu。ubuntu apt-get源默认按装的docker版本不是最新版本的,需要通过添加源的方式来安装最新版本的docker。参考链接

#添加ubuntu apt 的https访问能力
$ sudo apt-get install apt-transport-https

#将Docker官方资料库的访问Key添加到你本地系统
$ sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-keys 36A1D7869245C8950F966E92D8576A8BA88D21E9

#将docker 资料库地址添加到apt源列表
$ sudo bash -c "echo deb https://get.docker.io/ubuntu docker main > /etc/apt/sources.list.d/docker.list"

#安装
$ sudo apt-get update
$ sudo apt-get install lxc-docker

Docker安装好以后就要拉一个ubuntu版本镜像,我拉的是ubuntu:14.04

docker pull ubuntu:14.04

启动容器

容器是存放jupyter-notebook的地方,我们要做的是基于精简版的ubuntu镜像启动一个容器,然后在里面安装sshd这种远程登录的工具。
先让容器以交互式虚拟终端的方式启动,如果需要使用和host不同的DNS server配置,可以使用--dns参数指定DNS server,否则新启动的docker 容器会复制host的/etc/resolv.conf。

docker run -i -t ubuntu:14.04 /bin/bash

安装sshd的过程比较简单,我通常安装openssh-server

sudo apt-get install openssh-server

然后编辑它的配置文件 /etc/ssh/sshd_config,注释掉配置文件中的"PermitRootLogin without-password",再增加一句"PermitRootLogin yes"使得root用户可以远程登录。然后用将这个安装好sshd的容器做成镜像。
之后基于新镜像启动容器,用端口映射的方式,映射ssh端口到host,之后通过ssh指定端口的方式登录到docker 容器。jupyter-notebook的默认端口号是8888,也可以提前考虑,在这里多映射几个外部端口。

docker run -d -p 30001:22 --name jupyter-notebook ubuntu:14.04-sshd /usr/sbin/sshd -D

安装jupyter

这个过程基本和在ubuntu系统上安装jupyter的过程是一样的,但容器中的ubuntu是个最简环境,没有安装python-dev包。

#更新apt-get环境
apt-get update

#安装python dev包
apt-get install python-dev

#安装jupyter
pip install jupyter

安装过程需要注意的是,由于墙的原因,ubuntu的源和pip的源都换成国内的源,我ubuntu用的是网易的源,pip用的是清华的源。

使用jupyter

jupyter 默认只能通过本地地址访问,要放开配置,允许jupyter远程访问。在放开远程访问时,需要设置密码,jupyter的配置文件只支持加密后的密文密码(赞一个)

#生成jupyter配置文件,这个会生成配置文件.jupyter/jupyter_notebook_config.py
jupyter notebook --generate-config

#使用ipython生成密码
In [1]: from notebook.auth import passwd
In [2]: passwd()
Enter password: 
Verify password: 
Out[2]: 'sha1:38a5ecdf288b:c82dace8d3c7a212ec0bd49bbb99c9af3bae076e'

#去配置文件.jupyter/jupyter_notebook_config.py中修改以下参数
c.NotebookApp.ip='*'                          #绑定所有地址
c.NotebookApp.password = u'刚才生成的密码'
c.NotebookApp.open_browser = False            #启动后是否在浏览器中自动打开
c.NotebookApp.port =8888                      #指定一个访问端口,默认8888,注意和映射的docker端口对应

配置完成以后,就可以用 jupyter notebook命令把jupyter启动起来了,然后你就可以看到一个超级简洁的jupyter登录界面了。输入密码就可以开始使用jupyter了。

扩展

如果要大数据分析,还需要安装很多大数据相关的包。
我用jupyter最多的还是使用pandas/scikit-learn,所以我会继续安装这两个包,大家可以根据自己需要继续安装自己想要的python包。

#安装numpy,安装过程中会有c文件的编译,可能会报些错,但不影响最终结果
pip install numpy

#安装scipy,安装过程中会有c文件的编译,可能会报些错,但不影响最终结果
pip install scipy

#安装matplotlib
pip install matplotlib

#安装pandas
pip install pandas
pip install scikit-learn

总体来说pip的包管理还是比较好的,除了numpy、scipy编译时报的一堆错误,整体安装过程比较顺畅。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!