Ubuntu Server 18.04 搭建深度学习平台

心已入冬 提交于 2019-12-29 19:46:57

【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>

1、设置python版本

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

2、安装Anaconda虚拟环境管理

wget https://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.sh

# bash Anaconda3-5.2.0-Linux-x86_64.sh

记得把环境变量添加在系统中,最后是否安装VScode建议不安装

3、安装CUDA和cuDNN,在版本选择上因为GPU原因选择CUDA10.0和相应的cuDNN

选择对应系统的版本,在线安装:https://developer.nvidia.com/cuda-10.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=debnetwork

https://developer.nvidia.com/rdp/cudnn-download需要注册登录账号,下载后解压

sudo cp cuda/include/cudnn.h    /usr/local/cuda/include      
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*

4、下载并安装GPU驱动

https://www.nvidia.cn/Download/index.aspx?lang=cn

lsmod | grep nvidia,如果有NVIDIA驱动,请先卸载

lsmod | grep nouveau,如果有其他驱动,将其他显卡驱动加入黑名单,操作如下:

cd /etc/modprobe.d/

创建blacklist-nouveau.conf并添加内容

sudo touch blacklist-nouveau.conf

sudo echo "blacklist nouveau">>blacklist-nouveau.conf

sudo echo "options nouveau modeset=0">>blacklist-nouveau.conf

查看blacklist-nouveau.conf内容是否添加成功

sudo cat blacklist-nouveau.conf

sudo update-initramfs -u

现在请重启机器,使用init 3进入命令行界面

sudo chmod +x NVIDIAXXXXXXXXX.run

sudo ./NVIDIAXXXXXXXX.run -no-opengl-files 完成安装

nvidia-smi检查显卡是否在工作

5、创建conda虚拟环境,安装Tensorflow或者Pytorch

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

conda config --set show_channel_urls yes

conda create --name XXXX python=3.X

conda install pytorch torchvision cudatoolkit=10.0 -c pytorch

到这里,你的深度学习平台已经搭建完成,你可以把它分享给其他人使用了。

不足之处,还望指正,谢谢!!

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!