cuda

【pytorch-ssd目标检测】训练自己创建的数据集

百般思念 提交于 2020-08-10 09:30:04
制作类似pascal voc格式的目标检测数据集: https://www.cnblogs.com/xiximayou/p/12546061.html 代码来源:https://github.com/amdegroot/ssd.pytorch 拷贝下来的代码好多坑要踩。。。 我将其上传到谷歌colab上,当前目录结构如下: 需要说明的是,虽然我们只有2类,但是,要加上背景一类,所以总共我们有3类。 首先我们要读取自己的数据集 在config.py中 # config.py import os.path # gets home dir cross platform # HOME = os.path.expanduser("~") HOME = os.path.expanduser("/content/drive/My Drive/pytorch_ssd/") # for making bounding boxes pretty COLORS = ((255, 0, 0, 128), (0, 255, 0, 128), (0, 0, 255, 128 ), (0, 255, 255, 128), (255, 0, 255, 128), (255, 255, 0, 128 )) MEANS = (104, 117, 123 ) mask = { 'num_classes': 3, 'lr

安装 :win10 + CUDA 11.0 + cuDNN8.0.2 + Pytorch-gpu

冷暖自知 提交于 2020-08-09 16:24:56
安装 :win10 + CUDA 11.0 + cuDNN8.0.2 + Pytorch-gpu 前言 注意: 点进来的各位,你以为这是一篇正常的教程篇吗? ​ 不是的! 这是一篇劝退文。 笔者安装cuda11+pytorch-gpu失败,故有此文。 安装时间:2020-08-07 原因 安装CUDA和cuDNN时,请先打开 Pytorch-gpu安装命令链接 查看Pytorch是否有发布支持cuda11.0的binaries版本。 结果如下图: 可以看到,此时并无支持cuda11的binaries版本。 Pytorch论坛中给出了答案: https://discuss.pytorch.org/t/pytorch-with-cuda-11-compatibility/89254 Pytorch源里贴出了windows 支持cuda11的PR: https://github.com/pytorch/builder/pull/463 文末老哥劝一句,目前还是安装cuda10.2吧,从源build真的烦。 附cuda和cudnn链接: cuDNN: https://developer.nvidia.com/rdp/cudnn-download CUDA10.2 : https://developer.nvidia.com/cuda-10.2-download-archive 来源:

docker挂载NVIDIA显卡

半城伤御伤魂 提交于 2020-08-09 13:35:15
from: docker挂载NVIDIA显卡运行pytorch 写在前面:   请参考之前的文章安装好CentOS、NVIDIA相关驱动及软件、docker及加速镜像。   主机运行环境 $ uname - a Linux CentOS 3.10 . 0 - 514.26 . 2 .el7.x86_64 # 1 SMP Tue Jul 4 15 : 04 : 05 UTC 2017 x86_64 x86_64 x86_64 GNU/ Linux $ cat /usr/local/cuda/ version.txt CUDA Version 8.0 . 61 $ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 #define CUDNN_MAJOR 6 #define CUDNN_MINOR 0 #define CUDNN_PATCHLEVEL 21 #define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL) #include " driver_types.h " # NVIDIA 1080ti 一、关于GPU的挂载 1. 在docker运行时指定device挂载   先查看一下有哪些相关设备 $ ls -la

ERROR: for pigfarm-app Cannot start service pigfarm: OCI runtime create failed: container_linux.g...

自闭症网瘾萝莉.ら 提交于 2020-08-09 12:55:13
如下启动报错,就是驱动掉了引发的问题。 ubuntu@yufeichang1 : /data/pigfarm/packages/pigfarm-deploy-packages $ sudo docker-compose up -d Creating nginx ... done Creating pigfarm-app ... error ERROR: for pigfarm-app Cannot start service pigfarm: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:402: container init caused \"process_linux.go:385: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --compute --utility -

新基建下 AI 算力市场崛起,华为凭什么从中分一杯羹?

删除回忆录丶 提交于 2020-08-09 12:15:53
2020 年,成为真正意义上的新基建“元年”,各种利好政策密集落地,全国各地都开始重视起这个频频出现在国家政策文件上的新概念。近期,国家发改委近期多次强调加快 5G 网络、数据中心等新型基础设施建设,业内人士指出,新基建投资计划正加速推出,预计年内投资规模将达万亿元。 新基建暖风下, 算力市场“蛋糕”怎么分? 新基建中,人工智能的基础建设是最重要的部分之一,而人工智能的发展,离不开算力的支撑。我们都知道,随着 5G、物联网等新兴技术的发展,数据量将以更加难以计量的速度膨胀爆发,据 IDC 预测,2020 年全球数据总量将达到 44ZB,中国的数据总量超过8ZB,占全球数据总量的 18%,而到 2025 年,全球数据总量预计将达到180ZB。与此同时,模型计算也将变得更加复杂,对算力的需求节节拔升,挑战难度不断升级。 日前,国家发改委明确“新基建”的范围,其中包括信息基础设施、融合基础设施、创新基础设施等三个方面,以数据中心、智能计算中心为代表的算力基础设施,就包含在信息基础设施当中。 在这样的背景下,AI 算力将成为 AI 基础设施建设的重中之重,甚至成为整个新基建的核心支撑。顺应时代需求,各大算力供应商纷纷摩拳擦掌,意图瓜分算力市场这块巨大的“蛋糕”。 群狼环伺, 华为为何能杀出重围? 华为就是这对算力市场“虎视眈眈”的企业中的其中一个。在 AI 计算领域,华为是国内起步较早

Tensorflow-gpu1.13.1 和 Tensorflow-gpu2.0.0共存之安装教程

不问归期 提交于 2020-08-09 04:07:28
tf1.13.1 及 tf2.0.0 相关依赖及版本       硬件说明:显卡NVIDIA-GEFORCE-GTX-1060 1.驱动版本检查,并且更新显卡驱动【这一步很重要,你的驱动版本低了,cuda及cudnn就可能出错】 错误:DLL load failed: 找不到指定的模块。 cmd中输入:nvidia-smi      显卡驱动已经是最新的了。如果不是最新的显卡驱动,需要手动更新一下。 补充:驱动version对应 cuda 和 cudnn的版本      我们安装的cuda 是10.0.130 所以:win10对应的nvidia的驱动版本要大于411.31。【我更新后的显卡驱动为:436.48满足条件】      假如你的驱动版本低于411.31,就需要更新驱动 驱动下载地址:https://www.nvidia.com/Download/index.aspx?lang=en-us 选择下载版本:根据自己电脑的显卡型号进行选择(百度相关机型,就能有详细信息;也可以在硬件里查看;) 第一次下载的标准版本,提示我的电脑windows Drivers Type 为DCH 而不是标准版本,所以重新下载安装成功。      下载的驱动:436.48-desktop-win10-64bit-international-dch-whql.exe 按提示(prompts)安装即可。

WIN10+YOLOv4,windows上完美执行YOLOv4目标检测

泄露秘密 提交于 2020-08-08 17:55:37
最近新出了YOLOV4,我系统的从V1开始整理出稿,传送门: 【YOLOv1原文+翻译】You Only Look Once Unified, Real-Time Object Detection 【YOLOv2原文+翻译】YOLO9000: Better, Faster, Stronger 【YOLOv3原文+翻译】YOLOv3:An Incremental Improvement 【YOLOv4原文+翻译】YOLOv4:Optimal Speed and Accuracy of Object Detection 实验室大佬在Ubuntu16.04上轻松实现,我也来个Win10版的~ 先上一张成功检测的结果图: 正文开始 1 软件安装 我的软件环境:WIN10,CUDA10.2,cuDNN7.6.5,python3.7,VS2019,OpenCV3.4.2 硬件环境:GTX2080Ti ×2,80G内存 1.1 下载安装NVIDIA显卡驱动 设备管理器查看自己电脑的显卡型号,然后 进入NVIDIA驱动下载 ,下载对应硬件的驱动版本。安装好后,把 C:\Program Files\NVIDIA Corporation\NVSMI 添加到环境变量的path中,然后CMD中输入: nvidia-smi 如果显示下图内容,证明驱动安装成功: 1.2 下载安装CUDA CUDA 官网

AI人工智能-点云分割算法项目之pointsift环境搭建和编译文档

£可爱£侵袭症+ 提交于 2020-08-08 13:58:07
服务器的IP地址和用户名密码 服务器IP地址:47.112.147.126 用户名:root 密码:XXXXXXXXX 一) 开通阿里云后首先查看是否有cuda和cudnn环境 1、查看cuda版本? cat /usr/local/cuda/version.txt 2、查看cudnn版本? cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR ­A 2 3、跑我们的模型代码:看如下这个文件放在哪个目录下 python3.6 ~/pointcloud/pointSIFT­ master/train_and_eval_scannet.py 二)上传数据 1.把模型的zip文件和我们自己的scannet_train.pickle和 scannet_test.pickle文件上传到服务器的根目录: 下面红色部分的路径改为自己的路径 scp ­r /Users/wangzhiqiang/Desktop/pointcloud/pointSIFT­ master.zip root@47.112.98.141:/ 2.也可以用shell和xftp上传速度会比这个快、按下图连接服务器 三)接下来的任务安排: 任务一: 看下模型的输出、就是预测的、点云和label 的数组在哪里(是哪个函数的输 出) == 已确定evaluate_one

Cuda 10在CentOS 7.8安装新版本

前提是你 提交于 2020-08-08 12:35:03
1. 有老版本的Cuda,需要卸载老版本Cuda和driver, 参考: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#removing-cuda-tk-and-driver 如Cuda 10: cd /usr/local/cuda/bin ./cuda-uninstaller 选择要卸载的模块,一般都选,就卸载了 卸载cuda driver: sh NVIDIA-Linux-x86_64-430.50.run --uninstall 2. 安装新的Cuda和新driver: 下载新driver: https://www.nvidia.com/download/index.aspx?lang=en-us sh NVIDIA-Linux-x86_64-XXX.XX.run 下载新Cuda toolkit https://developer.nvidia.com/cuda-toolkit-archive 选择需要安装的版本,如10.2: https://developer.nvidia.com/cuda-10.2-download-archive 下载到CentOS上,执行: chmod +x cuda_10.2.89_440.33.01_linux.run ./cuda_10.2.89