cuda

糟心的caffe+ matlab编译路程

时间秒杀一切 提交于 2021-02-16 14:12:18
####配置:Ubuntu16.04+MatlabR2016b+cuda8.0+cudnn5.1+caffe 配置caffe真的不是很容易,特别是对初次接触Linux的同学,各种报错(ノ_;\( `ロ´),搞了好几天才解决 caffe安装可能出现的问题 ####可能会出现的问题 问题1."libcudart.so.8.0 cannot open shared object file: No such file or directory" 解决方法: 解决办法是将一些文件复制到/usr/local/lib文件夹下: 注意自己CUDA的版本号! sudo cp /usr/local/cuda-8.0/lib64/libcudart.so.8.0 /usr/local/lib/libcudart.so.8.0 && sudo ldconfig sudo cp /usr/local/cuda-8.0/lib64/libcublas.so.8.0 /usr/local/lib/libcublas.so.8.0 && sudo ldconfig sudo cp /usr/local/cuda-8.0/lib64/libcurand.so.8.0 /usr/local/lib/libcurand.so.8.0 && sudo ldconfig 问题2."libcudnn.so.5 cannot

pytorch的显存释放机制torch.cuda.empty_cache()

老子叫甜甜 提交于 2021-02-16 09:46:35
Pytorch已经可以自动回收我们不用的显存,类似于python的引用机制,当某一内存内的数据不再有任何变量引用时,这部分的内存便会被释放。但有一点需要注意,当我们有一部分显存不再使用的时候,这部分释放的显存通过Nvidia-smi命令是看不到的,举个例子: device = torch.device('cuda:0') # 定义两个tensor dummy_tensor_4 = torch.randn(120, 3, 512, 512).float().to(device) # 120*3*512*512*4/1000/1000 = 377.48M dummy_tensor_5 = torch.randn(80, 3, 512, 512).float().to(device) # 80*3*512*512*4/1000/1000 = 251.64M # 然后释放 dummy_tensor_4 = dummy_tensor_4.cpu() dummy_tensor_2 = dummy_tensor_2.cpu() # 这里虽然将上面的显存释放了,但是我们通过Nvidia-smi命令看到显存依然在占用 torch.cuda.empty_cache() # 只有执行完上面这句,显存才会在Nvidia-smi中释放 Pytorch的开发者也对此进行说明了,这部分释放后的显存可以用

Using CUDA compiled for compute capability 3.7 on Maxwell GPUs?

生来就可爱ヽ(ⅴ<●) 提交于 2021-02-16 09:12:13
问题 My development workstation(s) currently have NVIDIA Quadro K2200 and K620. Both of which have CUDA compute capability 5.0. However, the final production system has a Tesla K80 which has CUDA compute capability 3.7. Is it possible to install and develop CUDA programs for compute capability 3.7 on my Quadro GPUs and then move them to the K80 without having to make significant changes? 回答1: Yes, it's possible. Be sure not to use any compute capability 5.0+ specific features in your code, and you

Using CUDA compiled for compute capability 3.7 on Maxwell GPUs?

孤街醉人 提交于 2021-02-16 09:11:16
问题 My development workstation(s) currently have NVIDIA Quadro K2200 and K620. Both of which have CUDA compute capability 5.0. However, the final production system has a Tesla K80 which has CUDA compute capability 3.7. Is it possible to install and develop CUDA programs for compute capability 3.7 on my Quadro GPUs and then move them to the K80 without having to make significant changes? 回答1: Yes, it's possible. Be sure not to use any compute capability 5.0+ specific features in your code, and you

Using CUDA compiled for compute capability 3.7 on Maxwell GPUs?

时光总嘲笑我的痴心妄想 提交于 2021-02-16 09:09:20
问题 My development workstation(s) currently have NVIDIA Quadro K2200 and K620. Both of which have CUDA compute capability 5.0. However, the final production system has a Tesla K80 which has CUDA compute capability 3.7. Is it possible to install and develop CUDA programs for compute capability 3.7 on my Quadro GPUs and then move them to the K80 without having to make significant changes? 回答1: Yes, it's possible. Be sure not to use any compute capability 5.0+ specific features in your code, and you

Tensorflow 运行警告提示 Your CPU supports instructions that this TensorFlow binary was not compiled...

天涯浪子 提交于 2021-02-15 03:55:50
由于现在神经网络这个东西比较火,准确的说是深度学习这个东西比较火,我们实验室准备靠这个东西发几个CCF A类的文章,虽然我不太懂这东西,兴趣也一般都是毕竟要跟随主流的,于是今天安装起了 Tensorflow 这个深度学习的框架。 安装好以后运行一个Demo ,如下: import tensorflow as tf a =tf.constant(2 ) b =tf.constant(20 ) with tf.Session() as sess: print (sess.run(a*b)) 运行结果如下: 2018-05-03 19:57:44.151803: I tensorflow/core/platform/cpu_feature_guard.cc:137] Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AVX AVX2 FMA 2018-05-03 19:57:44.251905: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:892] successful NUMA node read from SysFS had negative value (-1), but

Detectron:Pytorch-Caffe2-Detectron的一些跟进

牧云@^-^@ 提交于 2021-02-15 02:26:52
pytorch官网: http://pytorch.org/ 上只有PyTroch的ubuntu和Mac版本,赤裸裸地歧视了一把Windows低端用户。 1. Caffe源码: Caffe源码理解之存 储 Caffe2存储 Caffe2中的存储结构层次从上到下依次是Workspace, Blob, Tensor。Workspace存储了运行时所有的Blob和实例化的Net。Blob可以视为对任意类型的一个封装的类,比如封装Tensor, float, string等等。Tensor就是一个多维数组,这个Tensor就类似于Caffe1中的Blob。Caffe2中真正涉及到分配存储空间的调用则在Context中,分为CPUContext和CUDAContext。下面按照从下到上的顺序分析一下Caffe2的存储分配过程。 Context Tensor Blob Workspace 总结 总结 下面是Operator中从创建Blob到实际分配空间的流程,这个图是怎么画出来的呢 : 2.Caffe2 Detectron的使用 初步 关于InferImage: 在 NVIDIA Tesla P100 GPU 上,单张图片的推断时间大概是 130-140ms.当然这与输入图像的参数设置size有关。 2. Detectron 训练 简单介绍在 COCO Dataset 上训练模型. 采用

FAIR-Detectron 开源代码

我的未来我决定 提交于 2021-02-15 02:26:32
先贴上链接:https://github.com/facebookresearch/Detectron 。。。Install Caffe2 就问题一大堆了。。。。 首先是下载完caffe2工程后,第一步的make ,就出现“Protocol "https" not supported or disabled in libcurl” 试了很多方法,都不管用,哎。 应该是curl的问题,不管了,反正系统已经重装了,现在一切正常,比以前还顺溜~ 装个这玩意让我火大。直接重装系统!!!!! 全新的系统:Ubuntu14.04!!! 显卡:GTX 1080 本以为重装系统的话,cuda这玩意又要倒腾很久,已经做好了长期奋战的准备,结果 - - 时代在进步啊,要是当年有这么好装的话,我也不用装大半个月了。 废话不多说,总结下今天安装 caffe2 的过程。 一、 首先下载依赖项: sudo apt- get update sudo apt-get install -y --no- install - recommends \ build - essential \ cmake \ git \ libgoogle -glog- dev \ libgtest - dev \ libiomp - dev \ libleveldb - dev \ liblmdb - dev \ libopencv -

PyTorch FGSM Attack 对抗样本生成

那年仲夏 提交于 2021-02-14 13:35:39
要阅读 带有插图的文章版本 请前往 http://studyai.com/pytorch-1.4/beginner/fgsm_tutorial.html 如果你正在阅读这篇文章,希望你能体会到一些机器学习模型是多么的有效。研究不断推动ML模型变得更快、更准确和更高效。 然而,设计和训练模型的一个经常被忽视的方面是安全性和健壮性,特别是在面对希望欺骗模型的对手时。 本教程将提高您对ML模型的安全漏洞的认识,并将深入了解对抗性机器学习的热门话题。 您可能会惊讶地发现,在图像中添加不可察觉的扰动会导致截然不同的模型性能。 鉴于这是一个教程,我们将通过一个图像分类器的例子来探讨这个主题。 具体来说,我们将使用第一种也是最流行的攻击方法-快速梯度符号攻击(Fast Gradient Sign Attack ,FGSM)来欺骗MNIST分类器。 威胁模型(Threat Model) 有很多种类的对抗性攻击,每种攻击都有不同的目标和攻击者的知识假设。但是,总体目标 是在输入数据中增加最少的扰动量,以导致期望的错误分类。攻击者的知识有几种假设,其中两种假设是: 白盒子(white-box) 和 黑盒子(black-box)。 白盒子 攻击假定攻击者拥有对模型的全部知识和访问权限,包括体系结构、输入、输出和权重。 黑盒子 攻击假设攻击者只能访问模型的输入和输出,而对底层架构或权重一无所知。

XMR挖矿教程

馋奶兔 提交于 2021-02-12 06:23:34
XMR挖矿教程 XMR介绍 门罗币(Monero,代号XMR)是一个创建于2014年4月开源加密货币,它着重于隐私、分权和可扩展性。与自比特币衍生的许多加密货币不同,Monero基于 CryptoNote 协议,并在区块链模糊化方面有显著的算法差异。Monero的模块化代码结构得到了比特币核心维护者之一的Wladimir J. van der Laan的赞赏。Monero在2016年经历了市值(从5百万美元至1.85亿美元)和交易量的快速增长,这部分是因为它在2016年夏季末期得到了主要的暗网市场AlphaBay的采用。截至2017年,Monero是交易量排行第六的加密货币,市值 超过3亿美元。 官网链接请点 此处 。 本地钱包 支持Windows 64 和 32 、Mac OS x 64 、Linux 64 、Freebsd 64 、ARM等。 源代码请访问GitHub仓库 。 开始挖矿 CUDA ccminer ( tsiv ) 源代码地址见 GitHub 。 ccminer -q -o stratum+tcp://xmr-usa.dwarfpool.com:8050 -u YOUR_WALLET -p x ATI miner by Claymore 5% dev-fee 挖矿软件仅支持 Windows 64Bit下载 NsGpuCNMiner.exe -o stratum