cuda | 易学教程

1024，带你搭建第一个车道线检测网络LaneNet

阅读更多关于 1024，带你搭建第一个车道线检测网络LaneNet

文章目录一、LaneNet 算法详解 1.1 LaneNet 简介 1.2 整体结构分析 1.3 LaneNet 网络结构 1.4 H-Net 网络结构 1.5 LaneNet 性能优点二、手把手带你实现 LaneNet 2.1 项目介绍 2.2 环境搭建 2.3 准备工作 2.4 模型测试 1024，祝大家节日快乐！喜欢就给我点个赞吧，您的支持是我创作的最大动力！资源汇总：论文下载地址： https://arxiv.org/abs/1802.05591 github项目地址： https://github.com/MaybeShewill-CV/lanenet-lane-detection LanNet资料合集：https://pan.baidu.com/s/17dy1oaYKj5XruxAL38ggRw 提取码：1024 LanNet论文翻译：车道线检测网络之LaneNet 一、LaneNet 算法详解 1.1 LaneNet 简介传统的车道线检测方法依赖于手工提取的特征来识别，如颜色的特征、结构张量、轮廓等，这些特征还可能与霍夫变换、各种算子或卡尔曼滤波器相结合。在识别车道线之后，采用后处理技术来过滤错误检测并将其分组在一起以形成最终车道。然而，由于道路场景的变化，这些传统的方法容易出现鲁棒性问题！更新的方法利用深度学习模型，这些模型被训练用于像素级车道分割

Windows下编译kaldi--kaldi(二)

阅读更多关于 Windows下编译kaldi--kaldi(二)

接着上一篇，openfst已经编译好。首先，使用git clone下载kaldi的项目 git clone https: // github.com/kaldi-asr/kaldi.git kaldi 用4G网络会快很多 1. 这里有两种选择来使用BLAS， Intel® MKL and OpenBLAS. Intel® MKL is made by Intel and is optimised for their processors.It isn't free, but you can get Community Licensing for Intel® Performance Libraries or as part of Intel product suite if you qualify as students, educators, academic researchers, and open source contributors . OpenBLAS is free alternative with similar performance.（大致是说MKL不是免费的，但如果你是学生、教育工作者、搞学术研究的可以用社区版）（--要验证很麻烦--）所以openBLAS是免费的可替代的，有着相似功能。 If using Intel® MKL , install it .

年薪80万+年终奖汽车|显扬科技招聘三维机器视觉研发总监、高级三维算法工程师...

阅读更多关于年薪80万+年终奖汽车|显扬科技招聘三维机器视觉研发总监、高级三维算法工程师...

点击上方“3D视觉工坊”，选择“星标” 干货第一时间送达显扬科技专注研发并产业化高速高清三维机器视觉设备，致力于成为全球领先的三维机器视觉设备提供商。显扬科技研发的三维机器视觉设备精度能达微米级，采集速度高达300帧，主要应用于机器人引导、工业检测与测量。显扬科技企业文化：聚焦、极致、奋斗。显扬科技以客户创造价值为核心目标，为自动化集成商等客户提供三维机器视觉设备以及软件系统。通过与集成商合作，显扬科技的产品已成功应用于3C、食品、医药、电器、陶瓷、船舶、物流等行业。显扬科技由香港中文大学丁克博士创建，核心团队在三维机器视觉领域有超过10年的研发经验，公司研发人员均来自海内外名校，以及华为、大疆科技等高科技企业。显扬科技在佛山、深圳、苏州、香港均设有研发与应用中心，已累计申请知识产权50余件。公司正处于高速发展阶段，已获上市公司以及政府引导基金五千万人民币投资。自成立以来，广东省委书记李希，香港特首林郑月娥，深圳市委书记王伟中等曾多次参观指导显扬科技。欢迎对机器人、人工智能、三维机器视觉、图像处理感兴趣的伙伴加入，需要自我驱动型，追求工作的成就感和价值、敢担责、敢打仗的人才。显扬科技团队氛围友善且富有激情，公司扁平化管理，上升空间大，加薪、项目奖励、股权奖励、年终奖、生日福利、不限量零食下午茶、超A级写字楼，能力出众者，薪资面议。三维机器视觉技术总监工作地点：深圳

PyTorch出现：RuntimeError: An attempt has been made to start a new process...报错 (已解决)

阅读更多关于 PyTorch出现：RuntimeError: An attempt has been made to start a new process...报错 (已解决)

PyTorch出现：RuntimeError: An attempt has been made to start a new process...报错 (已解决) 最近从新调试一段pytorch 代码，以前的服务器上完全没问题，但换了一台机器，重新安装了新版本的 cuda，anaconda，pytorch 等，以前的代码出现各种版本不适合的问题。一天下来，解决了 n 个问题。问题：现在说说这个问题。运行 pytorch 时出现的情况如下： RuntimeError: An attempt has been made to start a new process before the current process has finished its bootstrapping phase. This probably means that you are not using fork to start your child processes and you have forgotten to use the proper idiom in the main module: if __name__ == '__main__': freeze_support() ... The "freeze_support()" line can be omitted if the

nvidia 的一些命令

阅读更多关于 nvidia 的一些命令

直接在命令行使用 NVIDIA-smi会有问题首先要确保电脑下了cuda。然后打开cmd，使用cd命令进入： C:\Program Files\NVIDIA Corporation\NVSMI 然后就可以直接使用“nvidia-smi”这个命令了。对了记得开启管理员权限，否则会显示“拒绝访问” 来源： oschina 链接： https://my.oschina.net/u/4417652/blog/4406346

黑科技：用cutlass进行低成本、高性能卷积算子定制开发

阅读更多关于黑科技：用cutlass进行低成本、高性能卷积算子定制开发

图形处理器通用计算(GPGPU)是指利用 GPU 来计算原本由 CPU 处理的通用计算任务。由于现代 GPU 拥有强大的并行处理能力，通用 GPU 在面对矩阵乘法、卷积等大量并行的计算密集型算法时，性能远远超越了传统的 CPU。CUDA 是由 NVIDIA 推出的 GPGPU 高性能计算方案，目前大多数深度学习推理任务都可以通过 CUDA 来进行加速。为了充分发挥 CUDA 平台的计算能力，NVIDIA 推出了高度优化的深度学习、线性代数算子库 cudnn、cublas、cutlass，以及 CUDA 平台上的深度学习推理框架 TensorRT。 cudnn、cublas 这样的基础算子原语库在常见的卷积层上性能表现很好，通常都能够满足用户的需求，但是在面对用户高度定制化的算法时，基础算子库往往并不能充分发挥硬件的性能。这是由于算子优化的长尾问题引起的，基础算子库引入了许多卷积优化的通用策略，但是这些优化的策略并不能覆盖所有的情况，实际算法中的卷积层有可能并不能从通用的优化策略中获得收益，从而无法充分发挥硬件的性能。基础算子库的另一个问题是用户无法对这些基础算子进行定制化开发，当算法开发人员想为卷积算子添加一种新的激活函数，或者想添加一种特殊的卷积算子(比如：LocalConv)时，就会变得束手无策。 cutlass 是 NVIDIA 推出的一款线性代数模板库

2020-10-21

阅读更多关于 2020-10-21

项目场景：（pytorch）CUDA ERROR:out of memory（已解决）提示：这里简述项目相关背景：例如：项目场景：示例:通过蓝牙芯片(HC-05)与手机 APP 通信，每隔 5s 传输一批传感器数据(不是很大) 问题描述：新手调程序时，经常出现这种cuda错误无法解决，这里我总结一些了解决方法提示：这里描述项目中遇到的问题：例如：数据传输过程中数据不时出现丢失的情况，偶尔会丢失一部分数据 APP 中接收数据代码： @Override public void run() { bytes = mmInStream.read(buffer); mHandler.obtainMessage(READ_DATA, bytes, -1, buffer).sendToTarget(); } 解决方案： 1，换一个gpu，或者增加一个gpu，如：CUDA_VISIBLE_DEVICES=0，1（注意在改变gpu的时候，代码里device设备号也需要修改） 2，减小num_worker和batch-size数目 3，pin_memory=True（这个问题最难发现，在此记录一下），查看一下你们程序的pin_memory是不是True 来源： oschina 链接： https://my.oschina.net/u/4414278/blog/4686067

Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境

阅读更多关于 Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境

Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境由于最近只能使用Windows系统训练神经网络，但是程序总是不调用GPU而拖慢了工作进度，因此踏上了配置环境的不归路，在此记录一下配置环境的真正流程和我遇到过的所有坑，希望对大家有所帮助。文章目录 Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境一、确定要安装的TensorFlow-GPU、CUDA、cudnn的版本二、安装NVIDIA显卡驱动 1.查看显卡驱动版本是否满足CUDA版本的要求 2.更新驱动版本三、安装CUDA 安装失败解决办法四、安装cuDNN 环境变量添加方法：五、安装TensorFlow-gpu 验证tensorflow-gpu是否安装成功： import tensorflow as tf 时报错FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated;....（如下图）安装numpy1.16时报错：tensorflow 1.14.0 requires google-pasta>=0.1.6, which is not installed.（如下图）六、在pycharm的python脚本中调用GPU跑神经网络模型

ERNIE时延降低81.3%，飞桨原生推理库Paddle Inference再升级

阅读更多关于 ERNIE时延降低81.3%，飞桨原生推理库Paddle Inference再升级

随着深度学习技术的成熟和人工智能的发展，机器开始变得越来越“聪明”，越来越了解用户的喜好和习惯。下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu 近年来对于NLP的研究也在日新月异的变化，有趣的任务和算法更是层出不穷，百度提出知识增强的语义表示模型 ERNIE 就是其中的佼佼者。 ERNIE 在语言推断、语义相似度、命名实体识别、情感分析、问答匹配等各类NLP中文任务上的模型效果全面超越 Bert ，成为NLP中文任务中的主流模型， ERNIE 2.0的论文（https://arxiv.org/abs/1907.12412）也被国际人工智能顶级学术会议AAAI-2020收录。然而在模型效果大幅度提升的同时，模型的计算复杂性也大大增加，这使得 ERNIE 在推理部署时出现延时高，推理速度不理想的情况，给产业实践带来了极大的挑战。飞桨开源框架1.8版本中， Paddle Inference在算子融合、TensorRT子图集成和半精度浮点数（Float 16）加速

安装Ubuntu1804+cuda10.1+cudnn7.5.1流程

阅读更多关于安装Ubuntu1804+cuda10.1+cudnn7.5.1流程

ubuntu1804深度学习环境配置安装Ubuntu1804+cuda10.1+cudnn7.5.1流程小白一个，此博客仅作为自己后续装机的流程参考，如有问题欢迎大家批评指正！ F9 选择从USB启动在这里主要记录一下分区设置：下面是一些参考博文，设置分区具体大小根据自己情况而定 https://www.jianshu.com/p/a997355a6200https://blog.csdn.net/wangyuankl123/article/details/95236462 http://www.wuwenhui.cn/4675.html https://www.lastupdate.net/15353.html 分区设置： sda efi 1G 逻辑 /boot 500M 逻辑 swap 50G 逻辑 / 800G 主分区 /usr 剩余～1.15T 逻辑 sdb /home 2T 逻辑修改镜像源参考文章 https://www.jianshu.com/p/e08910410796 sudo cp /etc/apt/sources.list /etc/apt/sources.list.cp sudo gedit /etc/apt/sources.list 内容修改为： https://mirror.tuna.tsinghua.edu.cn/help/ubuntu/

订阅 cuda