pytorch

动手学深度学习源码 & CVPR / ECCV 2020开源代码

放肆的年华 提交于 2020-10-05 13:55:21
动手学深度学习其源码分别包括Pytorch、TensorFlow、MxNet框架的代码,十分方便学习深度学习在不同框架下的实现。面向中文读者的能运行、可讨论的深度学习,它将文字、公式、图像、代码和运行结果结合在一起。全面介绍深度学习从模型构造到模型训练,以及它们在计算机视觉和自然语言处理中的应用。 每一小节都是可以运行的 Jupyter 记事本 你可以自由修改代码和超参数来获取及时反馈,从而积累深度学习的实战经验。 公式 + 图示 + 代码 我们不仅结合文字、公式和图示来阐明深度学习里常用的模型和算法,还提供代码来演示如何从零开始实现它们,并使用真实数据来提供一个交互式的学习体验。 活跃社区支持 你可以通过每个章节最后的链接来同社区的数千名小伙伴一起讨论学习。 被用作教材或参考书 北京大学 复旦大学 哈尔滨工业大学 清华大学 上海财经大学 上海交通大学 浙江大学 中国科学技术大学 Carnegie Mellon University(美国) Emory University(美国) Gazi Üniversitesi(土耳其) Georgia Institute of Technology(美国) Habib University(巴基斯坦) Hasso-Plattner-Institut(德国) Hiroshima University(日本) Imperial College

【易盾图像识别】文字点选识别 附带 模型+数据集 +识别代码+思路

倖福魔咒の 提交于 2020-10-05 06:49:31
如有损害他人利益,请即时通知,文章会在第一时间内删除! 前言 继极验文字点选的发布,怎么能少得了易盾呢,本次分享将会把模型,代码,数据集一起分享出来! 摘要(About this paper): 易盾的文字点选识别,其中包括验证码模型,和7w+文字数据集,目前识别率在80左右,当作一个小练习,后续有数据集的同学愿意分享,可以接着训练该模型,由于模型和数据集比较大,就分享在QQ群文件里了,有需要的可以进群一起交流! 扩充 识别思路: 易盾文字点选验证码模型训练思路! 一、label_image 标注文字位置约400左右 二、pytorch + yolov3 训练位置预测模型 三、根据预测位置裁剪汉字图片 四、pytorch + CNN 深层神经网络识别汉字 总结: 大部分的验证码用目标检测+卷积神经网络是都能搞定的!如果类似易盾图标点选就可以减少数据集,使用孪生网络进行预测! 关于安装: 很多github上都有讲Linux系统的,本文以windows为例! pip install torch==1.4.0+cpu torchvision==0.5.0+cpu -f https://download.pytorch.org/whl/torch_stable.html pip install -r requirements.txt -i https://pypi.tuna

零基础入门人工智能有门槛吗?学会这些就够了

杀马特。学长 韩版系。学妹 提交于 2020-10-05 00:29:18
在科技高速发展的今天,人工智能是一个很酷很潮的字眼,几乎每天都出现在科技媒体中,人工智能应用案例应接不暇:人工智能写稿取代编辑、人工智能医疗诊断取代医生、人工智能定投取代基金经理人、人工智能机器人取代银行大堂经理、人工智能自学习策略取代产品经理…… 很多人认为学习人工智能知识门槛较高、学习难度较大,便只好望而却步。实际上,入门人工智能并不难,对于初学者来说,可以根据自己的发展规划来制定学习路线,如果未来要从事行业领域内的人工智能技术开发,可以分别学习编程语言和人工智能平台知识,然后通过实践来提升开发能力。 在这个AI大时代下,零基础如何学习并进入人工智能领域,享受到人工智能风口的红利?个人又该如何合理规划学习路线提高竞争力? 本号强烈推荐你参加 《人工智能基础实战训练营》 ,从零基础入门到进阶,帮你收获人工智能的基本应用知识,并且学会使用模型框架落地实战。内容不错,推荐给你们。 3天时间,带你学会人工智能 ▼ 仅需 3天 时间,每天 120分钟 左右 课程配备有专职 班主任督促学习、群内互动交流干货分享不断、更有资深助教 为大家在线答疑解惑。 聚焦人工智能实战训练。 限时福利 9月9日 19点前 早鸟价 仅需 4 9 元 原价399元 按照要求 3天全勤全部返还 = 0元学 扫描下方二维码 报名 每递增200人价格将上涨50元 ????立即扫码加入我们????

Win10 超详细 0基础 搭建YOLOV5教程【环境搭建篇】

北战南征 提交于 2020-10-04 04:33:21
1.本文简介 最近在研究YOLO V5的用法,借此机会整理一下,希望对大家有参考。 此文对YOLO V5性能不多做介绍,由于网上许多教程都略微有些繁杂,因此本文旨在展示 最简单 的 【搭建方法】和【用法】,供0基础的初学者也能上手。下面将直接进入正题。 【使用篇】已更新: Win10 超详细 0基础 用YOLO V5训练自己数据集【使用篇】 2.环境搭建 2.1.需安装列表 _____________________________ 「必要项」 1.支持cuda的Nvidia显卡(显存越大越好) 2.python 3.8以上(推荐anaconda) 3.Cuda 10.2 4.pytorch 5.YOLO v5源码 「可选项」 1.opencv(推荐) _____________________________ 2.2.安装操作 _____________________________ 2.2.1.python安装 这里使用 anaconda,安装anaconda会附带最新的Python版本以及一些常用库文件和工具 使用百度等引擎搜索anaconda或者 从 https://www.anaconda.com/products/individual 官网下载个人版本 安装好anaconda后,还需要安装两个常用工具。点选 此时,点选下图【CMD.exe Prompt】

Spark如何与深度学习框架协作,处理非结构化数据

喜夏-厌秋 提交于 2020-10-03 17:26:00
随着大数据和AI业务的不断融合,大数据分析和处理过程中,通过深度学习技术对非结构化数据(如图片、音频、文本)进行大数据处理的业务场景越来越多。本文会介绍Spark如何与深度学习框架进行协同工作,在大数据的处理过程利用深度学习框架对非结构化数据进行处理。 Spark介绍 Spark是大规模数据处理的事实标准,包括机器学习的操作,希望把大数据处理和机器学习管道整合。 Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流。Spark使用内存缓存来提升性能,因此进行交互式分析也足够快速(如同使用Python解释器,与集群进行交互一样)。 缓存同时提升了迭代算法的性能,这使得Spark非常适合机器学习。 由于Spark库提供了Python、Scale、Java编写的API,以及内建的机器学习、流数据、图算法、类SQL查询等模块;Spark迅速成为当今最重要的分布式计算框架之一。与YARN结合,Spark提供了增量,而不是替代已存在的Hadoop集群。在最近的Spark版本中,Spark加入了对于K8s的支持,为Spark与AI能力的融合提供了更好的支持。 深度学习框架介绍 TensorFlow TensorFlow最初是由Google机器智能研究部门的Google Brain团队开发,基于Google

pytorch取值

大憨熊 提交于 2020-10-03 05:29:29
import torch a_data=torch.Tensor([1,2,3]) index=[0,1,1,2,1] ba=a_data[index] print(ba) 结果: tensor([1., 2., 2., 3., 2.]) 可以用数组取值,index中的每个值都是a_data的索引,不能越界。 来源: oschina 链接: https://my.oschina.net/u/4269898/blog/4428180

FastReID:首个产业级通用目标重识别开源库

馋奶兔 提交于 2020-10-03 03:50:26
引言 京东AI研究院近日发布了基于PyTorch的通用目标重识别(ReID)开源库FastReID,其发布对相关领域的研究起到积极的促进作用,同时也加速技术产品落地应用。FastReID已经在行人重识别、车辆重识别上都取得了优异的评测结果,在京东内部,该技术已经获得广泛地应用于智慧园区、智慧楼宇、智慧供应链、线下零售等实际项目中。在刚公布的论文FastReID: A Pytorch Toolbox for General Instance Re-identification中详细介绍了该开源库的内容。 论文链接: https://arxiv.org/pdf/2006.02631.pdf GitHub链接: https://github.com/JDAI-CV/fast-reid 无论是零售场景下的“无人超市”还是供应链场景下的智慧园区,亦或是疫情之下的口罩佩戴……在“有意遮挡”的情况下,“人脸识别”的难度都会面临不小的挑战,其在“配合”模式下的良好识别率将很难发挥价值。 因此,通用目标重识别的价值将越来越重要,为满足通用实例重识别日益增长的应用需求,京东AI研究院于近日发布了基于PyTorch的通用目标重识别(ReID)开源库FastReID , 在 FastReID中,高度模块化和可扩展的设计使得开发者很容易实现新的研究思路。 其发布对相关领域的研究起到积极的促进作用

写给程序员的机器学习入门 (五)

依然范特西╮ 提交于 2020-10-02 13:45:10
递归模型的应用场景 在前面的文章中我们看到的多层线性模型能处理的输入数量是固定的,如果一个模型能接收两个输入那么你就不能给它传一个或者三个。而有时候我们需要根据数量不一定的输入来预测输出,例如文本就是数量不一定的输入,“这部片非常好看” 有 7 个字,“这部片很无聊” 有 6 个字,如果我们想根据文本判断是正面评价还是负面评价,那么就需要使用支持不定长度 (即可以接收 6 个又可以接收 7 个) 输入的模型。时序性的数据数量也是不一定的,例如一个运动中的球,从某个时间点开始的第 0 秒在位置 1,第 1 秒在位置 3,第 2 秒在位置 5,那么正确的模型应该可以预测出第 3 秒在位置 7,如下图所示。当然,时序性的数据可以固定一个窗口(例如最近的 5 条数据)来处理,这样输入数量就是一定的,但灵活性就降低了,窗口设置过小可能会导致没有足够的信息用于预测输出,过大则会影响性能。 递归模型 (Recursive Model) 可以用于处理不定长度的输入,用法是一次只传固定数量的输入给模型,可以分多次传,传的次数根据数据而定。以上述例子来说,“这部片非常好看” 每次传一个字需要传 7 次,“这部片很无聊” 每次传一个字需要传 6 次。而递归模型每收到一次输入都会返回一次输出,有的场景只会使用最后一次输出的结果 (例如这个例子),而有的场景则会使用每一次输出的结果。 换成代码可以这样理解:

pytorch中的gather()函数

戏子无情 提交于 2020-10-02 12:19:04
首先,给出官方文档的链接: https://pytorch.org/docs/stable/generated/torch.gather.html?highlight=gather#torch.gather 然后,我用白话翻译一下官方文档。 gather,顾名思义,聚集、集合。有点像军训的时候,排队一样, 把队伍按照教官想要的顺序进行排列 。 还有一个更恰当的比喻: gather的作用是根据 索引 查找,然后讲查找结果以张量矩阵的形式返回 。 1. 拿到一个张量: import torch a = torch.arange(15).view(3, 5) a = tensor([ [ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) 2. 生成一个查找规则: ( 张量b的元素都是对应张量a的索引 ) b = torch.zeros_like(a) b[1][2] = 1 b[0][0] = 1 b = tensor( [[1, 0, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 0, 0]]) 3. 根据维度dim开始查找: c = a.gather(0, b) # dim=0 d = a.gather(1, b) # dim=1 c= tensor([ [5, 1, 2, 3, 4], [0