计算机视觉

数据标注在智慧农业领域中的具体应用丨曼孚科技

落爺英雄遲暮 提交于 2020-10-05 09:17:24
作为国家第一产业、国民经济中的重要产业部门,农业长久以来就是人类的衣食之源、生存之本,是一切生产的首要条件。 随着全球人口的快速增长,粮食方面的需求激增。相关数据显示,2050年全球人口将突破100亿,为了满足未来的粮食需求,农业生产至少需要增加70%的产量。 然而,当下农业的发展却面临诸多困境。首先,在全球城市化加速的大背景下,农村劳动力持续降低,农业从业人数持续下降,目前较低的自动化率已无法满足生产效率提升的需求。 此外,新冠疫情在世界范围内的蔓延也加剧了全球粮食安全的风险与危机。农业生产的季节周期性、不宜长期储存性以及劳动密集性是造成其面临困境的重要原因,同时也折射出农业生产能力的不足和抗风险能力的低下。 这样的时代背景下,智慧农业应运而生,成为解决农业生产、流通和销售、提升生产效率和农产品供应,从根本上化解全球粮食安全隐患的关键。 通过在农业生产的各个环节融入5G、人工智能、大数据等技术,建立农业生产环境的智能感知、智能预警、智能决策、智能分析体系,即可实现人不入田完成耕种、查看数据即可知晓农作物生长状况等操作。 除了AI、大数据技术以外,智慧农业的背后也离不开数据标注技术的支持。依托精准的数据标注实现对农作物的定位以及对其成熟度和生长状态的识别,实现农作物智能采摘并解决精准农药撒播问题,从而减少人力消耗并提高农药利用率。 在智慧农业领域

疫情之下:攻克口罩识别难题,人工智能迎来新风口

╄→尐↘猪︶ㄣ 提交于 2020-10-04 22:49:25
2020年已使每个行业重新思考如何根据COVID-19疫情前进。在人的层面上,我们不得不适应新的生活方式。我们已经开始接受这些变化,并弄清楚如何在这些新的大流行规则下过上我们的生活。当人类安顿下来时,人工智能正在努力跟上。 2020年AI培训的问题在于,突然之间,我们改变了我们的社会和文化规范。我们教给这些算法的真理通常不再是真的。特别是对于可视化AI,我们要求它立即使用尚无更新的上下文来解释我们的新生活方式。 算法仍在调整以适应新的视觉队列,并试图了解如何准确识别它们。随着视觉AI的发展,我们还需要重新重视AI培训过程中的例行更新,以便可以纠正不正确的培训数据集和预先存在的开源模型。 计算机视觉模型正在努力地适当地标记在COVID-19时代我们所处的新场景或情况的描述。类别发生了变化。例如,假设有一个父亲在儿子玩耍时在家工作的图像。AI仍将其归类为“休闲”或“放松”。这也涉及较小的规模。有人坐在车里时,可能会擦拭门把手或擦拭方向盘。当人们试图保持安全时,曾经是琐碎的细节现在变得很重要。我们需要抓住这些细微差别,因此必须对其进行适当标记。然后,人工智能可以开始理解2020年的世界并产生准确的输出。 国际知名白帽黑客,东方联盟创始人郭盛华透露:"目前,AI的另一个问题是机器学习算法仍在尝试了解如何使用蒙版对面部进行识别和分类。仅将脸部检测为脸部的上半部,或者将其检测为两张脸部

Mxnet (32): 迁移学习(Fine-Tuning)进行热狗识别

浪子不回头ぞ 提交于 2020-10-04 09:51:50
总所周知,对于训练模型,一定是数据量越大准去率越高,同时越难以过拟合,泛化能力更强。一些模型训练的数据太少,当应用的时候输入的数据范围又太大,导致最终训练的模型的准确性可能无法满足实际需求。 为了解决上面的问题,一个方法就是获取更多的数据,但是获取数据是一个比较浪费金钱以及时间的事情。另一个方法就是通过迁移学习,将学习到的知识从源数据集迁移到目标数据集。比如,ImageNet中的图像大部分与椅子无关,但是在此数据集上训练的模型可以提取更通用的图像特征,这些特征可以帮助识别边缘,纹理,形状以及对象组成。这些特性可能对椅子同样有效。 本篇使用迁移学习中的一种常见技术:Fine-Tuning: 在源数据集上训练模型(源模型)。 创建一个新的模型,即目标模型。目标模型复制所有源模型中的结构以及参数。可以认为源模型参数中包含了从源数据集中学到的知识,并且将这些知识应用与目标数据集。 将满足目标数据集的输出层添加到目标模型上,并初始话输出层的参数。 使用目标数据在组装之后的模型上训练。从头开始训练输出层,而且它层的参数根据源模型参数进行微调。 Fine-Tuning实战:热狗识别 通过热狗识别的例子了解Fine-Tuning的用法。这里使用基于ImageNet数据集上训练的ResNet模型进行微调。这个热狗数据集包含千张图片,其中包含一些热狗的图片。通过微调而来的模型来识别图片中是否含有热狗。

华人一作获最佳论文奖,第四大视觉顶会BMVC大奖出炉!

别说谁变了你拦得住时间么 提交于 2020-10-04 01:56:22
     作者 | 陈大鑫   近日, BMVC 2020最佳论文奖、最佳论文奖亚军、最佳学生论文奖、最佳学生论文奖亚军、最佳工业论文奖等五项大奖出炉。   其中最佳论文奖四位作者当中包含一作在内有三位是加利福尼亚大学戴维斯分校以及英伟达公司的国人/华人学生。   最佳学生论文奖以及最佳学生论文奖亚军也是有国人/华人学生的存在,其中最佳学生论文奖亚军由来自大连理工大学、香港城市大学、鹏城实验室的三位同学获得。   英国机器视觉会议(BMVC)是英国机器视觉协会(BMVA)的年度机器视觉、图像处理和模式识别会议。它是在英国举行的有关计算机视觉和相关领域的主要国际会议之一。随着知名度和质量的不断提高,它已成为视觉大会中享有盛誉的会议。   2018年的时候,AI科技评论有幸采访到当年九月在英国纽卡斯尔召开的 BMVC的「总指挥」--英国东安格利亚大学计算机学院教授邵岭。      作为当时会议的大会主席,邵岭教授认为, BMVC 已经有三十年历史,它其实是一场被低估的国际会议。   邵岭教授对AI科技评论表示,「虽然它是一个国际会议,但名字里有个 British,所以很多人会误解它只是一个 local 的会议,间接影响了它的投稿和参与者数量。」   邵岭教授继续说道:    BMVC 其实已经有三十年的历史了,被公认为是继 ICCV/CVPR/ECCV 三大视觉顶会之后

暴力方法将成过去?UC伯克利等新研究返璞归真,探索网络的本质

帅比萌擦擦* 提交于 2020-10-04 00:19:51
         深度卷积神经网络的训练很难,方法很多,有没有可能从中提炼出一条指导性原则呢?加州大学的研究者抛弃暴力搜索方法,试图回归网络最核心简洁的性质。研究作者之一、加州大学伯克利分校马毅教授表示:这应该是真正按原理设计而得到的深度网络。   初始化、归一化和残差连接(skip connection)被认为是训练深度卷积神经网络(ConvNet)并获得最优性能的三大必备技术。   最近,来自加州大学伯克利分校和圣迭戈分校的研究者发布一项研究, 提出不使用归一化和残差连接的深度 ConvNet 在标准图像识别基准上也能实现优异的性能 。其实现方式是:在初始化和训练期间,令卷积核具备近似保距性(near isometric);使用 ReLU 激活函数的变体,实现保距性。      论文地址:https://arxiv.org/pdf/2006.16992.pdf   GitHub 地址:https://github.com/HaozhiQi/ISONet   研究人员进行了大量实验,结果表明此类近似保距网络与残差连接结合后,在 ImageNet 数据集上的性能与 ResNet 相当,在 COCO 数据集上的性能甚至超过 ResNet。而前者甚至都没有应用归一化。   该研究作者之一计算机视觉学者、加州大学伯克利分校马毅教授表示:   这应该是真正按原理设计而得到的深度网络……

3D视觉工坊中秋国庆贺礼!

淺唱寂寞╮ 提交于 2020-10-03 12:43:09
写在前面 首先,祝大家国庆、中秋节快乐,感谢大家对工坊的一路陪伴与支持!近一年来,工坊茁壮成长,以3D视觉为切入点,逐渐成为一个集干货、咨询、学业、工作为一体的技术交流平台!为了回馈那些和工坊一起成长的小伙伴,公众号为大家准备了100份「50元」知识星球优惠券(有效期:10月1日0:00~10月3日23:59),希望更多童鞋能够以较小的成本加入到学习社区中。 什么是知识星球? 知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享paper资料、发布高质量的求职就业信息,当然还可以侃侃而谈,吐槽学习工作生活。 为什么给大家推荐「3D视觉从入门到精通」知识星球呢? 下面先简单以几张图片总结星球的主要内容。 这里简单总结星球的主要内容如下: 随着我们队伍的不断壮大,目前星球嘉宾及合伙人,主要包括多个大厂的 计算机视觉算法工程师 、 深度学习算法工程师、 结构光三维重建算法工程师、资深VSLAM算法工程师、3D视觉测量方向的点云后处理资深算法工程师、标定算法工程师以及国内外知名高校博士 等近20多位成员。星球主要关注3D视觉、vSLAM、三维重建、点云处理、立体视觉、结构光、深度学习、计算机视觉和图像处理等方向。日常分享各个领域的最新进展和经典论文,会员可以免费对嘉宾进行技术提问,完成一对一的指导解答,

时代变了,大人:RTX3090时代,哪款显卡配得上我的炼丹炉?

浪尽此生 提交于 2020-10-03 10:55:38
  机器之心报道    机器之心编辑部    黄老板的 RTX 30 系列显卡 9 月 17 日就要发售了,现在我要怎么买 GPU?很急很关键。   在 9 月 2 日RTX 30 系列发布时,英伟达宣传了新显卡在性能上和效率上的优势,并称安培可以超过图灵架构一倍。但另一方面,除了 3090 之外,新一代显卡的显存看起来又有点不够。在做 AI 训练时,新一代显卡效果究竟如何?      近日,曾经拿到过斯坦福、UCL、CMU、NYU、UW 博士 offer、目前在华盛顿大学读博的知名评测博主 Tim Dettmers 发布了一篇新文章,就深度学习从业者如何选择 GPU 发表了他的看法。   众所周知,深度学习是一个很吃算力的领域,所以,GPU 选得好不好直接决定了你的炼丹体验。那么,哪些指标是你在买 GPU 时应该重视的呢?RAM、core 还是 tensor core?如何做出一个高性价比的选择?文本将重点讨论这些问题,同时指出一些选购误区。      RTX 3070 打 2080Ti,这是真的吗?不少人已经被这样一张性能对比图「改变了信仰」。    选择 GPU 时你需要知道的东西   在选购 GPU 之前,你需要知道一些指标在深度学习中意味着什么。   首先是 Tensor Core,它可以让你在计算乘法和加法时将时钟周期降至 1/16,减少重复共享内存访问

FastReID:首个产业级通用目标重识别开源库

馋奶兔 提交于 2020-10-03 03:50:26
引言 京东AI研究院近日发布了基于PyTorch的通用目标重识别(ReID)开源库FastReID,其发布对相关领域的研究起到积极的促进作用,同时也加速技术产品落地应用。FastReID已经在行人重识别、车辆重识别上都取得了优异的评测结果,在京东内部,该技术已经获得广泛地应用于智慧园区、智慧楼宇、智慧供应链、线下零售等实际项目中。在刚公布的论文FastReID: A Pytorch Toolbox for General Instance Re-identification中详细介绍了该开源库的内容。 论文链接: https://arxiv.org/pdf/2006.02631.pdf GitHub链接: https://github.com/JDAI-CV/fast-reid 无论是零售场景下的“无人超市”还是供应链场景下的智慧园区,亦或是疫情之下的口罩佩戴……在“有意遮挡”的情况下,“人脸识别”的难度都会面临不小的挑战,其在“配合”模式下的良好识别率将很难发挥价值。 因此,通用目标重识别的价值将越来越重要,为满足通用实例重识别日益增长的应用需求,京东AI研究院于近日发布了基于PyTorch的通用目标重识别(ReID)开源库FastReID , 在 FastReID中,高度模块化和可扩展的设计使得开发者很容易实现新的研究思路。 其发布对相关领域的研究起到积极的促进作用

一文图解单目相机标定算法

主宰稳场 提交于 2020-10-02 13:46:57
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 有一天,蟹老板找底下的员工川建国同学: 等蟹老板走后,然后转头问旁边的学霸李雷同学: 李雷同学整理了下情绪: 有人反映哦,有时候我们发出来的技术贴太硬了,不方便去理解,于是,就有了上面这个尝试,在开始正课之前,我们先讲一段故事。如果大家觉得OK,后面我们将继续用这种方式来讲课,如果不OK,请大家在我们评论区提供您宝贵的意见。 这次单目相机标定教程,预计有三期,第一期讲单目相机成像过程,第二期讲MATALAB和OpenCV的单目相机标定实践,第三期则讲张正友标定法的原理。这里是3D视觉工坊嘉宾,Atlas博士生计算机视觉大讲堂,致力于把计算机视觉知识讲得不那么无趣! 01 什么是相机标定? 说到相机标定,就要先说什么是传感器的标定。我们知道,任何传感器,它都是存在有误差的,那么狭义上说,标定就是去校正这部分误差,让传感器尽量准确一点。我们来看相机标定前后输出图像的差别: 图1 相机标定前后输出图像的差别 有人说了,那为什么相机出厂前,它不提前做好标定呢? 李雷同学又鄙夷了一次建国同学: 出厂前相机标定,厂家想做(谁不想自己的传感器准一点呢),但这个真还不是厂家懒,它真做不了。因为相机要标定的参数,跟相机实际的光圈、焦距大小有关,而这两个参数,在一般的工业相机中都是可调节的,所以只能你自己来标定。

全程实操 | 最新版OpenCV4.4免费视频课程送给大家

只愿长相守 提交于 2020-10-02 11:25:42
Hello,大家好!今天我想告诉大家一个好消息, 【OpenCV4.x C++快速入门视频教程】 免费学了。整个课程一口气录完,全程实操,代码教学,保证了原汁原味的OpenCV学习,绝对无剪切,讲师基本功深厚,在线写在线运行,一步一步带你入门OpenCV4.x,是上乘的良心之作。怎么看, B站搜索 【OpenCV学堂】 即可,或者扫码 真的,我把多年OpenCV开发与教学经验,认真汇总与总结提炼出了这门课程,目标是帮助更多应用开发者、OpenCV爱好者、计算机视觉开发感兴趣的人走好入门OpenCV框架开发的第一步,少走弯路,少浪费时间。 总计30个课时,从最基础的OpenCV图像/视频读写、各种图像基本操作、直方图操作、到图像卷积处理、人脸检测涵盖初学者必须掌握的100个图像基础知识点与相关函数极其参数的详细讲述。 针对每个函数的应用,我都贴合实际的应用场景,做到学以致用,学而化之。真正的原理与代码教学想结合,我敢说这门课程是全网唯一不用PPT而教会你图像与OpenCV编程的好课。 初心不改 我以前录制了很多视频收费课程,得到了广大OpenCV开发者与爱好者的认可,深深感到诚惶诚恐。我的微信公众号【OpenCV学堂】也得到了大家一直默默关注与厚爱,特别想回报这些一直默默支持的好友。我写不出什么励志名篇的鸡汤文,而不好跟大家侃侃而谈我对技术反思,只好用十年OpenCV经验