计算机视觉

【方案搭建】视频智能分析安防监控云服务如何实现城市视频智能化?

冷暖自知 提交于 2020-12-01 11:33:01
在互联网、物联网、大数据、人工智能引领新经济发展时,智慧城市成了城市发展破冰前行的利刃。而随着经济发展的需求和科学技术的进步,传统的电视监控因其具有不够精确等特点,已被新型的智能视频监控技术逐渐替代。在智慧城市建设持续纵深推进的同时,由于算法准确率和环境适应性的不断提高,将促使智能视频分析技术应用的大规模部署,智能视频分析技术的应用将越来越普遍。 TSINGSEE青犀视频研发团队为了满足智慧城市对智能视频分析的需求,自主研发了EasyCVR视频智能分析结构化平台,将前端视频流信息处理成数据信息,传输至后端进行分析记录。EasyCVR将视频变为有用的信息,与大数据、云计算技术相结合能形成巨大的资源信息库,为智慧城市建设提供有力的信息支撑和辅助决策支持。 初代模拟监控系统缺点非常明显,其监控范围、切换性能、数据存储都受到很大的局限。次代数字系统虽然功能增强了很多,也简化了操作难度,但欠缺稳定性,其布线复杂,监控范围依然有限。相比之下,EasyCVR智能视频监控系统则摒弃了前两代传统监控的缺点,表现出了极大的优越性。EasyCVR智能视频监控平台以互联网平台为依托,以数字化和信息化为发展方向,通过计算机视觉技术对视频进行智能分析和处理,在无人条件下进行全程自动化的监控。 其优点如下: 1、7x24小时无间断监控机械只要保证能源充足就可以无间断地工作

从attention到self-attention

爷,独闯天下 提交于 2020-11-30 22:12:14
attention的本质   通过计算Query和一组Key的相似度(或者叫相关性/注意力分布),来给一组Value赋上权重,一般地还会求出这一组Value的加权和。      一个典型的soft attention如下公式所示:      先用Query求出分别和一组Key计算相似度,计算相似度的方法有很多种,常用的有点乘、perceptron   然后用softmax归一化,得到每个Key对应的概率分布α(或者叫权重),即attention   由于Key和Value是一一对应的,再用α对Value做加权求和,得到加权和 Seq2Seq模型中attention的应用      在Seq2Seq模型中,Key = Value = encoder hidden state(即h),而 Query = decoder hidden state(即z)   其实际的含义也很好理解:通过计算当前decode出来的hidden state和encode时的hidden state的关系,给原来所有的encode的hidden state加一个权重,然后求加权和,相当于计算当前输出词对每个输入词的相关性,用这个相关性做加权求和,得到最终的hidden state。   (上图刚好没有计算Q、K、V的过程,计算顺序是这样的:z0、h -> α0 -> c0 -> z1 ... ..., 其中

MindSpore手写数字识别初体验,深度学习也没那么神秘嘛

僤鯓⒐⒋嵵緔 提交于 2020-11-30 12:06:27
摘要 :想了解深度学习却又无从下手,不如从手写数字识别模型训练开始吧! 深度学习作为机器学习分支之一,应用日益广泛。语音识别、自动机器翻译、即时视觉翻译、刷脸支付、人脸考勤……不知不觉,深度学习已经渗入到我们生活中的每个角落,给生活带来极大便利。即便如此,依然有很多人觉得深度学习高深莫测、遥不可及,的确,它有深奥之处,非专业人士难以企及,但也有亲和力十足的一面,让没有基础的小白也能轻松上手,感受深度学习的魅力,接下来要介绍的手写数字识别模型训练正是如此。 手写数字识别初探 手写数字识别是计算机视觉中较为简单的任务,也是计算机视觉领域发展较早的方向之一,早期主要用于银行汇款、单号识别、邮政信件、包裹的手写、邮编识别等场景,目前手写数字识别已经达到了较高的准确率,得到大规模的推广与应用。虽然手写数字识别本身的领域比较狭窄,实用性有限,但是在它基础上发展起来的卷积神经网络等计算机视觉技术早已应用在更为复杂的任务中,因此,手写数字识别也成为计算机视觉领域衡量算法表现的一个基准任务。所以,通过这一实践场景来了解神经网络开发和训练,可谓再好不过了。如何使用深度学习框架MindSpore进行模型开发与训练?又如何在ModelArts平台训练一个可以用于识别手写数字的模型呢?让我们来一探究竟吧。 数据集的选择与准备 机器学习中的传统机器学习和深度学习都是数据驱动的研究领域

ECCV 2020 | 超快的车道线检测

别来无恙 提交于 2020-11-30 07:47:53
本文转载自知乎,已获作者授权转载。 链接: https://zhuanlan.zhihu.com/p/157530787 很高兴和大家分享一下我们刚刚被 ECCV 2020 接收的新工作: 一种超快速的车道线检测算法 ( Ultra Fast Structure-aware Deep Lane Detection ),能够达到SOTA水平的性能,同时保持超高的检测速度。轻量级的版本可以在接近SOTA的性能情况下达到 300+FPS 的检测速度。 代码和模型已开源 。话不多说,先放demo。 1 前言 车道线检测是自动驾驶中的一个基础模块,其实也是一个由来已久的任务,早期已有很多基于传统图像处理实现的车道线检测算法。但随着大家研究的深入,车道线检测任务所应对的场景越来越多样化,逐步已经脱离了对于“白、黄色线条”这种低阶理解。目前更多的方式是寻求对于 语义上 车道线存在位置的检测,即使它是模糊的、被光照影响的、甚至是完全被遮挡的,如下图所示。 图1 目前车道线检测的难点为寻找语义上的线,而不是局限于表观存在的线 对于上图这类问题,基于传统图像处理的方法几乎无法实现检测,因此有了一些方法开始尝试一种最直接的深度学习方案——把车道线检测视为分割任务。虽然深度分割方法效果强于传统方法,但存在两个关键问题 速度慢 因为分割是逐像素分类的,要对图像中每一个像素点进行分类

【招聘·北京】· 京东方科技集团内推职位

夙愿已清 提交于 2020-11-29 13:42:48
【招聘·北京】· 京东方科技集团内推职位 有志者自有千计万计,无志者只感千难万难。 北京 · 京东方科技集团内推职位 通用软件测试工程师 【工作职责】 对产品线项目进行测试管理,参加软件产品开发前的需求调研和分析,制定项目的整体测试方案,协助项目经理进行产品/项目测试进度的控制,提交各阶段测试进度情况 完善功能测试/非功能测试体系,搭建自动化测试体系、推动测试与持续集成的融合 测试资源协调,测试人员任务分配 组织测试配置管理环境的建立-文档库和bug管理平台,参与测试方案、测试用例的评审 独立或带领团队进行高质量的产品交付。 【任职要求】 熟悉Android/IOS/H5/Web等前端整体测试技术; 掌握产品级别测试方案和用例设计方法; 熟悉前端架构,可对异常日志进行抓取和分析; 熟练使用Appium,Robotium等前端自动化测试工具; 熟练掌握Python、Java等编程语言之一,有自动化测试经验,可根据业务需求进行前端自动化测试; 熟悉前端性能测试设计方法,能进行前端性能测试,并定位性能瓶颈; 有兼容性测试经验,可对App兼容性进行测试分析及问题定位; 重本以上学历(统招),有产品级测试经验,参与过产品用户体验测试者更佳。 性能测试工程师 【工作职责】 1.支撑产品团队和两个研究院的服务器性能测试; 根据产品性能要求,设定性能测试指标,制订性能测试计划、方案

学会思考,而不只是编程

余生颓废 提交于 2020-11-28 14:32:28
中国人常说“授之以鱼不如授之以渔”。如果说教授编程是授之以鱼,那么教授计算机科学就是授之以渔。为什么说学习计算机科学比学会编程要重要得多?来听听Yevgeniy Brikman的解释。 现如今,似乎每个人都在学习编程:Bill Gates、Mark Zuckerberg和Chris Bosh这些名人在Code.org网站上告诉人们每个人都拥有编程的能力;CoderDojo项目在世界各地大张旗鼓;英国已经把编程作为小学官方课程。 不过,我认为这样有点误入歧途了。但请不要误会——我也确实认为代码能够让世界变得更美好——但编程本身并不是我们的目的。计算机和程序只是工具,它们是我们通向终点的桥梁。 我们真正的目标应该是教会人们如何思考。换句话说,我们应该教人们计算机科学,而不只是编程。在这篇文章里,我将会解释这两者之间的区别,以及为什么在这两者当中选择正确的一方对于迈向成功来说如此重要。 我们不妨先问自己一个问题:为什么我们要关心编程或计算机科学? 欢迎来到真实的世界 或许你正在使用Chrome或Firefox阅读这篇文章,这些浏览器可能运行在Windows或macOS上,而你可能正在使用笔记本或台式机。你今天可能花了一些时间阅读电子邮件、查看朋友圈的状态,或者在视频网站上看了一些视频。我们的生活在很大程度上依赖了计算机:我们的医疗记录保存在数据库里;我们的简历可能放在了LinkedIn上

阿里云打下AI地基,更多的开发者走向了前台

邮差的信 提交于 2020-11-28 10:00:24
简介: 不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。 很长时间没与星瞳(谢宣松)打交道了,之前他的身份一直在变。从早期的图像搜索拍立淘创始成员,到业内第一个智能设计产品鹿班的技术负责人,再到后面研究医疗AI的技术负责人。这些前沿技术的探索和应用经历,让他看起来像一个连续创新创业者。 现在,星瞳又多了一个新身份——阿里云视觉智能开放平台负责人。过去一年多的埋头苦干,他和伙伴们完成了平台从0到1的搭建,并上线了超过150个API接口。 星瞳并不是个例。包括现在视觉智能开放平台的团队成员也有类似的背景和经历。当外界还在种种猜测阿里AI专家们在做什么样的探索时,他们早已拓展了新的边界—— 不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。 这也导向了另一种商业故事剧本。越来越多的算法专家走向幕后,将原有技术能力整合成开放平台,让更多有创意的人只需要少许的技术基础,就有可能开发出有价值的AI应用。 阿里云视觉智能开放平台源起 2016年,AlphaGo 大胜李世石。人工智能浪潮席卷全球,成为“高大上”IT技术的代名词。每一家知名AI公司的背后,都有不少“AI业界大牛”坐镇。AI人才资源被巨头争抢的话题向来被大家津津乐道。行业的火爆,人才的稀缺,每一位AI大牛的动向都引得圈内格外关注

3D视觉:一张图像如何看出3D效果?

被刻印的时光 ゝ 提交于 2020-11-28 08:40:35
不同于人类,计算机「看待」世界有自己的方式。为了达到类似人类的视觉水平,各种算法层出不穷,本篇就来窥探其冰山一角。 机器之心原创,作者:陈萍。 我们生活的世界是一个三维物理空间。直观而言,三维视觉系统有助于机器更好地感知和理解真实的三维场景。三维视觉作为计算机视觉的一个比较重要的研究方向,在过去几十年间得到了扎实和系统地发展,形成了一套完整的理论体系。近年来,随着三维成像技术如激光雷达、TOF 相机及结构光等的快速发展,三维视觉研究再次成为研究热点。 在 上一篇文章 中,我们对 3D 视觉基础相关内容进行了概括性总结,本文我们将进行比较深层次的介绍,主要涉及 3D 视觉算法及其应用领域。 3D 目标检测多模态融合算法 基于视觉的目标检测是环境感知系统的重要组成,也是计算机视觉、机器人研究等相关领域的研究热点。三维目标检测是在二维目标检测的基础上,增加目标尺寸、深度、姿态等信息的估计。相比于二维目标检测,三维目标检测在准确性、实时性等方面仍有较大的提升空间。 在目标检测领域,2D 目标检测方面发展迅速,出现了以 R-CNN、Fast RCNN、Mask RCNN 为代表的 two-stage 网络架构,以及以 YOLO、SSD 为代表的 one-stage 网络架构。然而由于 2D 图像缺乏深度、尺寸等物理世界参数信息,在实际应用中存在一定局限性,往往需要结合激光雷达

阿里云打下AI地基,更多的开发者走向了前台

喜夏-厌秋 提交于 2020-11-27 12:28:22
简介: 不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。 很长时间没与星瞳(谢宣松)打交道了,之前他的身份一直在变。从早期的图像搜索拍立淘创始成员,到业内第一个智能设计产品鹿班的技术负责人,再到后面研究医疗AI的技术负责人。这些前沿技术的探索和应用经历,让他看起来像一个连续创新创业者。 现在,星瞳又多了一个新身份——阿里云视觉智能开放平台负责人。过去一年多的埋头苦干,他和伙伴们完成了平台从0到1的搭建,并上线了超过150个API接口。 星瞳并不是个例。包括现在视觉智能开放平台的团队成员也有类似的背景和经历。当外界还在种种猜测阿里AI专家们在做什么样的探索时,他们早已拓展了新的边界—— 不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。 这也导向了另一种商业故事剧本。越来越多的算法专家走向幕后,将原有技术能力整合成开放平台,让更多有创意的人只需要少许的技术基础,就有可能开发出有价值的AI应用。 阿里云视觉智能开放平台源起 2016年,AlphaGo 大胜李世石。人工智能浪潮席卷全球,成为“高大上”IT技术的代名词。每一家知名AI公司的背后,都有不少“AI业界大牛”坐镇。AI人才资源被巨头争抢的话题向来被大家津津乐道。行业的火爆,人才的稀缺,每一位AI大牛的动向都引得圈内格外关注

一文读懂YOLO V5 与 YOLO V4

自闭症网瘾萝莉.ら 提交于 2020-11-27 05:46:55
YOLO之父Joseph Redmon在今年年初宣布退出计算机视觉的研究的时候,很多人都以为目标检测神器YOLO系列就此终结。然而在4月23日,继任者YOLO V4却悄无声息地来了。Alexey Bochkovskiy发表了一篇名为YOLOV4: Optimal Speed and Accuracy of Object Detection的文章。YOLO V4是YOLO系列一个重大的更新,其在COCO数据集上的平均精度(AP)和帧率精度(FPS)分别提高了10% 和12%,并得到了Joseph Redmon的官方认可,被认为是当前最强的实时对象检测模型之一。 正当计算机视觉的从业者们正在努力研究YOLO V4的时候,万万没想到,有牛人不服。6月25日,Ultralytics发布了YOLOV5 的第一个正式版本,其性能与YOLO V4不相伯仲,同样也是现今最先进的对象检测技术,并在推理速度上是目前最强。 从上图的结果可以看出,YOLO V5确实在对象检测方面的表现非常出色,尤其是YOLO V5s 模型140FPS的推理速度非常惊艳。 YOLO V5和V4集中出现让很多人都感到疑惑,一是YOLO V5真的有资格能被称作新一代YOLO吗?二是YOLO V5的性能与V4相比究竟如何,两者有啥区别及相似之处? 在本文中我会详细介绍YOLO V5和YOLO V4的原理,技术区别及相似之处