计算机视觉

你租的房子安全吗?女租户被偷拍4000条卧室视频,AI能发现“隐藏摄像头”吗?

不问归期 提交于 2020-08-14 17:58:52
大数据文摘出品 作者:刘俊寰 你租的房子安全吗? 7月下旬,太原租客在房间发现多个隐蔽摄像头一事引起了多方关注。 根据澎湃新闻报道,一位女性租客租房中发现了多个隐蔽摄像头,这些偷拍设备分别 对准了卧室的床和浴室 , 拍摄视频超过4000条 ,视频内容包括 租客的起居和洗澡等日常画面 。 房东王某某是山西省文化和旅游厅规划财务处工作人员,该租客回忆表示,男房东经常来房间,疑似更换偷拍设备的存储卡, “一周最少来一次,我们也感觉他鬼鬼祟祟的,但不敢往这方面想” 。 随后迎泽公安介入调查,房东因涉案,现已被刑事拘留,案件正在进一步侦办中。 用隐蔽摄像头偷拍视频在全球范围内都屡见不鲜了。 去年,韩国警方调查发现,两名男子在汽车旅馆或旅馆内用隐蔽摄像头拍摄了约 1600人 的视频,涉及 全国10个城市30个住所的42个房间 ,这些视频被公布在直播网站上供用户 付费观看 。上海大邦律师事务所丁金坤律师表示,在中国,偷拍行为违反了《治安管理处罚法》第42条规定的侵犯隐私的违法行为,应被治安处罚。使用针孔摄像偷拍,造成严重后果的,还涉嫌触犯《刑法》第284条的“非法使用窃听、窃照专用器材罪”,应追究刑事责任。 知己知彼,才能百战百胜 如今,隐蔽摄像头和相应的检测技术与工具层出不穷,但原理都是以不变应万变。 在知乎相关话题下,一位名叫@DD

【小白学YOLO】一文带你学YOLOv1 Testing

爱⌒轻易说出口 提交于 2020-08-14 16:39:09
摘要: 本文将为初学者带详细分析如何进行YOLOv1 Testing的内容。 YOLOv1 Testing 进入testing阶段,我们已经得到98个bounding box和confidence还有Class probability map,接下来我们需要一些筛选bounding box的算法,我们开始引入NMS(Non-max suppression)非极大值抑制。 NMS非极大值抑制概述 非极大值抑制(Non-Maximum Suppression,NMS),顾名思义就是抑制不是极大值的元素,可以理解为局部最大搜索。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法(参考论文《Efficient Non-Maximum Suppression》对1维和2维数据的NMS实现),而是用于目标检测中提取分数最高的窗口的。例如在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口。 NMS在计算机视觉领域有着非常重要的应用,如视频目标跟踪、数据挖掘、3D重建、目标识别以及纹理分析等。 YOLOv1中Testing过程 上篇博客中

pytorch学习笔记(三十八):Image-Augmentation

£可爱£侵袭症+ 提交于 2020-08-14 16:07:48
文章目录 图像增广 1. 常用的图像增广方法 1.1 翻转和裁剪 1.2 变化颜色 1.3 叠加多个图像增广方法 2. 使用图像增广训练模型 2.1 使用图像增广训练模型 小结 图像增广 图像增广(image augmentation) 技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。可以说,在当年AlexNet的成功中,图像增广技术功不可没。本节我们将讨论这个在计算机视觉里被广泛使用的技术。 首先,导入实验所需的包或模块。 % matplotlib inline import time import torch from torch import nn , optim from torch . utils . data import Dataset , DataLoader import torchvision from PIL import Image import sys sys . path . append ( ".." ) import d2lzh_pytorch as

刷新五项SOTA,百度ActBERT:基于动作和局部物体的视频文本特征学习模型

孤街醉人 提交于 2020-08-14 15:42:14
全球计算机视觉顶会 CVPR 2020 上,百度共计有 22 篇论文被接收。这篇 Oral 论文中,百度提出了 ActBERT,该模型可以学习叙述性视频进行无监督视频文本关系,并提出纠缠编码器对局部区域、全局动作与语言文字进行编码。最终在 5 项相关测评任务上取得了 SOTA 结果。 机器之心发布,机器之心编辑部。 ActBERT 在下游视频和语言任务上,即文本视频片段检索、视频描述生成、视频问答、动作步骤定位等任务上明显优于其他技术,展示了其在视频文本表示方面的学习能力。 论文:《ActBERT: Learning Global-Local Video-Text Representations》 论文链接: http:// openaccess.thecvf.com/c ontent_CVPR_2020/papers/Zhu_ActBERT_Learning_Global-Local_Video-Text_Representations_CVPR_2020_paper.pdf 现有利用 BERT 训练方式进行视频语言建模一般通过量化视频帧特征的方式,通过聚类离散化将视觉特征转化为视觉单词。但是,详细的局部信息,例如,互动对象,在聚类过程中可能会丢失,防止模型进一步发现细粒度的视频和文字对应关系。本文提出 ActBERT 从配对视频序列中挖掘全局和局部视觉线索和文字描述

业内首款,百度工业视觉智能平台全新亮相

不羁岁月 提交于 2020-08-14 13:26:54
本文作者:y****n 业内首款全国产化工业视觉智能平台——百度工业视觉智能平台亮相中国机器视觉展(Vision China),该平台所具有的核心AI能力完全自主可控,在质检、巡检等场景中具有高效、准确、强大的功能,已经应用在3C、汽车等十几个行业。 Vision China由中国机器视觉产业联盟主办,在业内具有广泛的影响力。展会中,百度工业视觉智能平台展出了最新技术、生态产品及应用场景,吸引了大量行业内人士前来参观,现场人潮涌动。 作为业内首款全国产化工业视觉智能平台,百度工业视觉智能平台搭载最新的百度昆仑芯片、采用百度开源深度学习框架 飞桨 ,其核心AI能力完全自主可控,模型整体性能比基于其他开源深度学习框架模型提升30%-40%,支持工业图像、视频数据的标注、模型训练、模型测试、模型下发全流程。 升级后的百度工业视觉智能平台在原有智能工业质检解决方案的基础上,新增厂区安全巡检解决方案与AR远程协助及培训解决方案。三大方案涵盖了工业场景绝大部分的视觉应用,使得平台更加立体,应用更丰富。 为解决工业视觉质检场景中,缺陷样本少、收集时间长的问题,展会上百度带来了无监督良品缺陷发现模型,用户仅需提供5-10张无任何缺陷的良品图片作为训练样本,无需标注便可识别带有缺陷的样本。 该模型在百度与合作伙伴菲特联合研发的产品AIBox中初次亮相,通过与模型的互动

深源恒际医疗票据OCR落地九省市 服务范围覆盖过半市场

一笑奈何 提交于 2020-08-14 10:28:12
近年来,我国健康险市场规模持续保持高增长。银保监会最新统计数据显示,2019年中国健康险业务原保险保费收入6564亿元,同比增长29.75%。同时,随着民众风险保障意识的不断提升,未来健康险仍有巨大的潜在增长空间。据天风证券研报预测,未来五年内健康险复合增速将保持在20%左右。 与市场规模呈正相关,健康险理赔案件数也在逐年走高。据了解,自2015年起,健康险理赔案件数量和赔付金额正以年均20%的速度增长。因此,如何提升服务效率、优化服务体验,成为保险机构增强市场竞争力的重要抓手。 保险科技公司 深源恒际 从健康险核赔理算业务场景入手,研发了医疗票据OCR产品,基于深度学习算法下的专项模型训练,自动识别、提取医疗票据上的核心理算信息,并将结构化的信息录入理算系统,旨在通过计算机视觉替代人力作业,大幅降低人力投入、缩短业务耗时,帮助健康险提升理赔服务效率、优化理赔服务体验。 截至目前,该产品已先后在 北京、天津、上海、广东、浙江、江苏、山东、河南及河北 九省市完成落地,预估服务范围覆盖健康险过半市场。 01 切中要害 直击痛点 出于行业监管因素,目前商业医保机构无法直接获取或即时共享到投保用户的医疗信息。在涉及健康险理赔时,理算人员需要从用户提交的医疗单据上获取原始的理算数据,并将相关信息逐项录入系统,通常单个案件涉及录入的信息多达百余项。而人工录入的作业方式不够经济

GAITC专题论坛丨探索新前沿,共启机器智能新篇章

≡放荡痞女 提交于 2020-08-14 08:59:06
     2020全球人工智能技术大会将于7月25-26日登陆杭州未来科技城。除了令人瞩目的大会主旨论坛,同期举行的20场专题论坛嘉宾层次高、主题范围广,聚焦模式识别、脑科学与人工智能等人工智能多个热门领域,内容精彩纷呈,观点将极具创见和现实针对性。   机器智能是机器利用自主智能与群体智能、人机共融与智能交互、智能感知与认知决策等各种智能技术完成任务的能力。它的基础是计算,核心是会学习的机器,关注利用智能芯片和智能软件等实现包括制造机床、无人车、家用电器等所有类别机器的智能化,是智能制造、智能汽车、智能机械与智能装备等新兴产业的原动力,是新一代自动化的延伸。7月26日下午,由复旦大学智能机器人研究院常务副院长、特聘教授张立华,西安交通大学教授、教育部长江学者特聘教授、CAA Fellow薛建儒担任论坛主席的 机器智能前沿论坛 将拉开帷幕。参会嘉宾将以独特的视角,专业的分析,凝练出机器智能发展的前沿方向,敬请锁定本场论坛! 大会官网   扫码访问大会官网,获取最新会议动态   加入2020GAITC交流群,了解更多会议精彩内容 论坛主席       张立华    复旦大学智能机器人研究院常务副院长、特聘教授   智能机器人教育部工程研究中心常务副主任、吉林省人工智能与无人系统工程研究中心主任。国家科技创新2030-新一代人工智能重大项目责任专家,全国信标委生物特征识别分委会

5个步骤实现目标检测

我与影子孤独终老i 提交于 2020-08-14 07:06:59
作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 目标检测技术是当今计算机视觉领域的发展趋势。在场景图像和视频中,有许多方法被用来检测物体。在资源和执行时间方面,每种技术都有自己的优势和局限性。检测视频中的物体也需要大量的技术知识和资源。 因此,人们一直在寻找一种简单、快速的目标检测方法。在本文中,我们将演示如何检测视频中看到的对象,只需5个步骤。 我们将在本任务中使用pixellib库,该库使用实例分割检测对象。我们还将使用预训练Mask R-CNN模型来识别视频中看到的物体。 在这个实现中,我们将检测交通视频中的车辆对象。 实例分割 实例分割是计算机视觉中的一种技术,它利用图像分割的方法进行目标检测。它在像素级识别图像或视频中存在的每个对象实例。 在图像分割中,视觉输入被分割成若干段,通过形成像素集合来表示对象或对象的一部分。实例分割识别图像中每个对象的每个实例,而不是像语义分割那样对每个像素进行分类。 Mask R-CNN Mask R-CNN是由Kaiming He等人在Facebook人工智能研究所提出的深层神经网络的变体。该模型用于解决计算机视觉中的对象实例分割问题。 它检测图像中的对象,同时为每个实例生成一个高质量的分割掩码。它是Faster R-CNN的一个扩展,它增加了一个预测目标掩码的分支

28篇论文、6大主题带你一览CVPR2020研究趋势

那年仲夏 提交于 2020-08-14 01:08:16
     编译 | 陈大鑫   编辑 | 丛 末   首度于线上召开的CVPR 2020 会议已经落下帷幕。今年,大会共有1467篇论文被接收,共举办了29个Tutorial、64个Workshop,线上与会者人数达 7600人。大量的论文,加上今年新采用虚拟会议的形式,曾一度让会议浏览器不堪重负(浏览速度非常慢)。   为了让大家更好地掌握今年会议的总体研究趋势,一位深度学习专业的博士生Yassine Ouali 专门撰写了一篇博客,总结了一些引起他关注的论文,以呈现今年会议的大致面貌。    我们先来看下 CVPR 2020 官方的相关统计数据:   CVPR 往年的增长趋势仍然继续:作者人数增加了20%,提交论文的数量增加了29%,同时为了适应这种扩张,审稿人和领域主席都有增加      今年会议的注册人数共有6424人,相比2019年增加了一千多人。在被接收的1467篇论文中,有335篇 Oral 论文。         与去年相似,就接受论文而言,中国是CVPR的第一贡献者,其中来自清华大学的作者数量最多,其次是美国(按国家)和Google(按组织)。      不出所料,被接收的论文主题多数集中在与学习、识别、检测和理解有关的主题上。但是,人们对诸如高效标签方法(例如,迁移学习),图像合成和机器人感知等相对较新的领域越来越感兴趣

一文了解NLP中的数据增强方法

别等时光非礼了梦想. 提交于 2020-08-13 18:46:06
最近研究了一阵文本数据增强的方法,看到国外有一个小哥写了一篇很不错的博客来总结 NLP 领域数据增强的方法,读完感觉收益颇多,所以周末花了一上午时间翻译了一下全文。 原文地址: A Visual Survey of Data Augmentation in NLP 翻译:简枫(转载请私信或邮件) 数据增强技术在计算机视觉中应用的比较广泛,但是在 NLP 中却很少能得到有效的应用。本质原因在于图像中的一些数据增强方法,比如将图像旋转几度或将其色度转换为灰度,在增强数据的同时并不会改变图像本身的含义。这种特性使得数据增强成为计算机视觉研究中的一种重要工具。 不同于 CV,NLP 中想要做数据增强,明显困难很多 我对是否有人尝试去开发 NLP 相关的数据增强技术很感兴趣,所以找时间研究了一下现有的文献。在这篇文章中,我会努力去概述当前用于文本数据增强的方法,同时也提供对应的参考文献,供大家学习。 NLP 里面数据增强的常用方法 1. 词汇替换 这一类的工作,简单来说,就是去替换原始文本中的某一部分,而不改变句子本身的意思。 1.1 基于同义词典的替换 在这种方法中,我们从句子中随机取出一个单词,将其替换为对应的同义词。例如,我们可以使用英语的 WordNet 数据库来查找同义词,然后进行替换。 WordNet 是一个人工维护的数据库,其中包含单词之间的关系。 使用 WordNet