深度学习

智能海滩、泳池来了!AI溺水防护系统实时跟踪、风险预测、自动警报

懵懂的女人 提交于 2020-10-12 04:57:43
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 如今,人工智能(AI)在生活中的应用场景可谓百变多样。从医学诊断、图像识别、无人驾驶到个人助理、教育辅助,AI 的对现代生活的重要性不言而喻。然而,除了以上场景,AI 还可以应用于安全防护方面。 这不,眼看着炎炎夏日来临,人们纷纷涌向游泳馆、海滩等消暑胜地,渴望在灼热温度中寻求一丝“透心凉”的快感。但人生就是这样,你永远不知道明天和意外哪一个先来。尤其在热浪滚滚的夏日,游泳溺亡的意外事故层出不穷。 根据世界卫生组织(WHO)的数据,溺水是造成全球人口意外死亡的第三大原因,全球每年估计有 320,000 人因溺水而死亡。但现在,有了 AI 的帮助,溺水事故率很可能得到大幅降低。 近日,以色列内盖夫本古里安大学(BGU)的衍生企业 Sightbit,就针对频发的溺水事故,开发出一套 AI 溺水防护系统,该系统可以实时监测所有游泳者,并标记出潜在的危险情况,以弥补救生员肉眼观察的不足。 AI 海滩监控 Sightbit 的系统包含多组摄像头,这些摄像头并非普通相机,而是加持了基于深度学习和计算机视觉技术的软件。增强后的多组摄像头更加灵敏,能够清晰地显示出摄像范围内的所有物体。 而且,这种摄像机的摄像范围也大大提高,单个摄像机可以伸展到大约 1000 英尺(300 米)的海岸线。要知道

基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之三维曲面解码...

微笑、不失礼 提交于 2020-10-12 04:03:07
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 1. 三维曲面解码 基于体积表示的方法在计算上非常浪费,因为信息只在三维形状的表面或其附近丰富。直接处理曲面时的主要挑战是,网格或点云等常见表示没有规则的结构,因此,它们不容易适应深度学习体系结构,特别是使用CNN的体系结构。本节介绍用于解决此问题的技术,将最新技术分为三大类:基于参数化、基于模板变形和基于点的方法。 1.1 基于参数化的三维重建 与直接使用三角形网格不同,我们可以将三维形状X的表面表示为映射ζ:D→R 3 ,其中D是正则参数化域。然后,3D重建过程的目标是从输入I中恢复形状函数ζ。当D是3D域时,这类方法属于第4节中描述的体积技术。 这里,重点讨论D是正则2D域的情况,它可以是二维平面的子集,例如D=[0,1] 2 ,或者是单位球面,即D=S 2 。在第一种情况下,可以使用标准的2D卷积操作来实现编码器-解码器架构。在后一种情况下,必须使用球面卷积,因为域是球面的。 球面参数化和几何图像是最常用的参数化。然而,它们只适用于0属和盘状表面。任意拓扑的曲面需要切割成圆盘状的曲面片,然后展开成规则的二维区域。找到给定曲面的最佳切割,更重要的是,在同一类别的形状之间找到一致的切割是一项挑战。事实上,单纯地为形状类别创建独立的几何图像并将其输入深层神经网络将无法生成连贯的三维形状曲面。

MNIST数据集下载及可视化

只愿长相守 提交于 2020-10-12 01:57:34
MNIST数据集介绍 MNIST数据集官网: http://yann.lecun.com/exdb/mnist/ MNIST数据库是非常经典的一个数据集,就像你学编程起初写一个“Hello Word”的程序一样,学Deep Learning你就会写识别MNIST数据集的Model。 MNIST数据集是由0〜9手写数字图片和数字标签所组成的,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片。如下图所示。 MNIST数据库一共有四个文件案,分别为 1. train-images-idx3-ubyte.gz :训练集图片(9912422字节),55000张训练集,5000张验证集 2. train-labels-idx1-ubyte.gz :训练集图片对应的标签(28881字节), 3. t10k-images-idx3-ubyte .gz :测试集图片(1648877字节),10000张图片 4. t10k-labels-idx1-ubyte.gz :测试集图片对应的标签(4542字节) 图片是指0〜9手写数字图片,而标签则是对应该图片之实际数字。 MNIST 数据集下载及可视化 TensorFlow提供了一个库可以对MNIST数据集进行下载和解压。具体的是使用TensorFlow中input_data.py脚本来读取数据及标签

FPGA开发板为什么要使用SDRAM

半世苍凉 提交于 2020-10-12 01:56:04
SDRAM有一个同步接口,在响应控制输入前会等待一个时钟信号,这样就能和计算机的系统总线 同步。时钟被用来驱动一个有限状态机,对进入的指令进行管线(Pipeline)操作。这使得 SDRAM 与没有同步接口的异步DRAM相比,可以有一个更复杂的操作模式。 管线 意味着芯片可以在处理完之前的指令前,接受一个新的指令 。在一个写入的管线 中,写入命令在另一个指令执行完之后可以立刻执行,而不需要等待数据写入存储队列的时间。在一个读取的流水线中,需要的数据 在读取指令发出之后固定数量的时钟频率后到达,而这个等待的过程可以发出其它附加指令。这种延迟被称为等待时间(Latency),在为计算机购买内存时是一个很重要的参数。 SDRAM在计算机中被广泛使用,从起初的SDRAM到之后一代的DDR(或称DDR1),然后是DDR2 和DDR3 进入大众市场,2015年开始DDR4进入消费市场。如UMI型号 UD408G5S1AF的一款8Gb 32位 DDR4 SDRAM,是一款支持使用在英特尔Arria 10 SoC FPGA以及Kintex Ultrascale FPGA中的存储器。 32位 DDR4 SDRAM 非常适合边缘类计算,或对PCB面积有紧凑要求的深度学习计算设备。 英尚微支持32位DDR4 SDRAM送样及测试. 为什么要使用内存控制器? 动态内存的驱动比静态内存的驱动更加复杂..

综述|视觉与惯导,视觉与深度学习SLAM

℡╲_俬逩灬. 提交于 2020-10-12 01:46:06
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 SLAM包含了两个主要的任务:定位与构图,在移动机器人或者自动驾驶中,这是一个十分重要的问题:机器人要精确的移动,就必须要有一个环境的地图,那么要构建环境的地图就需要知道机器人的位置。 本系列文章主要分成四个部分: 在第一部分中,将介绍Lidar SLAM,包括Lidar传感器,开源Lidar SLAM系统,Lidar中的深度学习以及挑战和未来。 第二部分重点介绍了Visual SLAM,包括相机传感器,不同稠密SLAM的开源视觉SLAM系统。 第三部分介绍视觉惯性里程法SLAM,视觉SLAM中的深度学习以及未来。 第四部分中,将介绍激光雷达与视觉的融合。 视觉SLAM的稳定性是一项技术挑战。因为基于单目的视觉SLAM需要初始化、尺度的不确定性和尺度漂移等问题[1]。尽管立体相机和RGB-D相机可以解决初始化和缩放的问题,但也存在一些不容忽视的问题,如运动速度快、视角小、计算量大、遮挡、特征丢失、动态场景和光照变换等。针对以上这些问题传感器的融合方案逐渐流行起来,IMU与相机融合的视觉里程计成为研究热点。 视觉与惯导 论文[2][3][4]是比较早期对VIO进行的一些研究。[5][6]给出了视觉惯导里程计的数学证明。而论文[7]则使用捆集约束算法对VIO进行稳健初始化。特别是tango[8]、Dyson 360

通俗易懂的Harris 角点检测

半腔热情 提交于 2020-10-12 01:45:54
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 Harris 角点检测 认为 特征点具有局部差异性 。 如何描述“特征点具有局部差异性”: 以每一个点为中心,取一个窗口,窗口大小为5*5或7*7像素大小。 这个 窗口描述了这个特征点周围的环境 。 如果这个特征点具有局部差异性,那么以这个特征点为中心,把窗口向360度任意一个方向移动,窗口的变化比较大,则这个特征点的周围环境变化比较大。 数学公式: (x,y):表示像素的位置。 :表示窗口内的每个像素。 w(x,y):表示 这个位置的权重。 若w=1,则说明窗口中所有的像素贡献是一样的。 若w设置为以这个特征点为中心的高斯, 高斯权重,说明距离这个特征点越近,权重越大;越往周围发散,权重越小。 I(x,y):表示(x,y)这个位置的像素值。如果是灰度图,I就是灰度值,如果是彩色图,I就是RGB值。 u和v表示窗口移动的方向。 I(x+u,y+v) - I(x,y):表示对应像素的灰度差异。 :在整个窗口内,即在局部环境内求这个像素灰度差异的加权和。 对 I(x+u,y+v) - I(x,y)进行一阶泰勒展开,得到 在(x,y)处的灰度值,再加上u方向和v方向的偏导数。 整理后,结果为: u和v表示窗口移动的方向, H表示Harris矩阵,主要由图像梯度表示。 对Harris矩阵进行特征分解: 得到两个特征值

BAT算法工程师的成长之路,超详细的学习路线

放肆的年华 提交于 2020-10-11 18:00:21
点赞再看,养成习惯,微信公众号搜索【JackCui-AI】关注这个爱发技术干货的程序员。本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有一线大厂面试完整考点、资料以及我的系列文章。 一、前言 各位十一过得如何? 假期,我回了趟老家,文章停更了几天。 写文章以来,被问到 最多的问题 就是「算法的学习路线」。 今天,它来了。 我会带着大家看看,我们需要学些啥,利用这个假期,我甚至还收集整理了配套视频和资料, 暖男 石锤啊,这期文章有用的话, 别忘三连 哦! 二、学习路线 主要分为 4 个部分:数学基础、编程能力、算法基础、实战。 1、数学基础 在机器学习算法中,涉及到最为重要的数学基本知识有两个: 线性代数 和 概率论 。 这两也是大学的必修课了,如果 知识早已还给老师 ,也没关系, 哪里不会学补哪里 。 线性代数 研究的是线性空间的性质,数据通常会被表示为欧式空间中的点,而这些点经过一系列变换后会映射到另一个空间,在新的空间中隐藏在数据中的规律才得以显现。 所以线性代数作为研究空间的一门科学,是入门机器学习的 最要基础之一 。 视频 :推荐 MIT 的老教授 Gilbert Strang 的线性代数上课视频。 没学过线代的同学会发现这门课程,讲得清晰而且直观,深入线代的精髓,完全不是那种理论堆砌的讲法

谷歌开源NLP模型可视化工具LIT,模型训练不再「黑箱」

好久不见. 提交于 2020-10-11 03:59:15
深度学习模型的训练就像是「黑箱操作」,知道输入是什么、输出是什么,但中间过程就像个黑匣子,这使得研究人员可能花费大量时间找出模型运行不正常的原因。假如有一款可视化的工具,能够帮助研究人员更好地理解模型行为,这应该是件非常棒的事。 近日,Google 研究人员发布了一款语言可解释性工具 (Language Interpretability Tool, LIT),这是一个开源平台,用于可视化和理解自然语言处理模型。 论文地址:https://arxiv.org/pdf/2008.05122.pdf 项目地址:https://github.com/PAIR-code/lit LIT 重点关注模型行为的核心问题,包括:为什么模型做出这样的预测?什么时候性能不佳?在输入变化可控的情况下会发生什么?LIT 将局部解释、聚合分析和反事实生成集成到一个流线型的、基于浏览器的界面中,以实现快速探索和错误分析。 该研究支持多种自然语言处理任务,包括探索情感分析的反事实、度量共指系统中的性别偏见,以及探索文本生成中的局部行为。 此外 LIT 还支持多种模型,包括分类、seq2seq 和结构化预测模型。并且它具备高度可扩展性,可通过声明式、框架无关的 API 进行扩展。 相关 demo,参见视频: 00:00/00:00倍速 可以针对新颖的工作流程进行重新配置,并且这些组件是独立的,可移植的,且易于实现。

Staple 跟踪: Complementary Learners for Real-Time Tracking

时光总嘲笑我的痴心妄想 提交于 2020-10-10 15:05:07
目标跟踪算法--Staple: Complementary Learners for Real-Time Tracking 小小菜鸟一只 2017-03-25 09:26:42 15110 收藏 14 分类专栏: 目标跟踪 版权 文章下载链接: 文章下载链接 代码下载链接: Staple代码 ———————————————————————————————————————————— 今天要讲的这篇文章也是基于相关滤波器(不懂相关滤波器的请看我前一篇文章)进行改进的一篇文章,发表在2016年CVPR上面,提出了一个新的想法,融合算法,使用HOG-KCF+color-KCF结合算法对目标进行跟踪,HOG特征对形变和运动模糊比较敏感,但是对颜色变化能够达到很好的跟踪效果,color特征对颜色比较敏感,但是对形变和运动模糊能够有很好的跟踪效果,同时使用两者融合能够解决大部分跟踪过程当中遇到的问题。作者在文章的开头就放出来这张图,图中很明显的可以看出,当颜色对目标影响过大时候(图中第二行),DSST对目标跟踪效果较好,当运动模糊对目标影响过大(图中第一行)DAT对目标跟踪效果较好。 Abstract 近些年来,基于相关滤波跟踪器的算法得到了很大的改进,已经能够达到很好的跟踪效果,14年的KCF,15年的SRDCF、HCF等算法,都已经达到了很高的精度,像HCF已经在OTB-50上达到了0

《评人工智能如何走向新阶段》后记(再续27)

落花浮王杯 提交于 2020-10-10 00:29:37
439, 彩虹一号无人机实现人类永不落地的追求 日媒:中国亮出杀手锏 世界各国一直在研究提高飞机的续航能力 国内研制的彩虹一号无人机采用人工智能和其他高新技术,飞行高度30000米,并终于研制成功实现人类永不落地的追求。 440, 日本开发出光刻机亷价可靠的极紫外射线EUV光源 东京工业大学KeijiNagai教授率领的研究团队(并与都柏林大学学院科学家合作)最近研发了一种极低密度的锡“气泡”,使得极紫外射线的产生变得可靠且便宜。 以往采用高强度激光器来产生EUⅤ光源,但对这些激光器而言,要保持可产生EUⅤ范围内光的目标密度的控制是有挑战性的。而今天他们研发的锡塗层微胶囊“气泡”技术,不但可保持高效、可扩展和低成本,而且是一种可高度挖制的、稳定的低密度结构。测试的结果产生了13.5nm的EUⅤ光(并与传统的EUⅤ光源兼容)。 这项研究成果,使得攻克光刻机不必僵持在整体攻关上,而找到将整体分解为各局部,将各局部关键技术各个击破的途径。 441, 大脑控制的真实感假肢问世,患者无需训练即可使用 一个欧美科学家团队报告说,有史以来最先进的仿生假肢取得成功 一个欧美科学家团队(由查尔黙斯理工大学、Sahlgrenska大学医院、哥德堡大学、IntegrumAB、维也纳医科大学和麻省理工学院研究人员组成)研究一种新的仿生假肢传感系统:将该系统整合到伤残患者的神经中