深度学习

浙大 | 超快的结构感知深车道检测,300+FPS!

蓝咒 提交于 2020-11-30 07:48:17
点击上方 蓝字 ,获得更多精彩内容 精彩内容 浙大提出:超快速结构感知的车道线检测网络 ,在速度和准确性方面综合表现出色! 轻量级版本速度高达300+ FPS ! 论文链接: https://arxiv.org/abs/2004.11757 代码即将开源! 作者团队:浙江大学(李玺团队) 1 摘要 从上图可以看出,车道线检测要面临很多的难题,比如车辆的遮挡、各种复杂光线的影响,甚至有时候根本看不到车道线。 车道线检测方法通常被视为像素分割的问题。受人类感知的启发,在严重遮挡和极端光照条件下对车道线的识别主要基于上下文和全局信息。基于这种观察,本文提出了一种新颖,简单而有效的方法,我们将车道线检测过程视为使用全局特征的基于行(row-based)的选择问题, 使用全局特征在图像的预定义行中选择车道的位置,而不是基于局部接受域分割车道的每个像素 ,这大大降低了计算成本。在全局特征上使用较大的感受野,还可以处理具有挑战性的场景。 此外,基于该公式,还提出了结构损失,以对通道结构进行显式建模。在两个车道线检测基准数据集上的大量实验表明,这种方法可以在速度和准确性方面达到最先进的性能。 轻量级版本甚至可以以相同的分辨率每秒获得300+帧,这至少比以前的最新方法快4倍 。 2 创新及贡献 本文的主要贡献是提出一个车道线识别的新公式,根据该公式有了以下几方面的贡献: 提出了一种新颖、简单

ECCV 2020 | 超快的车道线检测

别来无恙 提交于 2020-11-30 07:47:53
本文转载自知乎,已获作者授权转载。 链接: https://zhuanlan.zhihu.com/p/157530787 很高兴和大家分享一下我们刚刚被 ECCV 2020 接收的新工作: 一种超快速的车道线检测算法 ( Ultra Fast Structure-aware Deep Lane Detection ),能够达到SOTA水平的性能,同时保持超高的检测速度。轻量级的版本可以在接近SOTA的性能情况下达到 300+FPS 的检测速度。 代码和模型已开源 。话不多说,先放demo。 1 前言 车道线检测是自动驾驶中的一个基础模块,其实也是一个由来已久的任务,早期已有很多基于传统图像处理实现的车道线检测算法。但随着大家研究的深入,车道线检测任务所应对的场景越来越多样化,逐步已经脱离了对于“白、黄色线条”这种低阶理解。目前更多的方式是寻求对于 语义上 车道线存在位置的检测,即使它是模糊的、被光照影响的、甚至是完全被遮挡的,如下图所示。 图1 目前车道线检测的难点为寻找语义上的线,而不是局限于表观存在的线 对于上图这类问题,基于传统图像处理的方法几乎无法实现检测,因此有了一些方法开始尝试一种最直接的深度学习方案——把车道线检测视为分割任务。虽然深度分割方法效果强于传统方法,但存在两个关键问题 速度慢 因为分割是逐像素分类的,要对图像中每一个像素点进行分类

ECCV 2020 | 超快的车道线检测

只愿长相守 提交于 2020-11-30 07:30:41
点击上方 “ AI算法与图像处理 ”,选择加"星标"或“置顶” 重磅干货,第一时间送达 本文转载自知乎,仅做学习交流分享,如有侵权请联系删除 链接: https://zhuanlan.zhihu.com/p/157530787 很高兴和大家分享一下我们刚刚被 ECCV 2020 接收的新工作: 一种超快速的车道线检测算法 ( Ultra Fast Structure-aware Deep Lane Detection ),能够达到SOTA水平的性能,同时保持超高的检测速度。轻量级的版本可以在接近SOTA的性能情况下达到 300+FPS 的检测速度。 代码和模型已开源 。话不多说,先放demo。 1 前言 车道线检测是自动驾驶中的一个基础模块,其实也是一个由来已久的任务,早期已有很多基于传统图像处理实现的车道线检测算法。但随着大家研究的深入,车道线检测任务所应对的场景越来越多样化,逐步已经脱离了对于“白、黄色线条”这种低阶理解。目前更多的方式是寻求对于 语义上 车道线存在位置的检测,即使它是模糊的、被光照影响的、甚至是完全被遮挡的,如下图所示。 图1 目前车道线检测的难点为寻找语义上的线,而不是局限于表观存在的线 对于上图这类问题,基于传统图像处理的方法几乎无法实现检测,因此有了一些方法开始尝试一种最直接的深度学习方案——把车道线检测视为分割任务。虽然深度分割方法效果强于传统方法

容联CTO许志强:AI、5G让通讯更智能、更高效

大憨熊 提交于 2020-11-30 01:05:13
LiveVideoStack采访了容联云通讯CTO许志强,分享了从一线研发到团队leader的软硬性能力提升经验,解析了通讯行业音视频技术难点、踩的坑以及优化方案,并展望了AI、5G为音视频技术发展带来的革新。 文 / 许志强 整理 / LiveVideoStack LiveVideoStack:许总您好,首先非常感谢您接受采访,还请您先介绍下自己和容联云通讯。 许志强: 本人毕业于华中理工大学自控系,中山大学MBA。先后就职于广州新太科技任开发中心副总经理、高阳圣思园任云通讯项目技术负责人。目前主要负责容联整体平台设计与开发,互联网/AI等前沿技术与通讯的融合跟进。 容联是国内专业的企业通讯云服务提供商。容联以云计算方式,为企业客户提供通讯平台服务(PaaS)、通讯软件服务(SaaS)、行业新通讯解决方案和“AI+通讯”服务,助力企业精准获客,提升终端用户服务体验;变革企业内部沟通协作方式,提升企业运营效率。驱动中国企业通讯产业实现互联网化、云计算化、能力化、融合化和智能化。经过几年的快速发展、积累,容联平台已聚集了超过15万家企业客户和30万开发者用户。容联服务的客户包括但不限于国家电网、中移在线、海尔控股、中国银行、招商证券、中车集团、中国平安、腾讯、京东、百度、360、小米、今日头条、瓜子二手车、顺丰等,全面覆盖金融、运营商、汽车、电商、O2O、在线教育、互联网医疗、游戏

微软亚研院副院长周明:从语言智能到代码智能

强颜欢笑 提交于 2020-11-29 15:22:48
来源:智源社区、AI科技评论 本文 约4700字 ,建议阅读 10 分钟 周明副院长在“语言与智能高峰论坛”讲解从语言智能到代码智能。 11月6日上午,在中国中文信息学会和中国计算机学会联合创办的“ 语言与智能高峰论坛” 上,微软亚洲研究院副院长周明,以 《从语言智能到代码智能》 为题,介绍了智能代码理解和生成代码的机理、预训练模型(CodeBERT/CodeGPT)、基准数据集(CodeXGLUE)以及融合了编程语言句法和语义信息的新的评价指标(CodeBLEU),分享了微软在编程语言知识和上下文进行推理,支持代码检索、补全、翻译、纠错、问答等场景的应用。 周明,微软亚洲研究院副院长、中国计算机学会副理事长、国际计算语言学会(ACL)前任会长。 1、NLP预训练模型到代码智能预训练模型 自然语言处理在深度学习的支撑下取得了迅猛发展,把自然语言发展的技术迁移到智能代码研究领域,以提升代码能力成为近年来新的研究热点。 代码智能能够让计算机具备理解和生成代码的能力,利用编程的语言知识和上下文进行推理,支持代码检索、代码翻译等场景应用。 图1:基于神经网络的NLP研究(NN-NLP) 图为清华大学唐杰团队总结的过去5年ACL文章中自然语言发展的主要工作,包括 Word embeddings、LSTM、Encode decoder、RNN、Pre-trainedmodel 等

不到1000行代码,GitHub 1400星,天才黑客开源深度学习框架tinygrad

时光怂恿深爱的人放手 提交于 2020-11-29 13:49:29
来源:机器之心 本文 约2000字 ,建议阅读 5 分钟 最近,天才黑客 George Hotz 开源了一个小型深度学习框架 tinygrad,兼具 PyTorch 和 micrograd 的功能。tinygrad 的代码数量不到 1000 行,目前该项目获得了 GitHub 1400 星。 在深度学习时代,谷歌、Facebook、百度等科技巨头开源了多款框架来帮助开发者更轻松地学习、构建和训练不同类型的神经网络。而这些大公司也花费了很大的精力来维护 TensorFlow、PyTorch 这样庞大的深度学习框架。 除了这类主流框架之外,开发者们也会开源一些小而精的框架或者库。比如今年 4 月份,特斯拉人工智能部门主管 Andrej Karpathy 开源了其编写的微型 autograd 引擎 micrograd,该引擎还用 50 行代码实现了一个类 PyTorch api 的神经网络库。目前,micrograd 项目的 GitHub star 量达到 1200 星。 不久前,天才黑客 George Hotz(乔治 · 霍兹)开源了一个小型 Autograd Tensor 库 tinygrad,它介于 PyTorch 和 micrograd 之间,能够满足做深度学习的大部分要求。上线不到一个月,该项目在 GitHub 上已经获得 1400 星。 项目地址: https:/

六年磨一剑,全时发布音视频会议平台TANG,多款新品亮相

只愿长相守 提交于 2020-11-29 11:56:29
作者 | 高卫华 出品 | AI科技大本营 时隔六年,全时于11月26日在北京举办了“时间的力量·2020新产品发布会“。 发布会现场,全时创始人&CEO陈学军回顾了全时近年来的发展历程,并正式推出了全时云会议2020版,全时小智和全时云直播三款新品。 底层投入和自主研发是立身之本 持续不断的底层投入和自主研发是全时为自身构筑的护城河。 全时CTO赵元军在发布会上表示,做会议有两个选择:一是借助外来技术贴标上市,二是自主研发底层平台。在中美关系起伏不定的今天,借助外来技术只是披了件外衣,而全时采用自主技术,意味着拥有了更大的稳定性和确定性。 赵元军说:“要坚持做正确的难事。”他在演讲中表示,好的会议产品,其标准并不是高黑深的科技、丰富的功能、炫酷的界面或性感的颜色,而是优质音视频、稳定、大并发和安全这四个方面。 此次发布会亮相的TANG平台,是全时自主研发而成的云原生分布式平台,同时也是全时整个会议系统稳定、安全和大并发的基础。 全时音视频核心技术包括AVE、SVC、宽带音频和深度学习四部分,可确保音频在丢包率80%情况下仍能正常交流,视频丢包率70%仍流畅清晰。其中,采用AI进行了降噪处理;并通过智能多媒体传输IMMTP,记录延时和抖动并反馈到业务层面,同步调整发包策略。 TANG平台的云和分布式部署,能让平台应对大流量冲击,保证99.99%高可用。 在安全保障方面

人生的一切问题,归根结底就是这三点:无知!恐惧!延迟!

落花浮王杯 提交于 2020-11-29 08:36:33
https://blog.csdn.net/weixin_34055910/article/details/87835492 导读 为什么人很难改变自己? 为什么有的人心态积极,有的人心态消极? 是什么阻碍了人的自我成长? 无论是“未经审视的人生不值得过”,还是“吾日三省吾身”,只有彻底认清消极心态系统运行的这三点本质:无知、恐惧、拖延,人才能真正意义上改变自我,在一个新的世界里找到觉醒的自己,自我救赎,自我新生,走向复活! ​ ​ ​ 一、承认无知 谈论某些事物(问题)是什么的时候后,常常发生这样的情形,你说一句,他回应十句……,同样的情形,换个问题,你不曾如此吗? 大多数人总以为自己知道的“很多”,为此我们常常在工作、生活的交流中争论不休,仅仅是为了固执于各自所谓的那个我认为,而不屑于他人说的是什么,静不下心来倾听他人的看法、见解,这是否对我帮助?至于事物的本身是什么,应该是什么样,不应该是什么样,已经不重要了。 人总喜欢活在自己的认知里,按着自己的那一套意图来行事,往往高估了自己的认知,而低估了自己认知之外的那部分无知。 就像有人说的那样:纠正一个笨蛋,他会讨厌你;纠正一个聪明的人,他会感激你。事实上,聪明的人只是极少数。偏见和傲慢,是阻碍人看清事物真相和本质的最大敌人。 人类总是将世界缩小在自己浅薄的知识范围之内,总是把超越自己理解能力的事物当成威胁自己立场的敌人来对待

《阿里云飞天AI加速器+Serverless容器,帮助图森未来提升资源利用率》

有些话、适合烂在心里 提交于 2020-11-28 09:32:02
简介: 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(《AI时代》),在剧中不仅顺利完成无人驾驶的行驶任务,还与围追堵截的摄像车“斗智斗勇”,在摄像车各种找拍摄角度的情况下,自动自我调整,化险为夷,避让既礼貌又安全! 图森未来(TuSimple)成立于2015年,是一家专注于L4级无人驾驶卡车技术研发与应用的人工智能企业,已经实现卡车在干线物流场景和半封闭枢纽场景下的无人干预驾驶。图森未来品牌旗下产品——图森未来 L4 级别无人驾驶卡车能够实现环境感知、定位导航、决策控制等自动驾驶核心功能,可应用于高速公路货运和港内集装箱码头运输及其相似场景。 公司于2019年9月完成总额2.15亿美元D轮融资,资方:UPS、鼎晖资本、万都中国、累计融资超过3亿美元,最新估值超过12亿美元,是卡车无人驾驶头部企业,也是全球第一家无人驾驶卡车独角兽企业。 图森未来的业务主要在美国和国内两地展开,在美国主要是高速公路干路货运场景,国内业务开始以连接枢纽场景的干线物流货运为主。 在美国,图森未来已经向包括UPS、USPS、McLane、U.S. Xpress在内的18家客户提供无人驾驶物流服务。 今年年初,图森未来的无人驾驶卡车还上了“钢铁侠”的扮演者小罗伯特·唐尼主持的科技聚集剧集《The Age of A.I.》(

利用生物视觉机制提高神经网络的对抗鲁棒性 | NeurIPS 2020

倖福魔咒の 提交于 2020-11-28 08:39:52
作者:慕苏 红色石头的个人网站: 红色石头的个人博客-机器学习、深度学习之路 ​ www.redstonewill.com 【 简介 】 本文将两种生物视觉机制,分别是视网膜的非均匀采样机制和多种不同大小的感受野存在机制,应用到神经网络中,提高了神经网络的对抗鲁棒性。 论文地址: https:// arxiv.org/abs/2006.1642 7 【 引言 】 尽管卷积神经网络在视觉识别任务上取得了卓越的表现,但它们在一些任务上仍然落后于人类的视觉系统。比如,神经网络对于微小的对抗扰动十分脆弱,而人眼对于视觉刺激上的微小扰动则非常鲁棒。近年来,有大量工作表明人工神经网络在建模大脑的腹侧视觉流上具有适用性。因此,本文提出将两种生物视觉机制应用到神经网络中,以提高神经网络的对抗鲁棒性。此外,作者通过消融实验,进一步分析了每种机制中影响神经网络鲁棒性的关键因素。 【 模型介绍 】 1. 生物视觉机制 第一种机制是视网膜对视觉刺激的非均匀空间采样机制。视网膜小凹中心的视锥细胞密度最大,从中心向四周视锥细胞密度递减。上图左侧显示了5种视网膜注视点下,视网膜空间采样的分布和效果。 第二种机制是视觉皮层V1细胞存在不同尺度的感受野机制。上图右侧显示了5种不同的视觉皮层注视点下,周围不同空间尺度的感受野区域(红色矩形框)。 2. 基于生物视觉机制设计模型 基于上述两种生物视觉机制