深度学习

【译】十款性能最佳的压缩算法

我的未来我决定 提交于 2020-08-13 16:37:06
数据压缩是保留相同或绝大部分数据前提下减小文件大小的过程。 它的原理是消除不必要的数据或以更高效的格式重新组织数据。在进行数据压缩时,你可以选择使用有损方法或无损方法。有损方法会永久性地擦除掉一些数据,而无损方法则能保证持有全部的数据。使用哪类方法取决于你要让你的文件保持多大的精准度。 本文会为你介绍6种不同的无损数据压缩算法,以及4种基于深度学习的图像/视频压缩算法。 6款无损数据压缩算法 无损压缩算法通常被用于归档或其他高保真目的。这些算法能够让你在确保文件可被完整恢复的同时减少文件大小。有很多种无损压缩算法供你选择。下面介绍6种常用的算法: 1. LZ77 LZ77算法发布于1977年。作为很多其他无损压缩算法的基础,它使用了“滑动窗口”的概念。在这个概念中,LZ77管理了一个字典。该字典使用三元组的方式: 偏移量(Offset):短语起始处于文件开头之间的距离 行程长度(Run length):组成短语的字符数 偏离字符:表明新短语的标记符,匹配结束后,前向缓冲区中的第一个符号 当文件被解析时,字典会被实时更新以反映最新的压缩数据和大小。举个例子,如果一个文件包含字符串"abbadabba",那么被压缩到字典中的项就是"abb(0,1,'d')(0,3,'a')"。你可以看下下表的拆解过程: 这个例子中,被压缩后的数据并不比初始数据小多少。但一般情况下,当文件很长时

22课时、19大主题,CS 231n进阶版课程视频上线

不问归期 提交于 2020-08-13 16:20:47
讲 CS231n 的 Justin Johnson 在密歇根大学推出了一套计算机视觉的进阶课程。 机器之心报道,编辑:小舟、杜伟。 计算机视觉在日常生活中已经无处不在。从搜索引擎、图像理解、地图、医疗、无人机、自动驾驶到各类手机 app,都离不开计算机视觉。这些应用中有许多像图像分类和目标检测这样的视觉识别任务,而神经网络方面的进展大大提高了视觉识别系统的性能。 来自密歇根大学的 Justin Johnson 在 2019 年秋季推出了一套新的课程,该课程深入探讨了基于神经网络的计算机视觉深度学习方法的细节。这一课程近日已在 YouTube 上开放 。 课程视频链接: https://www. youtube.com/playlist? list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r 课程概况 这套 2019 年秋季的计算机视觉课程名为「Deep Learning for Computer Vision」,课程讲授者是来自密歇根大学的 Justin Johnson。作为斯坦福大学李飞飞教授的学生,Justin Johnson 曾和李飞飞一起讲授斯坦福大学计算机视觉经典课程 CS231n。 Justin Johnson,图源:https://web.eecs.umich.edu/~justincj/。 目前, Justin Johnson

矩池云 | 利用LSTM框架实时预测比特币价格

我的梦境 提交于 2020-08-13 15:46:14
温馨提示:本案例只作为学习研究用途,不构成投资建议。 比特币的价格数据是基于时间序列的,因此比特币的价格预测大多采用LSTM模型来实现。 长期短期记忆(LSTM)是一种特别适用于时间序列数据(或具有时间 / 空间 / 结构顺序的数据,例如电影、句子等)的深度学习模型,是预测加密货币的价格走向的理想模型。 本文主要写了通过LSTM进行数据拟合,从而预测比特币的未来价格。 import需要使用的库 import pandas as pd import numpy as np from sklearn.preprocessing import MinMaxScaler, LabelEncoder from keras.models import Sequential from keras.layers import LSTM, Dense, Dropout from matplotlib import pyplot as plt %matplotlib inline 数据分析 数据加载 读取BTC的日交易数据 data = pd.read_csv(filepath_or_buffer="btc_data_day") 查看数据可得,现在的数据一共有1380条,数据由Date、Open、High、Low、Close、Volume(BTC)、Volume(Currency)、Weighted

DEMO: 一种单目视觉里程计的深度增强方法

混江龙づ霸主 提交于 2020-08-13 14:08:37
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者:robot L | 来源:知乎 https://zhuanlan.zhihu.com/p/149349921 本文仅做学术分享,如有侵权,请联系删除。 主要内容 从粗到精的相机自运动估计流程:基于相邻两帧之间的约束进行帧帧位姿估计(相机频率),优化当前帧位姿,得到粗糙的位姿估计;在滑动窗内执行BA,利用窗口内所有约束优化窗口内所有帧的位姿(0.25-1Hz),得到准确的位姿估计。最后融合上述两种估计得到相机频率的准确位姿估计。 亮点 分别使用 稀疏LiDAR点云/深度图片 和 三角化 获得特征点的深度 。 对于 有深度 和 无深度 的特征点,构建两种不同约束共同用于位姿优化。 J. Zhang, M. Kaess, S. Singh. Real-time Depth Enhanced Monocular Odometry . IEEE/RSJ International Conference on Intelligent Robots and Systems , 4973-4980, 2014. J. Zhang, M. Kaess, S. Singh. A real-time method for depth enhanced visual odometry. Autonomous Robots , 41(1),

学术分享丨轮式移动操作机器人研究概览

偶尔善良 提交于 2020-08-13 13:44:31
  随着学会的队伍不断发展壮大,分支机构的发展愈发完善,丰富多彩的分支活动与学术分享也频频呈现。疫情期间,CAAI认知系统与信息处理专委会积极倡导学会“疫情防控不放松,学习充电不间断”的理念,邀请年轻学者结合本专委会自身领域研究精选相关文献进行研究与再解读,与大家分享《轮式移动操作机器人研究概览》。   2020年初突如其来的新冠疫情给全世界人民带来了沉重的伤害,病毒强大的传染性,时刻威胁着人类生命的安全。具有操作功能的可移动平台可有效协助和替代医务人员在传染病房的部分工作,最大限度的降低病毒的传播和保护健康医务人员。根据当前移动操作机器人的研究,其主要由移动底盘和操作机械臂组成,其中移动底盘又分为轮式、腿式、履带式和轮腿复合式,而轮式移动底盘以其结构简单,容易控制,可扩展性强、移动灵活等特点,得到广泛应用。随着定位导航、深度学习的深入研究,使搭载机械臂的移动机器人完成类人的操作成为可能,全球的研究人员对此进行了广泛研究并在室内室外坏境中进行了大量实验验证,下面就近几年的基于轮式移动底盘的移动操作机器人研究概览如下。   Cosero[1]是德国波恩大学的Sven Behnke团队根据家庭环境中的日常操作任务而研制的一款仿人操作机器人(如图1(a)(b))。机器人底部配备了四轮独立转向行走机构,以便在灵活的通过狭窄通道,上部配备了两个7自由度机械臂已完成拟人的操作

又双叒来,谷歌网络嵌入函数新专利惹争议,网友:何时申请线性回归

∥☆過路亽.° 提交于 2020-08-13 13:39:45
  机器之心报道    参与:蛋酱、张倩    最近,谷歌又申请了一项深度学习算法专利,主题是「Using embedding functions with a deep network」。      对于每个深度学习研究者来说,有些算法、方法可以说是研究必备,拿来直接用也是一种日常,但如果有人申请了专利呢?   最近,谷歌一项新的 AI 专利申请再次引燃了社区对于专利问题的讨论。   该专利的摘要描述如下:    本专利适用于在深度网络中使用嵌入函数(embedding functions)的方法、系统和设备,包括在计算机存储媒介上编码的计算机程序。其中一种方法包括接收包含多个特征的输入,其中每个特征具有不同的特征类型;使用各自的嵌入函数处理每个特征以生成一个或多个数值,其中每个嵌入函数独立地运算彼此的嵌入函数,并且每个嵌入函数用于各自特征类型的特征;使用深度网络处理数值以生成输入的第一个替代表征,其中深度网络是由多个层次的非线性运算组成的机器学习模型;使用 logistic 回归分类器处理输入的第一个替代表征,以预测输入的标签。   专利界面:https://patents.google.com/patent/US10679124B1/en   这项专利的保护范围是怎样的呢?我们来看一下申请书的「权利要求(claims)」部分:    一种由一个或多个计算机执行的方法

第九期直播|《深度相机与应用》精彩回顾

浪尽此生 提交于 2020-08-13 13:06:00
点击 上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 大家好,本公众号现已开启线上视频公开课,主讲人通过B站直播间( bilibili号:3D视觉工坊 ),对3D视觉领域相关知识点进行讲解,欢迎大家的关注。 往期精彩: 第一期:东北大学李奇 《 基于深度学习的物体抓取位置估计 》 第二期:上海交通大学沈毅君 《相机标定的基本原理与经验分享》 第三期:西安交通大学潘浩洋 《 基于点云的三维物体表示与生成模型 》 第四期:北京科技大学李阳阳《 求职经验分享 》 第五期:ChaucerG《 聊聊目标检测和秋招那些事 》 第六期:镭神智能创始人雷祖芳《 基于激光雷达的感知、定位导航应用 》 第七期:东北大学龚益群《 图像对齐算法 》 第八期:武汉大学李迎松《 立体视觉之立体匹配与实战 》 本期由北京中科慧眼CTO崔峰分享,主题为《深度相机与应用》,下面我们来一起回顾一下吧。 视频观看地址: 视频还在上传审核中,请关注工坊君官方bilibili账号:3D视觉工坊:https://space.bilibili.com/483478083,上传成功后便可观看哦~ PPT回顾: PDF获取方式 关注公众号【3D视觉工坊】,并在后台回复“深度相机”获取百度云链接。 本文仅做学术分享,如有侵权,请联系删文。 下载1 在「 3D视觉工坊 」公众号后台回复: 3D视觉 , 即可下载

图像特征点、投影变换与图像拼接

六眼飞鱼酱① 提交于 2020-08-13 13:05:42
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 一、全景拍照中的投影变换 在32. 镜头、曝光,以及对焦(下)中,我给你介绍了各种各样的相机镜头,也介绍了视场角(FOV)这个概念。现在咱 图像特征点、投影变换与图像拼接 们手机上的主摄像头一般FOV是七、八十度左右,有的更小一些。但人类的视觉系统FOV可以达到 。 广角镜头、鱼眼镜头能够让你拍摄出非常大FOV的图像。但它们非常昂贵,而且具有强烈的畸变。 全景拼接这个功能也能够让你拍摄出很大FOV的图像,你很可能已经使用过这个功能了,它甚至可以拍摄出水平FOV达到360o的图像。我们可以比较下。这样拍摄出来的图像比起鱼眼镜头的畸变小很多。 人类的视角范围200 x 135° 全景拼接图像视角范围360x180° 全景拼接是通过先拍摄不同视角的多张图像,然后将它们拼接而成的: 那么,像下面这样几个视角拍摄的图像,我们是不是直接拼接平移这些图像然后拼接就可以了呢? 多个视角拍摄的图像 很显然,不管我们是把左边的图像摆在上面,还是把右边的图像摆在上面,都会观察到“对不齐”的现象(看看中间栏杆的断裂缝): 仅仅平移图像拼接时会对不齐 那应该怎么办呢?这时候就要用到我在28. 图像扭曲中介绍的图像的Warping技术。适当的Warp图像然后再做拼接,能够使得我们得到完美的全景图像: Warping是一种改变图像像素位置的技术

字节跳动AI掌门人马维英突发离职,加入清华从事人才及科研工作

安稳与你 提交于 2020-08-13 12:12:55
      大数据文摘出品   清华又迎来产业大咖。   7月28日,清华和字节跳动双方确认,字节跳动副总裁、人工智能实验室主任马维英离职,下一站将 赴清华大学智能产业研究院任职 ,从事人才培养工作,加入正在筹备该产业院的原百度总裁,同时也是他在微软亚洲研究院的老同事 张亚勤团队 。   清华大学计算机系教授马少平在微博上表达了欢迎。      字节跳动对此称:“根据自己的兴趣,马维英选择到清华大学从事人才培养和科研相关工作,他同时还会 继续担任字节跳动技术顾问 。”    从微软亚研院到字节跳动   马维英此前为 微软亚洲研究院常务副院长 ,于2017年2月离职微软,加入字节跳动,出任 副总裁 ,管理 人工智能实验室 ,是字节跳动智能化的背后推手。   但在学术圈,马维英博士也是华人圈首屈一指的人工智能人才。   马维英博士于1990年本科毕业于台湾清华大学电气工程系,之后于1994年和1997年分别获得美国加州大学圣芭芭拉分校(UCSB)电气和计算机工程系硕士和博士学位。1997年开始一直在美国惠普实验室从事多媒体自适应传输和移动因特网的分布式多媒体服务系统的研究。2001年加入微软亚洲研究院。攻读博士学位期间, 马维英博士负责开发的互联网图像检索系统Netra被认为是最具代表性的图像检索系统之一 。迄今为止,马维英博士已经在互联网搜索、信息检索、数据挖掘

人工智能真的有那么神秘么,推荐一份机器学习入门书单搞定它!

﹥>﹥吖頭↗ 提交于 2020-08-13 11:50:30
​ 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径。 2020年,似乎没有哪一个方向能比机器学习还要火热了,即使我们不打算从事算法方向,了解一点机器学习的基础知识也不是什么坏事,这一份书单,将带你入门基础的机器学习知识。 机器学习系列书单 ​ 图解机器学习   《图解机器学习》用丰富的图示,从ZUI小二乘法出发,对基于ZUI小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。 作者简介   杉山将,1974年生于大阪。东京工业大学计算机工程学博士毕业,现为东京大学教授、日本国立信息学研究所客座教授。主要从事机器学习的理论研究和算法开发,以及在信号和图像处理等方面的应用。2011年获日本信息处理学会长尾真纪念特别奖。著有《统计机器学习》、DensityRatioEstimationinMachineLearning等