TAU

6D姿态估计从0单排——看论文的小鸡篇——Multimodal Templates for Real-Time Detection of Texture-less Objects in Heav...

有些话、适合烂在心里 提交于 2020-05-01 01:33:11
####Multimodal Templates for Real-Time Detection of Texture-less Objects in Heavily Cluttered Scenes ####6D姿态估计里面的linemod方法的来源,作者也是慕尼黑工业大学的大牛。 基于linemod For such time-critical applications, template matching is an attractive solution because new objects can be easily learned online; more particularly to , which consider only images and their gradients to detect objects. As such, they work even when the objects is not textured enough to use feature point techniques. Similarity Measure reference images ${O_m} {m\in M}$, object from a set $M$ of modalities. A template $\tau = ({O_m} {m\in M}, P)$

6D姿态估计从0单排——看论文的小鸡篇——Learning 6D Object Pose Estimation using 3D Object Coordinates

淺唱寂寞╮ 提交于 2020-04-30 22:03:54
这篇文章内容是真的多,而且大段的文字,图和公式都很少,看起来很枯燥。。。说白了就是把整个模型拆成5 5 5的125个部分,这样一个像素点都扔进去随机森林里面训练和匹配,然后查出来他最可能的类别和在一个模型中位置。就一如他的开头这句话:The key new concept is a representation in form of a dense 3D object coordinate labelling paired with a dense class labelling.(关键的新概念就是将一个稠密的3D模型坐标标记搭配稠密的类别标记组建而成的表达方式) 使用LHCF(Latent-Class Hough Forests):拆分模型成多个patch、用patch去匹配,并且使用random forest加速匹配速度,从而更快地找到对应的位置 The key new concept is a representation in form of a dense 3D object coordinate labelling paired with a dense class labelling. template-based techniques have in our view two fundamental shortcomings. Firstly, they match

总结《精通数据科学》机器学习思想,常见误区,二元分类问题

天大地大妈咪最大 提交于 2020-04-29 18:00:17
1. 看待机器学习问题的两个角度 2.假设检验的思路 3.模型陷阱与模型幻觉 4.二元分类的原理 5.ROC与AUC曲线 1. 看待机器学习问题的两个角度 在看待一个数据问题时,我们需要从两个角度去看待问题,一是从机器学习角度去看待问题,另一个就是从概率的角度看待问题,这样我觉得可以解释很多初学者在学习机器学习是会感到混乱的地方。 从机器学习的角度来看,主要有以下步骤:   1.确定场景类型。也就是说判断我们的输入输出。通常输入便是我们的实例,输出是我们的label。   2. 定义损失函数。也就是我们说的目标函数[1],我们看待一个模型,我们一定要有一个评价指标,这个评价指标便是我们的损失函数,我们可以通过损失函数让我们的模型认识到什么是正确的,什么是错误的。   3.提取特征。这也是非常重要的一步,我们知道,如果我们的数据量非常多,维数爆炸,便会带来计算量过大,扰动太多,编程难度过大,最终模型性能不佳等问题,因此,进行数据预处理--提取特征便是解决这一问题的关键。通过提取特征,可以做到优化数据结构,减小数据量,提高模型性能。   4. 确定模型的形式,同时估计参数。要求我们先预估这个问题的大致模型,利用损失函数最小化确定我们的模型的各个参数。   5. 评估模型效果,我们生成模型后我们需要通过测试集来判断我们的模型的效果,才能检验我们的模型是否为一个好的模型。

Contrastive Multiview Coding(多视角的对比学习编码)

半城伤御伤魂 提交于 2020-04-23 05:56:31
原文题目为:Contrastive Multiview Coding 代码链接: https://github.com/HobbitLong/CMC 引言 本文主要提出了Multiview 的contrastive learning。motivation是现实世界中看待同一个物体具有多个视角,每一个视角都是有噪声和不完整的,但是一些对于该物体很重要的元素,例如physics(物理), geometry(几何), and semantics(语义)通常是在多个视角间共享的,举个例子:(一只狗可以被看到(seen),听到(heard),摸到(felt)),所以作者认为一个powerful representation建模了多个视角下都不变的元素。 基于这个假设,作者提出了多视角下进行contrastive learning来获得multi-view representation,通过contrastive learning,实际上等同于最大化互信息在多个view之间,即让多个view之间最大化共享的信息。 如上图所示,对于第 i i i 个样本,4个 不同视角的representation在朝着嵌入空间中靠近优化,而对于另一个 j j j 样本,嵌入空间朝着远离的方向优化。最终的结果是每个样本簇不同分离开来,每个样本簇包含4个不同视角的嵌入representation

深度学习归一化:BN、GN与FRN

南笙酒味 提交于 2020-03-25 09:46:34
3 月,跳不动了?>>> 在深度学习中,使用归一化层成为了很多网络的标配。最近,研究了不同的归一化层,如BN,GN和FRN。接下来,介绍一下这三种归一化算法。 BN层 BN层是由谷歌提出的,其相关论文为《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》,即Inception v2的主要思想。大家也可以看回 我以前的博客 ,关于这个BN层的介绍。 BN层的提出,主要解决的一个问题是Internal Covariate Shift。在BN层提出以前,是很难训练一个深层次的网络的,其主要难点是每层的数据分布均会发生变化,使得神经元需要去学习新的分布,导致模型训练缓慢、难以收敛。因此,作者借助了白化的思想,将每层数据都归一化成均值为0、方差为1的分布,如公式(1)所示,即减去均值、除以方差。这样就能是每层的数据分布不会发生过大变化,从而导致模型容易训练。 $$\hat{x}^{(k)}=\frac{x^{(k)}-E[x^{(k)}]}{\sqrt{Var(x^{(k)})}} \tag{1}$$ 但同时也引入了一个问题,我们将数据强行的归一化,会导致原始的数据分布遭到破坏,特征的表达能力就会下降。所以,BN层的核心亮点是 重构变换

PART 1/“物网(物联网)”的差异化需求

微笑、不失礼 提交于 2020-03-05 14:25:11
一直以来,人们通过相应的终端(电脑、手机、平板等)使用网络服务,“个人”一直是网络的用户主体。个人对网络质量的要求“高”且“统一”:玩网络游戏必需要低时延,下载文件或看网络视频则期望高带宽,通话需要声音清晰,而接收的短信绝不能有遗漏。 对于移动 通信网络 ,运营商们尽可能地维系着低时延、高带宽、广覆盖、随取随用的网络特性,以保证良好的用户体验,以及营造出丰富多姿的移动应用生态。 对于个人通信业务,虽然用户的要求很高,但整体上对网络质量的需求是一致的,运营商只需要建立一套网络质量标准体系来建设、优化网络,就能满足大多数人对连接的需要。 随着网络中用户终端(手机、PAD等)数量的增长逐渐趋缓, M2M 应用成为了运营商网络业务的增长发力点,大量的M2M应用终端则成为了网络的用户。M2M应用终端(传感设备、智能终端),本质上就是物联网终端,它们通过装配无线通信模组和SIM卡,连接到运营商网络,从而构建出各类集中化、数字化的行业应用。 不同于个人通信业务,在物联网终端构建的行业应用中,各领域应用对信息采集、传递、计算的质量要求差异很大;系统和终端部署的环境也各不相同,特别是千差万别的工业环境;此外,企业在构建应用时,还需要考量技术限制(供电问题、终端体积等)和成本控制(包括建设成本和运营成本)。因此,千姿百态的行业应用具有“个性化”的一面,使得连接的需求朝着多样性的方向发展。 1