深度学习 | 易学教程

为什么一线互联网公司的校招高薪都是算法类，工程岗校招很难拥有高薪吗？...

阅读更多关于为什么一线互联网公司的校招高薪都是算法类，工程岗校招很难拥有高薪吗？...

点击上方“ 3D视觉工坊 ”，选择“星标” 干货第一时间送达本文整理自知乎问答，仅用于学术分享，著作权归作者所有。如有侵权，请联系后台作删文处理。观点一作者｜知乎用户 https://www.zhihu.com/question/411985480/answer/1393814925 我来给一下这个问题的正确答案: 高端工程类岗位所需要的能力，高校很难培养出来。中低端工程类岗位，可能确实不太值钱。在学校写的那两行代码，实验室那点活儿，质量如何，大家也都心知肚明。能demo交差就行，对于效率，兼容性，可维护性，基本上不管不顾。而且由于老师往往自己就不懂工程，导致没有正确的指导。再加上近几年，很多更容易上手的语言兴起比如python，毕业生的c++能力越来越糟糕，对于底层的知识也越来越少，而python在生产环境，评价就是四个字，难堪大用。工程类的毕业生进公司，往往需要从最无聊的逻辑干起，之后在处理效率或者容量的需求时，会让人慢慢进步。可以这么说，只有大公司才培养的出好的工程类人才。而算法类因为一些历史遗留问题，大公司之前懂得人不多，而学校确实有些老师是行家里手，学生也可以在某一个小领域，做到精通。这推高了前两年算法领域的校招价。然而，随着公司相关人才越来越多，算法类的稀缺性也在下降。另外，现在很多技术比较好的组也比较认清了，高端算法类毕业生已经不能靠论文数量

实时的激光雷达点云压缩

阅读更多关于实时的激光雷达点云压缩

点击上方“ 3D视觉工坊 ”，选择“星标” 干货第一时间送达论文阅读模块将分享点云处理，SLAM，三维视觉，高精地图相关的文章。 ● 论文摘要实时压缩大量的激光雷达点云对于自动驾驶汽车等自动化机器至关重要。虽然目前大多数的工作都集中在压缩单个点云帧上，但是本文提出了一个新的系统，可以有效地压缩一系列点云。利用点云帧序列中的空间和时间冗余的思想。首先在点云序列中识别关键帧，然后通过迭代平面拟合对关键帧进行空间编码。然后我们利用连续点云在物理空间中有大量重叠的事实，因此空间编码的数据可以（重新）用于对时间流进行编码。利用空间编码数据进行时间编码，不仅提高了压缩率，而且避免了冗余计算，大大提高了压缩速度。实验表明，我们的压缩系统达到了40×90的压缩率，明显高于MPEG的LiDAR点云压缩标准，同时保持了较高的端到端应用精度。同时，我们的压缩系统的压缩速度与目前激光雷达的点云生成速率相匹配，并优于现有的压缩系统，实现了实时点云传输。代码开源（有兴趣的可以测试后与我交流和分享）： https://github.com/horizon-research/Real-Time-Spatio-Temporal-LiDAR-Point-Cloud-Compression ● 内容介绍本文的压缩系统的思想是利用点云（空间）和点云（时间）之间的冗余。在空间上，现实世界中的许多曲面都是平面

阿里云ECS云服务器通用型g6和g5型号如何选择？

阅读更多关于阿里云ECS云服务器通用型g6和g5型号如何选择？

阿里云ECS云服务器通用型g6和g5的区别以及选择建议阿里云ECS云服务器通用型g6和通用型g5实例有什么区别?通用型g5和g6都是用于性能均衡场景，CPU内存比都是1:4，本文来说说通用型g6和通用型g5的区别以及选择方法：官方文档：云服务器ECS共享标准型S6实例 ECS云服务器通用型g6和通用型g5有什么区别? 顾名思义，通用型g6是通用型g5的升级版，ECS云服务器通用型g6是第六代云服务器，性能全面提升的同时价格有所下调，如何选择?云E优站长博客建议选择通用型g6实例。通用型g6云服务器是阿里云的第六代云服务器，第六代云服务器是基于第二代Intel至强可扩展处理器，睿频从上一代2.7Ghz提升到3.2Ghz，E2E计算性能有3-15%的提升;支持vnni指令集,对于深度学习的推理场景有2-4倍性能提升;虚拟化优化性能抖动，ping flood延时超过1ms的报文数<1/100万。通用型g6和通用型g5区别对比表综上，阿里云ECS云服务器通用型g6是通用型g5的升级版，性能有所提升，如何选择?新手站长网还是建议性价比放在第一位，虽然通用型g6是g5的升级版，但是通用型g5的性能也不差，如果通用型g5拥有更优惠的折扣，通用型g5也是可以选择的。来源： oschina 链接： https://my.oschina.net/u/4373067/blog/4282835

点云及三维图像处理综述

阅读更多关于点云及三维图像处理综述

点击上方“ 3D视觉工坊 ”，选择“星标” 干货第一时间送达来源：新机器视觉点云概念点云与三维图像的关系：三维图像是一种特殊的信息表达形式，其特征是表达的空间中三个维度的数据，表现形式包括：深度图（以灰度表达物体与相机的距离），几何模型（由CAD软件建立），点云模型（所有逆向工程设备都将物体采样成点云）。和二维图像相比，三维图像借助第三个维度的信息，可以实现天然的物体——背景解耦。点云数据是最为常见也是最基础的三维模型。点云模型往往由测量直接得到，每个点对应一个测量点，未经过其他处理手段，故包含了最大的信息量。这些信息隐藏在点云中需要以其他提取手段将其萃取出来，提取点云中信息的过程则为三维图像处理。点云的概念：点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点集合，在获取物体表面每个采样点的空间坐标后，得到的是点的集合，称之为“点云”（Point Cloud）。点云的获取设备：RGBD设备是获取点云的设备，比如PrimeSense公司的PrimeSensor、微软的Kinect、华硕的XTionPRO。点云的内容：根据激光测量原理得到的点云，包括三维坐标（XYZ）和激光反射强度（Intensity），强度信息与目标的表面材质、粗糙度、入射角方向，以及仪器的发射能量，激光波长有关。根据摄影测量原理得到的点云，包括三维坐标（XYZ）和颜色信息（RGB

为什么说卷积神经网络，是深度学习算法应用最成功的领域之一？

阅读更多关于为什么说卷积神经网络，是深度学习算法应用最成功的领域之一？

目前，作为深度学习的代表算法之一，卷积神经网络（Convolutional Neural Networks，CNN）在计算机视觉、分类等领域上，都取得了当前最好的效果。后来，基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类，这是CNN 给人们的一个大大的惊喜。一年后的 Master 则更是完虐了所有人类围棋高手，达到神一般的境界，人类棋手毫无胜机。可以说，卷积神经网络是深度学习算法应用最成功的领域之一。目前，CNN应用也十分广泛。例如Facebook用它进行自动的图像标签，google用它做照片检索，amazon用它做产品推荐，Pinterest用它做个性化家庭定制推送，Instagram用它搭建他们的搜索架构。那么，基于CNN最经典也是最流行的应用应当是图像处理领域。而研读卷积神经网络的经典论文，对于学习和研究卷积神经网络必不可缺。今天，给大家推荐一些资料，有论文、知识图谱。 7份经典学术论文这些论文大部分都发表在计算机视觉顶级学术会议上。这7份论文资料，100p以上的内容体量。建议收藏学习。 01 resnet 02 CNN 03 batchnorm 04 alexnet 05 visualzing 06 resnet 07 yolo4 目前， 2000+ 的看过这个论文资料的同学都顺利成为各公司算法工程师。大家扫码添即可领取

论文阅读：A New Meta-Baseline for Few-Shot Learning

阅读更多关于论文阅读：A New Meta-Baseline for Few-Shot Learning

思维导图基本概念： (1) meta-learning meta-learning即元学习，也可以称为“learning to learn”。常见的深度学习模型，目的是学习一个用于预测的数学模型。而元学习面向的不是学习的结果，而是学习的过程。其学习的不是一个直接用于预测的数学模型，而是学习“如何更快更好地学习一个数学模型”。举一个现实生活的例子。我们教小朋友读英语时，可以直接让他们模仿apple、banana的发音。但是他们很快又会遇到新的单词，例如strawberry，这是小朋友就需要重新听你的发音，才能正确地读出这个新单词。我们换一种方式，这一次我们不教每个单词的发音，而是教音标的发音。从此小朋友再遇见新单词，他们只要根据音标，就可以正确地读出这个单词。学习音标的过程，正是一个元学习的过程。在深度学习中，已经被提出的元学习模型有很多，大致上可以分类为learning good weight initializations，meta-models that generate the parameters of other models 以及learning transferable optimizers。其中MAML属于第一类。MAML学习一个好的初始化权重，从而在新任务上实现fast adaptation，即在小规模的训练样本上迅速收敛并完成fine-tune。 (2)

动手学深度学习源码 & CVPR / ECCV 2020开源代码

阅读更多关于动手学深度学习源码 & CVPR / ECCV 2020开源代码

动手学深度学习其源码分别包括Pytorch、TensorFlow、MxNet框架的代码，十分方便学习深度学习在不同框架下的实现。面向中文读者的能运行、可讨论的深度学习，它将文字、公式、图像、代码和运行结果结合在一起。全面介绍深度学习从模型构造到模型训练，以及它们在计算机视觉和自然语言处理中的应用。每一小节都是可以运行的 Jupyter 记事本你可以自由修改代码和超参数来获取及时反馈，从而积累深度学习的实战经验。公式 + 图示 + 代码我们不仅结合文字、公式和图示来阐明深度学习里常用的模型和算法，还提供代码来演示如何从零开始实现它们，并使用真实数据来提供一个交互式的学习体验。活跃社区支持你可以通过每个章节最后的链接来同社区的数千名小伙伴一起讨论学习。被用作教材或参考书北京大学复旦大学哈尔滨工业大学清华大学上海财经大学上海交通大学浙江大学中国科学技术大学 Carnegie Mellon University（美国） Emory University（美国） Gazi Üniversitesi（土耳其） Georgia Institute of Technology（美国） Habib University（巴基斯坦） Hasso-Plattner-Institut（德国） Hiroshima University（日本） Imperial College

AI研习丨专题：单图像深度学习去雨研究的最新进展文

阅读更多关于 AI研习丨专题：单图像深度学习去雨研究的最新进展文

　　摘要　　单图像去雨是图像复原的重要研究方向之一。单图像深度学习去雨方法中，全监督去雨方法模型的输入均为配对数据，因此尽管利用大量的合成配对数据取得了很好的效果，但处理真实雨图时会产生性能退化；此外无法利用真实世界中的大量无标签雨图，因此无法很好地解决真实图像去雨任务。鉴于此，基于部分或零配对数据的无监督/ 半监督去雨算法则体现出更大的优势。本文将重点围绕无监督与半监督单图像深度学习去雨研究的最新进展进行简要回顾及分析，并力图为后续的研究提供一些思路。　　关键字　　图像复原；单图像去雨；无监督去雨；半监督去雨；深度表示学习　　图像复原是利用退化过程的某些先验知识建立相应的数学模型，通过求解逆问题对原始图像进行估计进而复原被退化的图像。但在退化过程中，噪声和干扰因素同时存在，给图像的复原带来了诸多不确定性和挑战。随着深度学习研究热潮的到来，图像复原仍然是目前计算机视觉领域的重要方向，例如图像去雨、图像去雾和图像去模糊等，是诸多高层视觉任务的重要预处理步骤。雨是最常见的动态恶劣天气，因此本文重点探讨图像去雨任务。特别地，图像去雨分为静态单图像去雨和动态序列图像（即视频）去雨。和视频去雨相比，单图像去雨由于缺乏时域信息因而更具挑战性。图1 展示了部分合成的雨图像和真实的雨图像的对比，从中可见真实雨图中的雨纹信息是更加复杂的、多样化的和多方向的

Serverless 的 AI 写诗，程序员浪漫起来谁能顶得住啊！

阅读更多关于 Serverless 的 AI 写诗，程序员浪漫起来谁能顶得住啊！

古诗词是中国文化殿堂的瑰宝，记得曾经在韩国做 Exchange Student 的时候，看到他们学习我们的古诗词，有中文的还有翻译版的，自己发自内心的骄傲，甚至也会在某些时候背起一些耳熟能详的诗词。本文将会通过深度学习为我们生成一些古诗词，并将模型部署到 Serverless 架构上，实现基于 Serverless 的古诗词生成 API。项目构建古诗词生成实际上是文本生成，或者说是生成式文本。关于基于深度学习的文本生成，最入门级的读物包括 Andrej Karpathy 的博客。他使用例子生动讲解了 Char-RNN (Character based Recurrent Neural Network) 如何用于从文本数据集里学习，然后自动生成像模像样的文本。上图直观展示了 Char-RNN 的原理。以要让模型学习写出「hello」为例，Char-RNN 的输入输出层都是以字符为单位。输入「h」，应该输出「e」；输入「e」，则应该输出后续的「l」。输入层我们可以用只有一个元素为1的向量来编码不同的字符，例如，「h」被编码为「1000」、「e」被编码为「0100」，而「l」被编码为「0010」。使用 RNN 的学习目标是，可以让生成的下一个字符尽量与训练样本里的目标输出一致。在图一的例子中，根据前两个字符产生的状态和第三个输入「l」预测出的下一个字符的向量为 <0.1, 0

Python爬虫过程中验证码识别的三种解决方案

阅读更多关于 Python爬虫过程中验证码识别的三种解决方案

在Python爬虫过程中，有些网站需要验证码通过后方可进入网页，目的很简单，就是区分是人阅读访问还是机器爬虫。验证码问题看似简单，想做到准确率很高，也是一件不容易的事情。为了更好学习爬虫，后续推文中将会更多介绍爬虫问题的解决方案。本篇推文将分享三种解决验证码的方法，如果你有比较好的方案，欢迎留言区讨论交流，共同进步。 1.pytesseract 很多人学习python，不知道从何学起。很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。很多已经做案例的人，却不知道如何去学习更加高深的知识。那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！ QQ群：1097524789 pytesseract是google做的ocr库，可以识别图片中的文字，一般用在爬虫登录时验证码的识别，在安装pytesseract环境过程中会遇到各种坑的事情，如果你需要安装，可以按照如下流程去做，避免踩坑。下面以 mac为例。 1.安装方法 pip install pytesseract 2.此外，还需安装Tesseract，它是一个开源的OCR引擎，能识别100多种语言。 brew install tesseract 3.查看安装位置为 brew list tesseract /usr/local/Cellar/tesseract/4.1.1

订阅深度学习