机器学习 | 易学教程

原创 | 机器学习数学推导与代码实现30讲.pdf

阅读更多关于原创 | 机器学习数学推导与代码实现30讲.pdf

机器学习 Author：louwill Machine Learning Lab 机器学习数学推导与代码实现30讲已完成，主要包括监督学习模型、无监督学习模型、集成学习模型和概率模型四个大类29个模型和算法。现整理形成pdf版本并开提供开源下载。获取方式：扫描关注下方公众号回复机器学习即可。该系列机器学习模型的思维导图如下所示：完整版的pdf目录如下：获取方式：扫描关注下方公众号回复机器学习即可。另外本项目也会在后续时间持续改进和整理，完整版的代码会陆续在GitHub上进行更新。项目地址： https://github.com/luwill/machine-learning-code-writing 本文分享自微信公众号 - Python之禅（VTtalk）。如有侵权，请联系 support@oschina.cn 删除。本文参与“ OSC源创计划 ”，欢迎正在阅读的你也加入，一起分享。来源： oschina 链接： https://my.oschina.net/u/151730/blog/4645966

原创 | 机器学习数学推导与代码实现30讲.pdf

阅读更多关于原创 | 机器学习数学推导与代码实现30讲.pdf

机器学习 Author：louwill Machine Learning Lab 机器学习数学推导与代码实现30讲已完成，主要包括监督学习模型、无监督学习模型、集成学习模型和概率模型四个大类29个模型和算法。现整理形成pdf版本并开提供开源下载。获取方式：扫描关注下方公众号回复机器学习即可。该系列机器学习模型的思维导图如下所示：完整版的pdf目录如下：获取方式：扫描下方二维码关注公众号机器学习实验室在后台回复机器学习即可。另外本项目也会在后续时间持续改进和整理，完整版的代码会陆续在GitHub上进行更新。项目地址： https://github.com/luwill/machine-learning-code-writing 来源： oschina 链接： https://my.oschina.net/u/4343420/blog/4906484

上手PyTorch！

阅读更多关于上手PyTorch！

在机器学习领域，面对各类复杂多变的业务问题，构建灵活易调整的模型是高阶机器学习工程师必备的工作能力。然而，许多工程师还是有一个想法上的误区，以为只要掌握了一种深度学习的框架就能走遍天下了。事实上，在机器学习领域里没有任何一种框架是能够制霸整个行业的，每位机器学习工程师都必须同时掌握多种框架才能适应业务发展的需要。那么有没有一种框架是相对来说更方便好用的呢？这个问题的答案是肯定的，在这里我就要为你推荐 PyTorch了。不瞒你说， PyTorch 以它良好的扩展性和超高的实现速度，近年来已赢得了不少工程师的喜爱和赞赏。首先，PyTorch 支持 GPU，这就能够显著提升代码的运行效率。同时，相比 TensorFlow 和 Caffe，PyTorch 拥有反向自动求导技术，让你在调整自定义模型的时候不必从头开始，帮助你节省不少的开发时间。此外， PyTorch 的代码还比 TensorFlow 的代码更加简洁直观、友好易懂，堪称是非常优质的学习案例，这也能帮助许多工程师更深度地理解机器学习。说到这里，不得不推荐极客时间 PyTorch 的小课了，众微科技 AI Lab 负责人王然手把手教你上手 PyTorch。现在还有少量免费学习的名额哦！王然手把手教你上手 PyTorch 众微科技 AI Lab 负责人、阿姆斯特丹大学数学和计量经济学双硕士--王然，将

2012到2020主要的CNN架构总结

阅读更多关于 2012到2020主要的CNN架构总结

来源：DeepHub IMBA 本文约1600字，建议阅读5分钟本文与你讨论每个机器学习工程师都应该知道的十大CNN架构。卷积神经网络（CNN或ConvNet）是理解图像内容的最佳学习算法之一，并且在图像分割，分类，检测和检索相关任务中表现出出色。有许多公司，例如Google，Microsoft，AT＆T，NEC和Facebook，已经建立了活跃的研究小组来探索CNN的新架构。什么是CNN？ CNN被设计用于图像识别任务，最初是用于手写数字识别的挑战（Fukushima 1980，LeCun 1989）。CNN的基本设计目标是创建一个网络，其中网络早期层的神经元将提取局部视觉特征，而后期层的神经元将这些特征组合起来以形成高阶特征。在几乎每个CNN中，您都会看到三种主要的图层类型。卷积层卷积层由一组过滤器（也称为内核）组成，这些过滤器在输入数据上滑动。每个内核都有一个宽度，一个高度和一个宽度×高度权重，用于从输入数据中提取特征。在训练时，内核中的权重使用随机值进行初始化，并将根据训练集进行学习。池化层池化层（或下采样层）用于减少特征图的维数，从而从特征图中保存最相关的信息。在池化层中，过滤器会在输入数据上滑动并应用池化操作（最大，最小，平均）。最大池是文献中使用最多的。全连接层是由三种类型的层组成的多层感知器：输入层，隐藏层和输出层。输入层接收CNN生成的要素

ML.NET 推荐引擎中一类矩阵因子分解的缺陷

阅读更多关于 ML.NET 推荐引擎中一类矩阵因子分解的缺陷

ML.NET 作为 .NET 跨平台的机器学习套件，在回归、预测、分类甚至是图像识别、异常检测都展现出简洁快速的优势，以往的文章已介绍过不再赘述。其实机器学习场景中还有一类非常常见的，就是推荐，特别是在线购物、文娱产品为了提升用户体验，一个比较好的主意就是让用户优先看到他需要的物品、内容，甚至提供用户意料之外又情理之中的产商品。推荐算法正好能够通过数据实现这一目标。如上图所示，如果我们有用户、商品的购买关系，并且还有用户的评级、评分、评价内容，那么矩阵因子分解算法非常适用。如果我们还能获取到商品本身的一些属性，比如名称、分类、简介、价格的话，那么场感知分解机算法就能发挥特别好的作用。当然，推荐算法比较难的就是冷启动阶段，可能什么数据都没有，初始阶段没有更多选择，那么也只能从相似用户消费记录入手做推荐了，获取用户与购买商品编号的对应关系也算是容易的，此时用得比较多的是一类矩阵因子分解算法。仍然举一个例子，刚刚营业的某书店，基于借阅书的记录，我们给借了《三国志》的读者小强推荐同样借过这本书的小王借看的其他书，可能不一定是名著，不过没关系，这足够达到推荐的效果，因为算法背后的逻辑是相信他们总有其他书是都喜欢看的。了解到前面的背景知识后，回头我们再看看 ML.NET 的推荐引擎，它同时支持矩阵因子分解和场感知分解算法，官网文档在《教程：使用矩阵因子分解和 ML.NET 生成影片推荐系统

如何提高PyTorch“炼丹”速度？这位小哥总结了17种方法，可直接上手更改的那种

阅读更多关于如何提高PyTorch“炼丹”速度？这位小哥总结了17种方法，可直接上手更改的那种

转载自量子位杨净发自凹非寺量子位报道 | 公众号 QbitAI 原文链接：如何提高PyTorch“炼丹”速度？这位小哥总结了17种方法，可直接上手更改的那种注：文末附【Pytorch】交流群，最近赶ACL，比较忙，很多同学加了没有回过期了，可以重新加一下，备注好的一定会回复，敬请谅解。如何提升PyTorch“炼丹”速度？最近，有一位名叫Lorenz Kuhn的小哥，分享了他在炼丹过程中总结的 17种投入最低、效果最好的提升训练速度的方法，而且基本上都可以直接在PyTorch中进行更改，无需引入额外的库。不过需要注意的是，这些方法都是假设是在GPU上训练模型。这一分享在Reddit上得到了 600 的热度。接下来，我们便从提速高低开始，依次对这些方法来做介绍。 1、选择合适的学习率时间表。选择的学习率时间表对收敛速度以及模型的泛化性能有很大影响。 Leslie Smith提出的周期性学习速率（CLR)以及 1cycle 策略可以令复杂模型的训练迅速完成。比如在 cifar10 上训练 resnet-56 时，通过使用 1cycle，迭代次数可以减少10倍，得到与原论文相同的精度。在最好的情况下，与传统的相比，这个时间表实现了大规模的提速。不过有一个缺点，它们引入了一些额外的超参数。为什么这样做有效？一种可能的解释是

科技爱好者周刊（第 141 期）：封闭系统的胜利

阅读更多关于科技爱好者周刊（第 141 期）：封闭系统的胜利

这里记录每周值得分享的科技内容，周五发布。本杂志开源（GitHub: ruanyf/weekly ），欢迎提交 issue，投稿或推荐科技内容。周刊讨论区的帖子《谁在招人？》，提供大量程序员就业信息，欢迎访问或发布工作/实习岗位。封面图 2020年7月21日，SpaceX 公司的 Falcon 9 重型火箭即将发射。NEOWISE 彗星就在它的上方，划过浩瀚宇宙。很多网站评选这张照片为太空探索年度照片。（ via ）本周话题：封闭系统的胜利去年的一件大事，苹果公司发布 M1 芯片。它的表现好得惊人，比原先英特尔的芯片更快、更省电、还更便宜。为什么 M1 芯片的表现这么好？一个原因是，它其实不能算作 CPU，而是一个单片系统（System on a Chip，简称 SoC），里面集成了中央处理器 CPU、图形处理器 GPU、机器学习芯片 NPU、安全芯片等等。当代芯片的制造技术已经发展到不可思议的程度，海量的晶体管可以做进一块指甲盖大小的硅片。以前，不同的电路需要由不同的芯片提供，现在可以集成为一块芯片。正是由于这么多组件做在一起，苹果才有办法，最大限度地优化电路，提高协同能力，节省电力。再加上，操作系统也是自家的，可以配合着修改底层，所以性能才能提高这么多。我问大家一个问题，如果 M1 大获成功，其他公司会怎么反应？答案很简单，别的公司不得不跟进

苹果 M1 芯片预示着 RISC-V 完全替代 ARM？

阅读更多关于苹果 M1 芯片预示着 RISC-V 完全替代 ARM？

来源 | CSDN（ID：CSDNnews）作者 | Erik Engheim 已获作者翻译授权译者 | 弯月责编 | 张文编者按：M1 芯片性能强劲的背后主要源自两个因素：第一，M1芯片使用了大量的解码器和乱序执行；第二，就是异构计算。本文着重讲解第二点。在大家了解了 M1 芯片表现之后，你肯定想一探究竟其底层核心是什么，本文将从异构计算开始讲起。苹果非常热衷于添加多个专用硬件单元的策略，在本文中，我将其称为协处理器（coprocessor）：图形处理单元（GPU），用于图形处理以及其他需要并行处理大量数据的任务（即同时对多个元素执行相同的操作）。神经引擎，机器学习的专用硬件。图像处理的数字信号处理硬件。硬件中的视频编码。苹果没有在解决方案中添加更多的通用处理器，而是添加了更多的协处理器。你可以称之为加速器。这种趋势并不是新出现的，我从 1985 年开始使用的老式 Amiga 1000 就使用协处理器来加快音频和图形处理的速度。现代 GPU 本质上就是协处理器。Google 的 Tensor 处理单元也是一种用于机器学习的协处理器。图：Google TPU是专用集成电路（ASIC），我们称之为协处理器。 01 什么是协处理器？与 CPU 不同，协处理器不能单独存在。只使用协处理器无法造出计算机。协处理器作为专用处理器，可以很好地完成某些特定的任务

终端安全-设备指纹篇

阅读更多关于终端安全-设备指纹篇

设备指纹是什么？作用是什么？特性是什么？有哪些相关技术呢？好，带着这些问题，我们一一来解答。什么是设备指纹设备指纹或者设备ID，表现形式是一串符号，映射现实中的一台设备，如果这种映射关系是唯一的，那么就称为唯一设备ID：Unique Device Identifie. 设备指纹的作用设备ID既然可以作为衡量某一设备的标准，那么在网络世界中就可以当作一个网络标识用来统计该标识对应的行为，同样有些网络应用的广告推送也需要凭借设备ID找出哪些唯一客户，再则有应用有收益的地方就有风险，所以又可以结合设备ID来做风险管控。具体可以分为三类： 1）统计需求 2）业务需求 3）风控需求设备指纹涉及到的技术知道了什么是设备指纹，那么怎么得到设备指纹是一项技术；如何应用设备指纹又是另外一项技术。这里我们讨论如何得到设备指纹的技术。设备指纹数据的采集方案通常设备指纹的采集方式分为三种：主动式- 主动采集设备N多信息，比如UA、MAC地址、设备IMEI号、广告追踪ID等与客户端上生成唯一的device_id。局限性有：不同生态的平台对用户隐私数据开放权限不同，很难统一生成唯一识别码，且无法实现Web和App跨域统一。主动式设备指纹另一个局限性，由于强依赖客户端代码，这种方式生成的指纹在反欺诈的场景中对抗性较弱。被动式-被动式设备指纹技术在终端设备与服务器通信的过程中

AI火爆干货最全整理！五套深度学习和算法学习教程和三套Python学习视频！！！限时无套路免费领取！

阅读更多关于 AI火爆干货最全整理！五套深度学习和算法学习教程和三套Python学习视频！！！限时无套路免费领取！

点击蓝色“ AI专栏 ”关注我哟选择“ 星标 ”，重磅干货，第一时间送达这是站长第 31 期免费送丰富宝贵的干货资源与教程本期绝对是满满的干货！获取更多资源请关注【AI专栏】先上车pa 01 PART 五套深度学习算法教程！作为AI 初学者来说，最大的问题就是：资料太多！！！看不完！！！不知道如何取舍！！！人的精力有限！！！因此，本次站长就为各位站友把高效有用的入门和进阶学习材料整理好了，并限时无套路免费送给各位站友！！！ AI学习不仅仅在于模型掌握了多少，更多的在于你的算法分析和设计能力、工程实践能力、算法模型的优化能力。 5本享誉全球的AI好书和项目免费送给大家！！！机器学习基础《机器学习基础》来了，一书吃透机器学习！先总体来看，这本书分为17个章节：从每一个章节的设置可以看出这份教材设置的非常细致，将机器学习中的基础概念拆分开来讲，想深入了解吃透深度学习的基础，按这个目录来学也是个不错的选择。【AI专栏】只做干货！！！在这里没有任何套路！你只需要长按下方二维码回复【 2020 】加站长微信即可立即获取五套深度学习和算法学习教程和三套Python学习视频！！！现在关注他，还有机会添加他的个人微信号，进行一对一的交流，坑位有限(微信号有 5000 人的限制)，大家抓紧吧！ PyTorch官方教程中文版

订阅机器学习