无监督学习 | 易学教程

人工智能和机器学习之间的差异及其重要性，一定要分清楚

阅读更多关于人工智能和机器学习之间的差异及其重要性，一定要分清楚

简介：如果你对人工智能和机器学习这两个词的含义、用途和优势感到困惑的人之一，下面我们将分享人工智能和机器学习之间的关键区别。人工智能和机器学习技术正在彻底改变世界，使世界更加先进，但有些人对这两个术语的真正含义感到困惑。有时，在其他情况下它们用作同义词；它们被用作独立或并行的进展。但是，如果你想以有效和有用的方式使用这两者，必须找到两者之间的区别。如果你也是对这两个词的含义、用途和优势感到困惑的人之一，下面我们将分享人工智能和机器学习之间的关键区别。我们来看一下：什么是机器学习? 它是人工智能的一个分支，通过研究计算机算法，让计算机程序通过经验自动改进。例如，如果你向任何机器学习模型提供你喜欢的歌曲列表，以及诸如舞蹈，乐器或节奏等音频静态信息，它将自动执行并生成推荐系统，向你推荐你将来喜欢的 druckkings mobile 的音乐。这种类型的机器学习称为监督学习，其算法能够对目标预测输出和输入特征之间的关系和依赖关系进行建模，我们可以通过这些关系预测新数据的输出值。机器学习的另一种类型是无监督学习，这是用于模式检测和描述建模的一系列机器学习算法。什么是人工智能? 除了机器学习之外，人工智能是完全广泛的，而且范围也有所不同。您可以使用“Artificial”一词来理解，它指的是人为的东西，即非自然的事物，而“Intelligence”指的是理解和思考的能力

178页，四年图神经网络研究精华，图卷积网络作者Thomas Kipf博士论文公布

阅读更多关于 178页，四年图神经网络研究精华，图卷积网络作者Thomas Kipf博士论文公布

对于普通人来说，将自己的学位论文公布到社交媒体可能需要点勇气。但如果实力够硬，多少人检阅都是不怕的。最近，图卷积网络（GCN）的作者 Thomas Kipf 就公开了自己的博士论文，主题是「使用图结构表示的深度学习」，涵盖从图神经网络到结构发现等一系列深度学习热门话题，是他过去几年图神经网络方向研究的深度汇总。机器之心报道，机器之心编辑部。在深度学习领域，图神经网络早已成为热门话题。去年年底，有人统计了 2019 年到 2020 年各大顶会提交论文关键词的数据。结果显示，「graph neural network”」的增长速度位列榜首，成为上升最快的话题。在图神经网络出现之前，尽管深度学习已经在欧几里得数据中取得了很大的成功，但从非欧几里得域生成的数据已经得到了更广泛的应用，它们也需要有效的分析。例如，在电子商务领域，基于图的学习系统能够利用用户和产品之间的交互来实现高度精准的推荐；在化学领域，分子被建模为图，新药研发需要测定其生物活性等等。广阔的应用前景吸引了大批研究者投身图神经网络的研究，图卷积网络就是其中的一个方向。对于这个方向的研究者来说，Thomas Kipf 的名字应该并不陌生，他 2016 年发表的论文《Semi-Supervised Classification with Graph Convolutional Networks》被引量已超过 3400 次

仅需少量视频观看数据，即可精准推断用户习惯：腾讯、谷歌、中科大团队提出迁移学习架构PeterRec

阅读更多关于仅需少量视频观看数据，即可精准推断用户习惯：腾讯、谷歌、中科大团队提出迁移学习架构PeterRec

仅从一个人的抖音、快手、腾讯视频的观看记录里，我们能发现什么？近日，腾讯看点研发团队、Google London 和中科大的研究工作首次证实，仅依靠用户视频新闻观看记录，就可以精确地推测出用户的各种个人信息信息，包括但不限于用户年龄段、性别、喜好、人生状况（例如单身/已婚/怀孕等）、职业、学历等信息，甚至是否有心理抑郁暴力倾向。目前，这篇论文已经被信息检索领域顶级国际会议 SIGIR 接受为长文章。机器之心发布，机器之心编辑部。推导迁移学习对计算机视觉和 NLP 领域产生了重大影响，但尚未在推荐系统广泛使用。虽然大量的研究根据建模的用户-物品交互序列生成推荐，但很少有研究尝试表征和迁移这些模型从而用于下游任务（数据样本通常非常有限）。在本文中，研究者深入研究了通过学习单一用户表征各种不同的下游任务，包括跨域推荐和用户画像预测。优化一个大型预训练网络并将其适配到下游任务是解决此类问题的有效方法。但是，微调通常要重新训练整个网络，并优化大量的模型参数，因此从参数量角度微调是非常低效的。为了克服这个问题，研究者开发了一种参数高效的迁移学习架构「PeterRec」。论文链接： https:// arxiv.org/pdf/2001.0425 3.pdf PeterRec 可以快速动态地配置成各种下游任务。具体来说，PeterRec 通过注入一些小型但是极具表达力的神经网络

GitHub超全机器学习工程师成长路线图，开源两日收获3700+Star！【转】

阅读更多关于 GitHub超全机器学习工程师成长路线图，开源两日收获3700+Star！【转】

作者 | 琥珀出品 | AI科技大本营（ID:rgznai100）近日，一个在 GitHub 上开源即收获了 3700+ Star 的项目，引起了营长的注意。据介绍，该项目以 TensorFlow 和 Scikit-learn 的机器学习框架的基础库为例，详细介绍了如何成为一名机器学习工程师的成长路径。该项目的作者还是一位来自意大利的 IT 工程师，名叫 Giacomo Ciarlini，十分帅气的有没有？作者首先强烈推荐了《Scikit-Learn 与 TensorFlow 机器学习实用指南》一书。之外，他还上传了全球顶尖大学和开源组织的学习资源，并收集了理论和示例，以及对选择最佳资源的建议。内容主要分为四大部分：一、先决条件 Python Jupyter Notebook 需要掌握的基本数学知识机器学习全貌二、使如何使用 Scikit-Learn 进行机器学习为什么是 Scikit-Learn？端到端机器学习项目线性回归分类训练模型支持向量机决策树合奏学习和随机森林无监督学习结语和期待三、通过 TensorFlow 训练的神经网络为何选择 TensorFlow？使用 TensorFlow ANN - 人工神经网络 CNN - 卷积神经网络 RNN - 递归神经网络训练网络：最佳实践自动编码强化学习四、工具机器学习项目

写给程序员的机器学习入门 (一)

阅读更多关于写给程序员的机器学习入门 (一)

前段时间因为店铺不能开门，我花了一些空余时间看了很多机器学习相关的资料，我发现目前的机器学习入门大多要不门槛比较高，要不过于着重使用而忽视基础原理，所以我决定开一个新的系列针对程序员讲讲机器学习。这个系列会从机器学习的基础原理开始一直讲到如何应用，看懂这个系列需要一定的编程知识（主要会使用 python 语言），但不需要过多的数学知识，并且对于涉及到的数学知识会作出简单的介绍。因为我水平有限（不是专业的机器学习工程师），这个系列不会讲的非常深入，看完可能也就只能做一个调参狗，各路大佬觉得哪些部分讲错的可以在评论中指出。如果你没有学过 python，但学过其他语言 (例如 Java 或 C#)，推荐你看 Learn Python in Y Minutes ，大约半天时间就能掌握基础语法（快的可能只需一个小时😂）。英文版中文版机器学习的本质在讲解具体的例子与模型之前，我们先来了解一下什么是机器学习。在业务中我们有很多需要解决的问题，例如用户提交订单时如何根据商品列表计算订单金额，用户搜索商品时如何根据商品关键字得出商品搜索结果，用户查看商品一览时如何根据用户已买商品计算商品推荐列表，这些问题都可以分为输入，操作，输出，如下图所示：其中操作部分我们通常会直接编写程序代码实现，程序代码会查询数据库，使用某种算法处理数据等，这些工作可能很枯燥

你不得不了解的人工智能基础知识

阅读更多关于你不得不了解的人工智能基础知识

你不得不了解的人工智能基础知识 1.什么是人工智能？首先我们利用传统的软件和人工智能进行比较，就容易使大家更容易理解。 (1) 传统软件 VS 人工智能传统软件是[基于规则]的，需要人为的设定条件，并且告诉计算机符合这个条件后该做什么。人工智能则是机器从[特定]大量数据中总结规律，归纳出某些[特定知识]，然后将这种知识应用到特定的场景中去解决实际问题。然而，当前的人工智能知其然，但不知所以然。也正是因为归纳逻辑，所以需要依赖大量的数据。数据越多，归纳出来的经验越具有普适性。而我们在探寻AI的边界时，我们可以简单粗暴的把AI分成3个级别： 2.图灵测试图灵测试的提出是因为图灵在思考一个问题：机器能否思考？并且图像相信是可以制作出会思考的机器，于是就在想第二个问题：如何判断机器能否思考？于是就有了图灵测试。那么什么是图灵测试呢？让一个人坐在电脑前，跟另一边用键盘进行对话，如果这个人分不清跟自己对话的是一个人还是一个机器，那么这个对话机器就通过了图灵测试并具备人工智能。 3.什么是算法？算法简单来说，就是解决问题的手段，并且是批量化解决问题的手段。比如你想要木头桌子，那么制造桌子的工厂就是“一套算法”。提供（输入）木头，就会得到（输出）桌子。关于算法，有3点需要注意： 1.没有某种算法是万能的。 2.算法没有高级和低级之分。 3

K-Means算法的Python实现

阅读更多关于 K-Means算法的Python实现

算法简介 K-Means是一种常用的聚类算法。聚类在机器学习分类中属于无监督学习，在数据集没有标注的情况下，便于对数据进行分群。而K-Means中的K即指将数据集分成K个子集合。 K-Means演示从以下的动画、视频和计算过程可以较为直观了解算法的计算过程。动画展示视频展示 https://youtu.be/BVFG7fd1H30 在线展示 kmeans测试页面使用场景由于简单和低维度下高效的特性，K-Means算法被应用在人群分类，图像分段，文本分类以及数据挖掘前数据预处理场景中。算法理解计算流程一下使用 $$ 分隔的内容为 LaTeX 编码的数学表达式，请自行解析。假设有n个点$$x_{1}$$, $$x_{2}$$, $$x_{3}$$, ..., $$x_{n}$$ 以及子集数量K。步骤1 取出K个随机向量作为中心点用于初始化 $$C = c_{1},c_{2},...,c_{k}$$ 步骤2 计算每个点$$x_{n}$$与K个中心点的距离，然后将每个点聚集到与之最近的中心点 $$\min_{c_{i} \in C} dist(c_{i},x)$$ dist函数用于实现欧式距离计算。步骤3 新的聚集出来之后，计算每个聚集的新中心点 $$c_{i} = avg(\sum_{x_{i} \in S_{i}} x_{i})$$

K-Means算法的Python实现

阅读更多关于 K-Means算法的Python实现

参考《机器学习实战》高清中文PDF+高清英文PDF+源代码

阅读更多关于参考《机器学习实战》高清中文PDF+高清英文PDF+源代码

机器学习是人工智能研究领域中一个极其重要的研究方向，在现今的大数据时代背景下，捕获数据并从中萃取有价值的信息或模式，成为各行业求生存、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。入门建议参考《机器学习实战》，分为4个部分，分别是分类（有监督学习，包括KNN/决策树/朴素贝叶斯/逻辑斯蒂回归/svm/改变样本权重的bagging和adaboosting）、回归（有监督学习，线性回归、局部加权、特征维度比样本个数多时缩减系数，如岭回归、lasso等，树回归，这块掌握不太好）、无监督学习（kmeans、apriori/fp-growth）以及其他工具（PCA/SVD/MAPREDUCE）。学习参考：《机器学习实战》高清中文版， 339页，带目录书签，文字可复制；高清英文版， 382页，带目录书签，文字可复制；中英文两版对比学习。讲解详细并配有源代码。网盘下载： http://106.13.73.98 ![](https://img2018.cnblogs.com/other/1499715/201906/1499715-20190604164225573-1297509638.png) 来源： oschina 链接： https://my.oschina.net/u/4258425/blog/3228795

学习第一周

阅读更多关于学习第一周

监督学习（他们中有标签加以区分）回归算法我们给出一个数据集，里面包含了正确的答案，假如我们给他一个房价的数据集，在这个数据集中的每个样本，我们都给出正确的答案（房子的实际价格），该算法的目的是为了算出更多的正确答案，这类问题我们也叫做回归问题，我们想预测连续数值的输出。分类算法分类是指，我们设法预测出一个离散值输出，0或1，在实际的问题中，会有两个以上的输出值，在分类的问题中，有另一种方法来绘制这些数据，预测离散值输出。无监督学习（没有任何标签）聚类算法来源： oschina 链接： https://my.oschina.net/u/4370628/blog/3227734

订阅无监督学习