python机器学习

哈工大 机器学习 lab1

这一生的挚爱 提交于 2019-12-06 17:12:43
哈尔滨工业大学计算机科学与技术学院 实验报告 课程名称: 机器学习 课程类型: 必修 实验题目: 多项式拟合正弦函数 一.实验目标 掌握最小二乘法求解(无惩罚项的损失函数)、掌握加惩罚项(2范数)的损失函数优化、梯度下降法、共轭梯度法、理解过拟合、克服过拟合的方法(如加惩罚项、增加样本) 二.实验要求和实验环境 实验要求 生成数据,加入噪声; 用高阶多项式函数拟合曲线; 用解析解求解两种loss的最优解(无惩罚项和有惩罚项) 优化方法求解最优解(梯度下降,共轭梯度); 用你得到的实验数据,解释过拟合。 用不同数据量,不同超参数,不同的多项式阶数,比较实验效果。 语言不限,可以用matlab,python。求解解析解时可以利用现成的矩阵求逆。梯度下降,共轭梯度要求自己求梯度,迭代优化自己写。不许用现成的平台,例如pytorch,tensorflow的自动微分工具。 实验环境 Microsoft win10 1809 python 3.7.0 Sublime Text 3 三.设计思想 1.算法原理 (0)数据的产生 x为 到 之间的随机数. 噪音 由一个标准正态分布函数 *0.1 产生 y = sin(x) + 利用循环, 根据x产生范德蒙德矩阵X 将 X, y 都转为矩阵类型 (1) 解析解(不带惩罚项) 误差函数: 将上式写成矩阵形式: 通过将上式求导我们可以得到式 令 得到

哈工大 机器学习 lab1

痴心易碎 提交于 2019-12-06 17:11:50
哈尔滨工业大学计算机科学与技术学院 实验报告 课程名称: 机器学习 课程类型: 必修 实验题目: 多项式拟合正弦函数 一.实验目标 掌握最小二乘法求解(无惩罚项的损失函数)、掌握加惩罚项(2范数)的损失函数优化、梯度下降法、共轭梯度法、理解过拟合、克服过拟合的方法(如加惩罚项、增加样本) 二.实验要求和实验环境 实验要求 生成数据,加入噪声; 用高阶多项式函数拟合曲线; 用解析解求解两种loss的最优解(无惩罚项和有惩罚项) 优化方法求解最优解(梯度下降,共轭梯度); 用你得到的实验数据,解释过拟合。 用不同数据量,不同超参数,不同的多项式阶数,比较实验效果。 语言不限,可以用matlab,python。求解解析解时可以利用现成的矩阵求逆。梯度下降,共轭梯度要求自己求梯度,迭代优化自己写。不许用现成的平台,例如pytorch,tensorflow的自动微分工具。 实验环境 Microsoft win10 1809 python 3.7.0 Sublime Text 3 三.设计思想 1.算法原理 (0)数据的产生 x为 到 之间的随机数. 噪音 由一个标准正态分布函数 *0.1 产生 y = sin(x) + 利用循环, 根据x产生范德蒙德矩阵X 将 X, y 都转为矩阵类型 (1) 解析解(不带惩罚项) 误差函数: 将上式写成矩阵形式: 通过将上式求导我们可以得到式 令 得到

哈工大 机器学习 lab1

£可爱£侵袭症+ 提交于 2019-12-06 17:10:15
哈尔滨工业大学计算机科学与技术学院 实验报告 课程名称: 机器学习 课程类型: 必修 实验题目: 多项式拟合正弦函数 一.实验目标 掌握最小二乘法求解(无惩罚项的损失函数)、掌握加惩罚项(2范数)的损失函数优化、梯度下降法、共轭梯度法、理解过拟合、克服过拟合的方法(如加惩罚项、增加样本) 二.实验要求和实验环境 实验要求 生成数据,加入噪声; 用高阶多项式函数拟合曲线; 用解析解求解两种loss的最优解(无惩罚项和有惩罚项) 优化方法求解最优解(梯度下降,共轭梯度); 用你得到的实验数据,解释过拟合。 用不同数据量,不同超参数,不同的多项式阶数,比较实验效果。 语言不限,可以用matlab,python。求解解析解时可以利用现成的矩阵求逆。梯度下降,共轭梯度要求自己求梯度,迭代优化自己写。不许用现成的平台,例如pytorch,tensorflow的自动微分工具。 实验环境 Microsoft win10 1809 python 3.7.0 Sublime Text 3 三.设计思想 1.算法原理 (0)数据的产生 x为 到 之间的随机数. 噪音 由一个标准正态分布函数 *0.1 产生 y = sin(x) + 利用循环, 根据x产生范德蒙德矩阵X 将 X, y 都转为矩阵类型 (1) 解析解(不带惩罚项) 误差函数: 将上式写成矩阵形式: 通过将上式求导我们可以得到式 令 得到

哈工大 机器学习 lab1

断了今生、忘了曾经 提交于 2019-12-06 17:08:31
哈尔滨工业大学计算机科学与技术学院 实验报告 课程名称: 机器学习 课程类型: 必修 实验题目: 多项式拟合正弦函数 一.实验目标 掌握最小二乘法求解(无惩罚项的损失函数)、掌握加惩罚项(2范数)的损失函数优化、梯度下降法、共轭梯度法、理解过拟合、克服过拟合的方法(如加惩罚项、增加样本) 二.实验要求和实验环境 实验要求 生成数据,加入噪声; 用高阶多项式函数拟合曲线; 用解析解求解两种loss的最优解(无惩罚项和有惩罚项) 优化方法求解最优解(梯度下降,共轭梯度); 用你得到的实验数据,解释过拟合。 用不同数据量,不同超参数,不同的多项式阶数,比较实验效果。 语言不限,可以用matlab,python。求解解析解时可以利用现成的矩阵求逆。梯度下降,共轭梯度要求自己求梯度,迭代优化自己写。不许用现成的平台,例如pytorch,tensorflow的自动微分工具。 实验环境 Microsoft win10 1809 python 3.7.0 Sublime Text 3 三.设计思想 1.算法原理 (0)数据的产生 x为 到 之间的随机数. 噪音 由一个标准正态分布函数 *0.1 产生 y = sin(x) + 利用循环, 根据x产生范德蒙德矩阵X 将 X, y 都转为矩阵类型 (1) 解析解(不带惩罚项) 误差函数: 将上式写成矩阵形式: 通过将上式求导我们可以得到式 令 得到

机器学习入门科普:监督学习和无监督学习都是什么?都能干什么?

自古美人都是妖i 提交于 2019-12-06 16:38:46
导读: 学习究竟是什么? 简单来说,学习是在外部刺激下记住大部分以往的经验,从而能够实现改变的能力。 因此,机器学习是一种工程方法,对于增加或提高自适应变化的各项技术都十分重要。例如,机械手表是一种非凡的工件,但其结构符合静止定律,当外部变化发生变化时会变得没有任何用处。 学习能力是动物特别是人特有的,根据达尔文的理论,它也是所有物种生存和进化的关键要素。 机器虽然不能自主进化,但似乎也遵循同样的规律。 ▲自适应系统的示意图 Adaptive System: 适应系统 Parameter tuner/ trainer: 参数调整/训练器 Input elements: 输入元素 Feedback: 反馈 Output elements: 输出元素 Enviornment: 环境 机器学习的主要目标是学习、策划和改进数学模型,该数学模型可以使用由环境提供的相关数据进行一次或连续多次的训练得到,利用该数学模型推断未来并做出决定而不需要所有影响因素 (外部因素) 的全部知识。 换句话说,agent (从环境中接收信息的软件实体,选择达到特定目标的最佳行动并观察其结果) 采用统计学习方法,通过确定正确的概率分布,来预测最有可能成功 (具有最小错误) 的动作 (值或决策) 。 我更喜欢使用术语 推断 而不是 预测 ,只是为了避免把机器学习看成是一种现代魔法 (这种看法但并不罕见) 。此外

python&AI学习

好久不见. 提交于 2019-12-06 16:22:27
1 开发环境搭建 1)安装python3.7 2)安装git 3)安装编辑器notepad++ 2 第一个程序Hello world 1)写入文件/python/1.py print("hello world") 错误:python :command not dound 安装pip之后再运行 python 1.py 3 实例 1)机器学习SVM分类器 a.安装机器学习相关库python-sklearn 来源: CSDN 作者: 穿着帆布鞋也能走猫步 链接: https://blog.csdn.net/xu1129005165/article/details/82893663

如何自学人工智能路径规划(附资源,百分百亲身经验)

人走茶凉 提交于 2019-12-06 16:14:50
下面的每个资源都是我亲身学过的,且是网上公开公认最优质的资源。 下面的每个学习步骤也是我一步步走过来的。希望大家以我为参考,少走弯路。 请大家不要浪费时间找非常多的资料,只看最精华的! 综述,机器学习的自学简单来说分为三个步骤 前期:知识储备包括数学知识,机器学习经典算法知识,编程技术(python)的掌握 中期:算法的代码实现 后期:实战水平提升 机器学习路径规划图 一、数学基础 很多人看到数学知识的时候就望而却步,数学是需要的,但是作为入门水平,对数学的要求没有那么的高。 假设你上过大学的数学课(忘了也没事),需要的数学知识啃一啃还是基本能理解下来的。 1.1、数学内容 线性代数:矩阵/张量乘法、求逆,奇异值分解/特征值分解,行列式,范数等 统计与概率:概率分布,独立性与贝叶斯,最大似然(MLE)和最大后验估计(MAP)等 优化:线性优化,非线性优化(凸优化/非凸优化)以及其衍生的如梯度下降、牛顿法等 微积分:偏微分,链式法则,矩阵求导等 信息论、数值理论等 上面的看不太懂没事,不是特别难,学习一下就能理解了。 1.2、数学资源 网上有很多人会列举大量大量的课程资源,这是非常不负责任的事,学完那些我头发都得白了。 实际上,我们只需要学习其中的一部分就够了。 1.2.1、吴恩达的斯坦福大学机器学习王牌课程CS229,课后就有对学生数学知识的要求和补充,这些数学知识是 来源:

怎样快速学会Python机器学习与深度学习,来自AI一线大咖的建议

流过昼夜 提交于 2019-12-06 16:14:36
如果村里通了网,那你一定知道【AI】人工智能。 如果你会网上冲浪,那你一定看到过【ML】机器学习。 小编在网上看到一个段子:ML派坐落美利坚合众山中, 百年来武学奇才辈出,隐然成江湖第一大名门正派,门内有三套入门武功,曰:图模型加圈,神经网加层,优化目标加正则。有童谣为证:熟练ML入门功,不会作文也会谄。 但许多人仍有此疑问 :学习机器学习,无从下手怎么办?尝试过各种学习方法,为什么依然是个门外汉?为什么传统的学习机器学习途径收效甚慢?作为一名对机器学习心有向往的程序员,我该以什么样的姿势开始呢? 机器学习真的这么难吗?小编特意采访了机器学习大咖邹博老师,以下是老师的回复: 时光飞逝,我从开始接触机器学习到现在已经十多年了。想当初,我也是一个小白, 我先把大学教材《高等数学》、《线性代数》、《概率论》从头到尾都看了一遍,然后又看了多家机构的机器学习教学视频。 可以说当初的迷茫、慌张、害怕、忐忑 ,心路历程非常艰辛。 因为感觉东西太多太多了 ,一会儿机器学习一会儿深度学习,一会儿这个导师的视频,一会儿那个机构的教程,都不知道从哪学,要学哪些? 后来参加工作了,发现 那些基本的数学知识从头到尾全部看一遍,其实没那个必要, 只需要掌握必要的几个基础点就好了。 大家都以为机器学习和深度学习很难,其实很简单,最快的办法就是直接上手做项目 实践,一个项目做下来,过程中发现不懂的地方学习

五位专家跟你讲讲为啥Python更适合做AI/机器学习

戏子无情 提交于 2019-12-06 16:12:12
云栖君导读 : 为什么Python会在这股深度学习浪潮中成为编程语言的头牌?听听大牛如何解释吧! 1.Python网络编程框架Twisted的创始人Glyph Lefkowitz(glyph): 编程是一项社交活动——Python社区已经认识到了这一点! 人工智能是一个全面的技术术语,通常意味着当前计算机科学研究中最先进的领域。 有一段时间,我们理所当然的认为基本图遍历是AI。那时候,Lisp是人工智能的专属语言,仅仅是因为研究人员更容易用它来做快速原型。我认为Python已经在很大程度上取代了它,因为除了类似的高层次功能之外,它还拥有出色的第三方库生态库和框架以及操作系统设施的完美集成。 Lispers可能会反对我的看法,所以我应该说清楚,我没有对Python在应用层次中的位置做出精确的陈述,只是说Python和Lisp都处于相同的语言类别中,像内存安全、模块、名称空间和高级数据结构。 在更具体的机器学习意义上,这是人们最近说的关于AI的最多的领域,我认为还有更具体的答案。 NumPy及其相应的生态系统的存在使得研究人员可以对高级别内容进行研究,并进行高性能的数字处理。如果不是有非常强的数字处理需求,机器学习是没有任何意义的。 Python社区致力于为非程序员提供友好的介绍和生态系统支持,这确实增加了其在数据科学和计算科学的应用。无数的统计工作人员、天文学家

【火炉炼AI】机器学习027-项目案例:用聚类算法建立客户细分模型

爷,独闯天下 提交于 2019-12-06 15:10:19
【火炉炼AI】机器学习027-项目案例:用聚类算法建立客户细分模型 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 客户细分是市场营销成功的前提,我们从市场中获取的数据一般都没有标记,要想对这些市场数据进行客户细分,将客户划分簇群,这也是一种典型的无监督学习问题。 本项目拟用各种不同的聚类算法来建立客户细分模型,并比较这些聚类算法在这一问题上的优虐。 1. 准备数据集 本项目案例所使用到的原始数据集来源于: UCI大学数据集 ,这个数据集来源于一个批发商,一共包含有440个样本数据,每个样本数据包含有8列,但是其中的6列作为features,此处由于是无监督学习,不需要标记,故而只需要其中的六列数据,这些数据的说明如下表所示。 对于这6个features,数据集已经告诉我们这6列的min,max mean等信息,我把它们整理成一个表格,如下所示: 数据集的加载可以采用pd.read_csv函数来完成,代码可以参考 我的github ,下面我们随便选择两个feature,将其绘制到二维平面图上,看看这些数据点的分布情况,比如下图: 2. 构建均值漂移聚类模型 本项目用均值漂移算法来构建模型,模型的构建和训练过程和我以前的文章 【火炉炼AI】机器学习022