线性回归(一)
什么是机器学习? 机器学习:研究如何通过计算的手段,利用经验来改善系统自身的性能。 机器学习分为监督学习和非监督学习。 监督学习 (Supervised learning) 聚类,clustering )试图使类内差距最小化,类间差距最大化。 线性回归 在对机器学习这门学科有了一个基本的认识后,我们就要正式开始进行模型算法的学习了。 模型定义 损失函数 参数估计 以下笔记来自吴闻达老师的机器学习视频。 模型定义 h(x)代表的是一个假设集合( 损失函数(Cost Function) 之前举的例子,关于房价的预测问题,是一个单变量的回归问题,输入数据只有x维度为1, 我们建立的模型是 ,我们的目标是让这个直线尽可能的拟合所有数据, 即从数据的中心穿过,让我们的每个预测值h(x)与我们的已知数值y尽可能的接近。 那么,我们应该怎么选择最好的模型呢?通过求解参数theta1和theta2. cost function(损失函数) 来测量我们的假设的准确性。 这需要使用来自x的输入 和实际输出y的假设的所有结果的平均差(实际上是平均值的更好的版本),如下。 说明:其实损失函数 J 计算的是h(x)与真实值y之间的垂直距离的平方和均值。 关于为什么多一个1/2的问题,是为了以后求导方便,不用太在意这个。 为了问题描述的方便,首先使用上图右边的简单模型,只有一个参数theta1.