吴恩达ML课程笔记(Chapter13)
文章目录 Lesson13 13-2 k-means算法 13-3 优化目标 13-4 随机初始化 13-5选取聚类的数量 Lesson13 K:聚类的数量 c (i) :样本点x (i) 被分到的聚类的索引值 μ k :第k个聚类中心的位置 13-2 k-means算法 1.聚类算法:把无标记(non-label)的数据分成一簇一簇的算法 2.k-means算法: 我的另一篇博客 3.k-means算法也可以分类那些数据比较集中的数据集,比如像这样: 4.这里需要注意一点,大写K用来表示聚类/簇的数量,小写k用来表示1~K区间里的某一个数 13-3 优化目标 1.优化目标: c i :第i个点被分类到的聚类的索引 J(c (1) ,c (2) ,…c (m) ,μ 1 ,…,μ k )= 1 m \frac{1}{m} m 1 ∑ i = 1 m x i 到 x i 被 分 类 到 的 聚 类 中 心 点 的 平 方 \sum_{i=1}^m{xi到xi被分类到的聚类中心点的平方} ∑ i = 1 m x i 到 x i 被 分 类 到 的 聚 类 中 心 点 的 平 方 我们就是要找到这一套c和μ,使得上述J最小。K-means算法的第一步就是在找这套c,第二步就是找这套μ 13-4 随机初始化 1.首先需要注意,应该使K<m 2.随机选取聚类中心的方法