无监督学习定义:
- 【无监督学习】中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。你能从数据中找到某种结构吗?
- 针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。这是一个类,那是另一个类,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做【聚类算法clustering algorithm】
- 聚类只是无监督学习的一种
聚类应用:
- 谷歌新闻:把不同新闻分成不同类别
- 基因分类:输入一组不同个体,对其中的每个个体,你要分析出它们是否有一个特定的基因。
- 给社交网络朋友自动分组
- 顾客数据分类,划分到不同细分市场
- 天文数据分析
- 分离出一屋子人不同说话声(分离算法:[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');)
6.说明:
研究人员花费了大量时间才最终实现这行代码。我不是说这个是简单的问题,但它证明
了,当你使用正确的编程环境,许多学习算法是相当短的程序。所以,这也是为什么在本课
中,我们打算使用 Octave 编程环境。Octave,是免费的开源软件,使用一个像 Octave 或 Matlab
的工具,许多学习算法变得只有几行代码就可实现。