K-近邻分类算法
概述
- knn采用测量不同特征值之间的距离方法进行分类
工作原理
存在一个样本训练集,含标签,已知样本集中每个数据与所属分类的对应关系,输入没有标签的新数据后,将新数据的每个特征与样本数据集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最邻近)的分类标签
优缺点
- 优点:思想简单,实现起来比较容易,在多分类问题上效果很好
缺点:效率低下。如果有m个样本和n个特征,则算法复杂度为O(m*n)。当训练数据比较多的时候,可以想象速度有多感人。计算复杂度和空间复杂度都比较大
而且结果不具有可解释性。
自己想一遍,写一遍吧,掌握才是王道
可以参考这个了,两种实现方式