初识机器学习_02 K-近邻算法

　　采用测量不同特征之间距离的方法进行分类

　　优点：精度高，对异常不敏感，无数据输入假定

　　缺点：计算复杂度高，空间复杂度高

　　适用：数值型，标称型

　　原理：存在一个样本数据集，其中每一个数据都存在标签（分类）即训练集中每个数据与所属分类对应关系已知。

　　　　　输入无标签（分类标签）数据，将新数据的每个特征（数值）与样本集中的数据对应特征进行比较(计算距离)，然后算法提取样本集中特征最相似(距离最近)的数据的分类标签，一般选取样本集中前K（k<=20）个最相似的数据（按距离排序），以出现次数最多的分类作为新数据的分类。

相关阅读:
101个微软提供的Visual Studio 2005示例[转贴]
验证码的三种做法[纯数字][纯汉字][字母\数字\汉字混合]C#
XML做数据库操作之我浑了
推荐几个用得上且免费的 .NET控件
一些怪得你没想过的软件,大多还是有用的!
ASP.NET 程序中常用的三十三种代码[转载与 aspcool]
js入门系列演示·数组
AJAX!?!入门之道
js入门·移动窗体/弹出提示
javascript入门系列演示·函数的定义以及简单参数使用，调用函数

原文地址：https://www.cnblogs.com/govin/p/3687253.html