K近邻算法原理 - 润新知

K近邻算法原理

K近鄰算法，其英文全稱：K-Nearest Neighbor Classification，一般簡稱為KNN。該算法是一種經典的分類算法

在K近鄰分類算法中，對於預測的新樣本數據（未有分類標籤），將其與訓練樣本一一進行比較，

找到最為相似的K個訓練樣本，並以這K個訓練樣本中出現最多的分類標籤作為最終新樣本數據的預測標籤。

其思想與「近朱者赤，近墨者黑」有異曲同工之妙！

K近邻算法有三个要素：

一、K值的定義（通俗理解即選擇多少個和自己比較相似的小夥伴）

二、距離（相似度）定義（衡量自己與小夥伴是否相似的度量標準/公式）

三、鄰居類別的統計（採用少數服從多數的原則，給未分類標籤數據進行賦值）

如上圖所示，我們有學生1,2,3,4,5（新學生）的數據（體重、身高），

其中學生1,2,3,4還有標籤（健康或亚健康）。

我們的問題是通過對學生1,2,3,4的數據進行學習，然後對學生5的标签（健康或亚健康）做出預測？
相关阅读:
ORACLE错误笔记
 SQL-考试各科目的成绩以及各科目的参与考试次数
 MySql有几条更新sql不能执行时的解决方案
 面试中常遇到的算法面试题
 MySql绿色版安装教程
 Javaweb
关于JavaWeb不使用框架上传文件的简单实现
 SSM框架
 数据库
 J2SE
原文地址：https://www.cnblogs.com/gezhaoatdlnu/p/13743570.html

热门文章
JAVA-基础
 Spring-学习笔记
 SpringCloud构建
 zookeeper & kafka (一)
Xshell-基本操作
 LeetCode
设计模式
 斐波那契数列
 算法-睡眠算法
 JS-POST提交参数

Copyright © 2020-2023 润新知