k-近邻算法 - 润新知

k-近邻算法
目录
K-近邻分类算法

概述
- knn采用测量不同特征值之间的距离方法进行分类
工作原理

存在一个样本训练集，含标签，已知样本集中每个数据与所属分类的对应关系，输入没有标签的新数据后，将新数据的每个特征与样本数据集中数据对应的特征进行比较，然后算法提取样本集中特征最相似（最邻近）的分类标签

优缺点
- 优点：思想简单，实现起来比较容易，在多分类问题上效果很好
  缺点：效率低下。如果有m个样本和n个特征，则算法复杂度为O(m*n)。当训练数据比较多的时候，可以想象速度有多感人。计算复杂度和空间复杂度都比较大
  而且结果不具有可解释性。
自己想一遍，写一遍吧，掌握才是王道
可以参考这个了，两种实现方式
- 自己定义一个类
- 调API
  https://nbviewer.jupyter.org/gist/gaowenxin95/4357ef5a5f6f3d77eed5dd0eed75f49f
从文本中解析和导入数据

使用matplotlib创建扩散图

归一化数值

归一化处理的必要性
相关阅读:
【Leetcode_easy】922. Sort Array By Parity II
【Leetcode_easy】925. Long Pressed Name
【Leetcode_easy】872. Leaf-Similar Trees
【Leetcode_easy】874. Walking Robot Simulation
【Leetcode_easy】1128. Number of Equivalent Domino Pairs
【VxWorks工程】基于opencv创建读取摄像头数据的工程error
【Leetcode_easy】868. Binary Gap
【Leetcode_easy】867. Transpose Matrix
【Leetcode_easy】860. Lemonade Change
第11章拾遗5：IPv6和IPv4共存技术（3）_NAT-PT技术【全书完】
原文地址：https://www.cnblogs.com/gaowenxingxing/p/12293081.html

Copyright © 2020-2023 润新知