KNN算法介绍

2023年7月25日下午10:42 • 人工智能 • 阅读 75

KNN算法介绍

文章目录

KNN算法介绍
*
–
+

一、介绍

KNN（K- Nearest Neighbor）法即K最邻近法，最初由 Cover和Hart于1968年提出，是最简单的机器学习算法之一，属于有监督学习中的分类算法。算法思路简单直观：分类问题：如果一个样本在特征空间中的K个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。KNN是分类算法。

二、原理

2.1 K值取几个最近的邻居数据来判断分类

牛马哥在这里呈上KNN分类算法最经典的图片，用三角形、圆形和矩形这种最少儿的图片来解释

图上前提解释：假设x和y是我们这次的特征值，绿色的矩形是我们想要预测的数据，图上的三角形和圆形是我们已知的数据集，我们需要通过现有的数据集来判断绿色矩形是三角形还是圆形。

当K = 3，代表选择离绿色矩形最近的三个数据，发现三个数据中三角形比较多，所以矩形被分类为三角形

当K = 5，代表选择离绿色矩形最近的三个数据，发现五个数据中圆形最多，所以矩形被分类为圆形

所以K值很关键，同时建议k值选取奇数。

; 2.2 距离问题

在上面的原理中还有一个关键问题，就是怎么判断距离是否最近。在这里采用的是欧式距离计算法：

下图是在二维的平面来计算的，可以当作是有两个特征值

那如果遇到多特征值的时候，KNN算法也是用欧式距离，公式如下：

从这里就能看出KNN的问题了，需要大量的存储空间来存放数据，在高维度（很多特征值输入）使用距离的度量算法，电脑得炸哈哈，就是极其影响性能（维数灾难）。而且如果要预测的样本数据偏离，会导致分类失败。

优点也是有的，如数据没有假设，准确度高，对异常点不敏感；理论成熟，思想简单。

三.KNN特点

从别人的博客看到的，挺好的。原文链接：https://blog.csdn.net/weixin_45014385/article/details/123618841

KNN是一种非参的，惰性的算法模型。什么是非参，什么是惰性呢？

非参的意思并不是说这个算法不需要参数，而是意味着这个模型不会对数据做出任何的假设，与之相对的是线性回归（我们总会假设线性回归是一条直线）。也就是说KNN建立的模型结构是根据数据来决定的，这也比较符合现实的情况，毕竟在现实中的情况往往与理论上的假设是不相符的。

惰性又是什么意思呢？想想看，同样是分类算法，逻辑回归需要先对数据进行大量训练（tranning），最后才会得到一个算法模型。而KNN算法却不需要，它没有明确的训练数据的过程，或者说这个过程很快。

会得到一个算法模型。而KNN算法却不需要，它没有明确的训练数据的过程，或者说这个过程很快。

总结，KNN模型就是暴力将预测值和模型中的数据进行距离计算，然后通过最近的数据进行分类。

Original: https://blog.csdn.net/weixin_58512942/article/details/125669895
Author: 牛马哥
Title: KNN算法介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/715884/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

DETR源码笔记（一）

源码获取：https://gitee.com/fgy120/DETR 首先对DETR做个简单介绍上图即为DETR的流程pipeline，相比以前的RCNN系列、YOLO系列等，最…

人工智能 2023年5月26日
0077
交通流预测爬坑记（三）：使用pytorch实现LSTM预测交通流

很长时间没有更新内容了，上一篇可以看做是刚接触深度学习写的，看法非常狭隘，内容非常粗糙。在最近的学习中接触到了Pytorch，不得不承认，相对于TensorFlow来讲，灵活很多。…

人工智能 2023年7月6日
0094
ExoPlayer常见问题(一)：修复音视频播放时不能跳播的问题

之前项目中使用ExoPlayer播放音频时，出现了无法跳播的问题，刚开始还以为是播放器本身的问题。播放的过程中出现了 void onPositionDiscontinuity(E…

人工智能 2023年5月27日
0058
速来！人社部发布100个最缺工职业；人均梵高的自画像工具；YSDA深度视觉与图形课程；机器学习系统VS机器学习模型；前沿论文 | ShowMeAI资讯日报

👀日报合辑; | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子 📢 人社部：2022年第二季度全国招聘大于求职『最缺工』的100个职业排行 http://www.mohrss….

人工智能 2023年6月16日
00114
机器学习（二）— KNN（K-Nearest Neighbors）

KNN K-Nearest Neighbors 简单类比（Simple Analogy） KNN：通过你周围的人来判断你是哪一类人 Tell me about your frien…

人工智能 2023年7月2日
0097
解决 cv_bridge 与 opencv4 版本冲突问题

解决了在 ROS melodic / noetic 下 cv_bridge 与 opencv4 版本冲突导致的 opencv 操作导致 Segmentation fault (c…

人工智能 2023年5月26日
0075
多模态综述

多模态综述介绍应用多模态表征翻译对齐多模态融合协同学习参考文献:《Multimodal Machine Learning: A Survey and T axono…

人工智能 2023年5月23日
0062
（数学建模）2013年国赛B题-碎纸片复原python代码

数字图像处理的期末大作业成绩出来了，感觉一般般，做个记录代码图片文件：数学建模2013年国赛B题碎纸片复原（纵切和横纵切两问）-统计分析文档类资源-CSDN下载目录第一问 …

人工智能 2023年7月19日
0061
谷歌研究员走火入魔事件曝光：认为AI已具备人格，被罚带薪休假，聊天记录让网友San值狂掉…

梦晨发自凹非寺量子位 | 公众号 QbitAI 谷歌研究员被AI说服，认为它产生了意识。他写了一篇长达21页的调查报告上交公司，试图让高层认可AI的人格。领导驳回了他的…

人工智能 2023年6月16日
0083
时间序列深度学习模型AAAI 2021论文之一Informer的主要代码解读、项目运作、自定义数据集使用

更新目录 2021-10-11 14:10 更新：informer的预测本质2022-10-13 14:57 更新：informer带注册的源码链接经调试发现，informer的…

人工智能 2023年6月24日
00107
pytorch训练网络时候出现loss nan的几种情况及解决方法

训练深度学习网络的过程中出现 loss nan总是让人觉得头疼，本人这次是在pytorch的半精度amp.autocast, amp.GradScaler训练时候出现了loss n…

人工智能 2023年6月17日
0092
Pandas数据分析13——数据框合并(实现excel的Vlookup功能)

参考书目：《深入浅出Pandas：利用Python进行数据处理与分析》 pandas数据框有时候我们需要合并，对多个数据框一起操作。pandas里面有很多用法，了解一下导入包 i…

人工智能 2023年7月7日
0076
笔记本3060显卡+windows11配置tensorflow-gpu

配置：3060+window11+cuda11.1+cudnn8.1.1+tensorflow2.4.1 目录 1、安装CUDA–CUDA Toolkit 2、安装CU…

人工智能 2023年5月25日
0097
武汉市房价数据挖掘与可视化分析（Python）

引言本文使用Python Matplotlib、Pyecharts、Seaborn、Plotl，以及百度提供的绘制可视化地图接口BMap等工具，对武汉市14个区的房价数据进行可视…

人工智能 2023年7月17日
0070
ReID行人重识别(训练+检测，附代码)，可做图像检索，陌生人检索等项目

利用ReID和目标检测对视频进行检测，可以对视频中的人进行重识别，支持更换数据集可以做车辆重识别等。可应用于图像、视频检索，行人跟踪等在以前学习ReID的时候，是跟着下面视频学…

人工智能 2023年6月25日
00114
使用wandb/tensorboard管理、可视化卷积神经网络训练日志

安装注册安装 wandb库，输入 wandb login命令获取 API key（40位），或直接输入命令 wandb login your_API_key登录个人wandb账号…

人工智能 2023年5月28日
00210

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

KNN算法介绍

文章目录

一、介绍

二、原理

2.1 K值取几个最近的邻居数据来判断分类

; 2.2 距离问题

三.KNN特点

大家都在看