机器学习之分类-K-近邻算法（KNN）

2023年9月7日上午6:30 • Python • 阅读 51

K-近邻算法（KNN）

一个样本在特征空间中的k个最近的样本中的大多数属于某一个类别，则该样本也属于这个类别

距离
欧氏距离
d = ( x 1 − x 2 ) 2 + ( y 1 + y 2 ) 2 d=\sqrt{(x_1-x_2)^2+(y_1+y_2)^2}d =(x 1 −x 2 )2 +(y 1 +y 2 )2
曼哈顿距离
d = ∣ x 1 − x 2 ∣ + ∣ y 1 − y 2 ∣ d=|x_1-x_2|+|y_1-y_2|d =∣x 1 −x 2 ∣+∣y 1 −y 2 ∣
明科夫斯基距离
d = ( ∑ i = 1 n ∣ x i − y i ∣ p ) 1 / p d=(\sum_{i=1}^{n}{|x_i-y_i|^p})^{1/p}d =(i =1 ∑n ∣x i −y i ∣p )1 /p
- p=2时是欧几里得距离
- p=1时是曼哈顿距离
算法分析
k值过大时，容易收到样本不均衡的影响
k值过小，容易受异常值影响
优点：
- 简单，易于理解，易于实现，无需训练
缺点
- 对测试样本分类时计算量很大，内存开销大
- 必须指定K值，K值选择不当则分类精度不能保证
使用场景：小规模数据

代码示例: 鸢尾花种类预测

from sklearn.datasets import load_iris

iris =load_iris()

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test =train_test_split(iris.data,iris.target,test_size=0.2,random_state=6)

from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)

x_test = transfer.transform(x_test)

from sklearn.neighbors import KNeighborsClassifier
estimator = KNeighborsClassifier(n_neighbors=3)
estimator.fit(x_train,y_train)

y_predict = estimator.predict(x_test)
score = estimator.score(x_test,y_test)
print("score=",score)

Original: https://blog.csdn.net/qq_26192391/article/details/128328564
Author: console
Title: 机器学习之分类-K-近邻算法（KNN）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/770109/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python计算平均值画折线图_Python 数据分析测试2 之求平均值及折线图显示

Time: 2020/07/27 Author: Xiaohong 运行环境: OS: Windows 10 Python: 3.7 功能: 导入4份文件(分别对应4个部位)，测算…

Python 2023年8月7日
0071
Error occurred when installing package ‘‘ pycharm安装库报错，使用cmd安装库，镜像源

文章目录 * – 1、问题 – 2、pycharm改镜像源 – 3、cmd镜像源pip安装库 1、问题出现报错：解决方法：1、在输入行搜索cm…

Python 2023年8月2日
0062
接口测试框架开发实践6：测试报告插件allure-pytest详解

软件质量保障专注测试圈，自动化测试、测试平台开发、测试新技术、大厂测试岗面经分享，可以帮忙内推BATJ等大厂！欢迎加VX沟通交流: ISTE1024 公众号目录安装&amp…

Python 2023年9月12日
0063
Django & Vue 项目踩坑记：The field admin.LogEntry.user was declared with a lazy reference to ‘xxx‘

功能期望基于Django提供的AbstractUser类重写User模型，在其中根据业务需求增加信息，并将新的用户模型设为系统默认用户模型。问题描述完成自定义User模型的编…

Python 2023年8月5日
0052
数据分析：Numpy基础

np.array的创建 import numpy as np #方法一 np.array([1,2,3],dtype=”) 参数1：数据源参数二：表示的是数组中元素的类型 #方…

Python 2023年8月27日
0062
Pandas简单操作（学习总结）

stu = pd.read_excel(‘./stu_data.xlsx’) stu[‘新体重’] = pd.cut(stu.体重,bins=[40,50,60,70,80,90]…

Python 2023年5月23日
0063
[RootersCTF2019]I_＜3_Flask——二营长，我的脚本呢？

[RootersCTF2019]I_＜3_Flask 前言写这篇文章的时候，这道题已经是前一天做的了，虽然题目很简单，但是这次还是学到了一些新的东西。之前，在安装tplmap的时…

Python 2023年8月13日
0064
SSD目标检测网络解读（含网络结构和内容解读）

SSD实现思路 SSD具有如下主要特点：从YOLO中继承了将detection转化为regression的思路，一次完成目标定位与分类基于Faster RCNN中的Anchor…

Python 2023年6月9日
0089
最优美的表格查看插件：tabulate

在平常的数据分析过程中，python本身的list、dict等数据直接打印出来如果数据较小还可以明显的查看，若是数据量稍微有个几十行的话找起来简直是眼花缭乱的。【阅读全文】安装…

Python 2023年5月24日
0073
【数据分析系列】Python数据预处理总结篇

目录 1.缺失值处理 * 1.1删除缺失值dropna 1.2填充/替换缺失数据 – fillna、replace 1.3缺失值插补(mean,median,mode,…

Python 2023年8月29日
0048
Python 代码智能感知 —— 类型标注与特殊的注释（献给所有的Python人）

一个不会写好的类型标注和注释的Python程序员，是让使用TA的代码的人都痛苦无比的事情…… —— 某某大佬想必大部分现代的集成开发环境（IDE）都…

Python 2023年10月31日
0057
scrapy 安装_Windows下安装Scrapy方法及常见安装问题总结——Scrapy安装教程

这几天，很多朋友在群里问Scrapy安装的问题，其实问题方面都差不多，今天小编给大家整理一下Scrapy的安装教程，希望日后其他的小伙伴在安装的时候不再六神无主，具体的教程如下。 …

Python 2023年10月6日
0065
Python GUI编程：tkinter 关于 ttkbootstrap 的使用

; 1、项目介绍 ttkbootstrap 是一个基于 tkinter 的界面美化库，使用这个工具可以开发出类似前端 bootstrap 风格的 tkinter 桌面程序。如果会 …

Python 2023年5月24日
00133
基于LSM树的存储机制简述

下午听了关于MyRocks-PASV的研究讲座，很有意思所以学习了一下LSM树的一些简单的底层原理。现在整理一下我们都知道目前Key:Value型的数据库普遍较之关系型数据库有着…

Python 2023年10月14日
0034
【pytest】2.pytest的前置、后置

pytest框架的前后置（固件，夹具）处理，三种方法： class TestLogin: def setup_class(self): print("每个类之前执行的的操…

Python 2023年9月9日
0041
复现开源论文代码总结

复现开源论文代码总结 1. 找到开源论文的代码 2. 阅读README.md说明文档 3. 代码下载与解压 4. 配置环境、下载数据集与预训练权重 5. 运行代码，排错参考随着…

Python 2023年9月28日
00124

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习之分类-K-近邻算法（KNN）

K-近邻算法（KNN）

大家都在看