机器学习（6）K近邻算法

2023年6月8日下午11:01 • Java • 阅读 72

k-近邻，通过离你最近的来判断你的类别

例子：

定义：如果一个样本在特征空间中的k个最相似（即特征空间中最邻近的样本中大多数属于某一类别），则该样本属于这个类别

K近邻需要做标准化处理

例如：

import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierdef knn():    '''    k近邻预测消费花费    :return:    '''    #读取数据    data=pd.read_csv('data.csv')    # print(data.info())    data=data[['age','ageg','num','cost']]    # print(data)    #对数据的处理    y=data[['cost']]    x=data.drop('cost',axis=1)    #划分训练集合测试集    x_train,x_text,y_train,y_text=train_test_split(x,y,test_size=0.25)    #标准化    ss=StandardScaler()    x_train=ss.fit_transform(x_train)    x_text=ss.transform(x_text)    #训练和预测    y_train=y_train.astype(int)    kn=KNeighborsClassifier(n_neighbors=5)    kn.fit(x_train,y_train)    y_predict=kn.predict(x_text)    print('预测值',y_predict)    print("++" * 100)    x_text=np.array(x_text)    print('原本的测试值',x_text)    print('得分：',kn.score(x_text,y_text.astype(int)))#训练，预测    kn=KNeighborsClassifier()    # data=data['id','']    #数据处理    #特征工程if __name__ == '__main__':    knn()

undefined

Original: https://www.cnblogs.com/cgy1995/p/9996129.html
Author: spiderMan1-1
Title: 机器学习（6）K近邻算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/589793/

转载文章受原作者版权保护。转载请注明原作者出处！

Java

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Spring源码学习笔记4——BeanFactoryPostProcessor执行

一丶BeanFactoryPostProcessor是什么 Spring留给我们的一个扩展接口，在BeanDefinition加载注册完之后，并执行一些前置操作（笔记3）之后会反射…

Java 2023年6月14日
0082
打造企业自己代码规范IDEA插件（中）

一些基本概念在开始独立研发公司自己的代码规范检查规则之前，先介绍一些相关的基本概念。阿里巴巴代码规范很多规则其实都是基于开源框架PMD进行的研发。PMD用官方的话语介绍来说：PM…

Java 2023年6月15日
0076
SpringBoot 源码解析（二）—– Spring Boot精髓：启动流程源码分析

本文从源代码的角度来看看Spring Boot的启动过程到底是怎么样的，为何以往纷繁复杂的配置到如今可以这么简便。入口类 @SpringBootApplication publi…

Java 2023年5月29日
0065
从Spring中学到的【1】–读懂继承链

最近看了一些 Spring 源码，发现源码分析的文章很多，而底层思想分析的文章比较少，这个系列文章准备总结一下Spring中给我的启示，包括设计模式思想、SOLID设计原则等，涉及…

Java 2023年6月16日
0082
树莓派修改分辨率

树莓派屏幕分辨率设置树莓派一般第一次开机会自动给显示屏分配一个最合适的分辨率，但是有时候可能有个别显示屏会不兼容，就需要通过以下方式修改分辨率。而当我们使用VNC远程桌面登录的时…

Java 2023年5月30日
0089
HM2022ssm-mp4.1【DML增删改编程控制(1)】

id生成策略控制 1.1 @TableId 前面我们在新增的时候留了一个问题，就是新增成功后，主键ID是一个很长串的内容，我们更想要的是按照数据库表字段进行自增长，在解决这个问题之…

Java 2023年6月5日
00101
安装RocketMQ出现问题找不到主类

解决：1、确定安装路径没有空格 2、去修改下面文件确定这里有双引号 posted @2022-07-31 18:20 大大怪下士阅读(37 ) 评论() 编辑 Original…

Java 2023年6月9日
0069
HashMap源码个人理解

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Java 2023年6月5日
0079
spring boot集成mybatis 出现 nvalid bound statement (not found)

公司新搭建的项目再idea中进行springboot集成mybatis时项目能正常启动，但在链接数据库时提示nvalid bound statement (not found) …

Java 2023年5月30日
0075
HashMap源码分析

主要过一遍HashMap中的常量、构造方法、put方法(hash、putVal、resize) 当我们调用put时，实际上就是调用putVal public V put(K key…

Java 2023年6月15日
0078
工厂模式总结——三个工厂

在创建型模式中，工厂模式是我们日常使用最为频繁的设计模式之一。工厂模式可细分为简单工厂模式、工厂方法模式、抽象工厂模式。简单工厂模式模式简介简单工厂模式：根据参数返回不同类的…

Java 2023年6月8日
0075
【校招VIP】高校大学生自己的商业项目|产品脑图的重要性：活动模型的细节分析

哈喽大家好，今天来看一下真实的商业项目——约起来课程。今天讲解产品的第二期，脑图的第二部分。本节课针对上节课的四个问题进行难点分析：今天的重点脑图的过程，最终版的官方脑图提供下…

Java 2023年6月5日
0069
【JavaWeb-JSP】笔记汇总 — JSP 规范；EL 表达式

JSP 规范： <strong><span>JSP 规范介绍&amp…

Java 2023年6月8日
0073
学生管理系统 C++课设

#include #include #include<string.h> #include using namespace std; /////////////////…

Java 2023年6月5日
0071
MySql主要性能指标说明

在项目当中数据库一般都会成为主要的性能与负载瓶颈，那么针对数据库各项性能指标的监控与对应的优化是开发与运维人员需要面对的主要工作，而且这部分的工作会贯穿项目从开发到运行的整个周期里…

Java 2023年6月9日
0069
CentOS 7.5 安装KVM虚拟机(Windows)

一、KVM环境搭建1.检测系统是否支持cat /proc/cpuinfo | egrep ‘vmx|svm’KVM是基于x86虚拟化扩展(Intel VT …

Java 2023年5月30日
00181

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习（6）K近邻算法

大家都在看