机器学习(6)K近邻算法

k-近邻,通过离你最近的来判断你的类别

例子:

机器学习(6)K近邻算法

定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近的样本中大多数属于某一类别),则该样本属于这个类别

机器学习(6)K近邻算法

机器学习(6)K近邻算法

K近邻需要做标准化处理

机器学习(6)K近邻算法

例如:

import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierdef knn():    '''    k近邻预测消费花费    :return:    '''    #读取数据    data=pd.read_csv('data.csv')    # print(data.info())    data=data[['age','ageg','num','cost']]    # print(data)    #对数据的处理    y=data[['cost']]    x=data.drop('cost',axis=1)    #划分训练集合测试集    x_train,x_text,y_train,y_text=train_test_split(x,y,test_size=0.25)    #标准化    ss=StandardScaler()    x_train=ss.fit_transform(x_train)    x_text=ss.transform(x_text)    #训练和预测    y_train=y_train.astype(int)    kn=KNeighborsClassifier(n_neighbors=5)    kn.fit(x_train,y_train)    y_predict=kn.predict(x_text)    print('预测值',y_predict)    print("++" * 100)    x_text=np.array(x_text)    print('原本的测试值',x_text)    print('得分:',kn.score(x_text,y_text.astype(int)))#训练,预测    kn=KNeighborsClassifier()    # data=data['id','']    #数据处理    #特征工程if __name__ == '__main__':    knn()

机器学习(6)K近邻算法

机器学习(6)K近邻算法

机器学习(6)K近邻算法

undefined

Original: https://www.cnblogs.com/cgy1995/p/9996129.html
Author: spiderMan1-1
Title: 机器学习(6)K近邻算法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/589793/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Spring源码学习笔记4——BeanFactoryPostProcessor执行

    一丶BeanFactoryPostProcessor是什么 Spring留给我们的一个扩展接口,在BeanDefinition加载注册完之后,并执行一些前置操作(笔记3)之后会反射…

    Java 2023年6月14日
    082
  • ​打造企业自己代码规范IDEA插件(中)

    一些基本概念 在开始独立研发公司自己的代码规范检查规则之前,先介绍一些相关的基本概念。阿里巴巴代码规范很多规则其实都是基于开源框架PMD进行的研发。PMD用官方的话语介绍来说:PM…

    Java 2023年6月15日
    076
  • SpringBoot 源码解析 (二)—– Spring Boot精髓:启动流程源码分析

    本文从源代码的角度来看看Spring Boot的启动过程到底是怎么样的,为何以往纷繁复杂的配置到如今可以这么简便。 入口类 @SpringBootApplication publi…

    Java 2023年5月29日
    065
  • 从Spring中学到的【1】–读懂继承链

    最近看了一些 Spring 源码,发现源码分析的文章很多,而底层思想分析的文章比较少,这个系列文章准备总结一下Spring中给我的启示,包括设计模式思想、SOLID设计原则等,涉及…

    Java 2023年6月16日
    082
  • 树莓派修改分辨率

    树莓派屏幕分辨率设置 树莓派一般第一次开机会自动给显示屏分配一个最合适的分辨率,但是有时候可能有个别显示屏会不兼容,就需要通过以下方式修改分辨率。而当我们使用VNC远程桌面登录的时…

    Java 2023年5月30日
    089
  • HM2022ssm-mp4.1【DML增删改编程控制(1)】

    id生成策略控制 1.1 @TableId 前面我们在新增的时候留了一个问题,就是新增成功后,主键ID是一个很长串的内容,我们更想要的是按照数据库表字段进行自增长,在解决这个问题之…

    Java 2023年6月5日
    0101
  • 安装RocketMQ出现问题找不到主类

    解决:1、确定安装路径没有空格 2、去修改下面文件 确定这里有双引号 posted @2022-07-31 18:20 大大怪下士 阅读(37 ) 评论() 编辑 Original…

    Java 2023年6月9日
    069
  • HashMap源码个人理解

    404. 抱歉,您访问的资源不存在。 可能是网址有误,或者对应的内容被删除,或者处于私有状态。 代码改变世界,联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

    Java 2023年6月5日
    079
  • spring boot集成mybatis 出现 nvalid bound statement (not found)

    公司新搭建的项目 再idea中进行springboot集成mybatis时项目能正常启动,但在链接数据库时提示nvalid bound statement (not found) …

    Java 2023年5月30日
    075
  • HashMap源码分析

    主要过一遍HashMap中的常量、构造方法、put方法(hash、putVal、resize) 当我们调用put时,实际上就是调用putVal public V put(K key…

    Java 2023年6月15日
    078
  • 工厂模式总结——三个工厂

    在创建型模式中,工厂模式是我们日常使用最为频繁的设计模式之一。工厂模式可细分为简单工厂模式、工厂方法模式、抽象工厂模式。 简单工厂模式 模式简介 简单工厂模式:根据参数返回不同类的…

    Java 2023年6月8日
    075
  • 【校招VIP】高校大学生自己的商业项目|产品脑图的重要性:活动模型的细节分析

    ​哈喽大家好,今天来看一下真实的商业项目——约起来课程。今天讲解产品的第二期,脑图的第二部分。本节课针对上节课的四个问题进行难点分析: 今天的重点脑图的过程,最终版的官方脑图提供下…

    Java 2023年6月5日
    069
  • 【JavaWeb-JSP】笔记汇总 — JSP 规范;EL 表达式

    JSP 规范: <strong><span>JSP &#x89C4;&#x8303;&#x4ECB;&#x7ECD;&amp…

    Java 2023年6月8日
    073
  • 学生管理系统 C++课设

    #include #include #include<string.h> #include using namespace std; /////////////////…

    Java 2023年6月5日
    071
  • MySql主要性能指标说明

    在项目当中数据库一般都会成为主要的性能与负载瓶颈,那么针对数据库各项性能指标的监控与对应的优化是开发与运维人员需要面对的主要工作,而且这部分的工作会贯穿项目从开发到运行的整个周期里…

    Java 2023年6月9日
    069
  • CentOS 7.5 安装KVM虚拟机(Windows)

    一、KVM环境搭建1.检测系统是否支持cat /proc/cpuinfo | egrep ‘vmx|svm’KVM是基于x86虚拟化扩展(Intel VT …

    Java 2023年5月30日
    0181
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球