机器学习-第2关:信息熵与信息增益

import numpy as np

def calcInfoGain(feature, label, index):

”’

计算信息增益

:param feature:测试用例中字典里的feature,类型为ndarray

:param label:测试用例中字典里的label,类型为ndarray

:param index:测试用例中字典里的index,即feature部分特征列的索引。该索引指的是feature中第几个特征,如index:0表示使用第一个特征来计算信息增益。

:return:信息增益,类型float

”’

** Begin **

def total_cal(label):

label_set = set(label)

result = 0

for i in label_set:

p=list(label).count(i)/len(label)

result-=p * np.log2(p)

return result

aba=[]

length=[]

for value in set(feature[:,index]):

num=feature[:,index].count(value)

sub_label = []

Original: https://blog.csdn.net/qq_55882332/article/details/124849666
Author: 『东方卿§TIAN』
Title: 机器学习-第2关:信息熵与信息增益

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/785844/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 关于账本数据库:你想知道的这里都有

    💕前言:十二月份出个openGuass集合专栏,带领大家浅浅的认识一下国产数据库吧💕 1. 什么是账本数据库 区块链大家想必都耳熟能详,比特币、以太坊甚至狗狗币等代币,作为区块链的…

    Python 2023年10月7日
    036
  • pytest之通过yaml实现数据驱动

    1、yaml基本语法 1.1 yaml格式 1.2 yaml的基本语法 1.3 yaml的数据类型 1.4 yaml的使用 2、封装读取yaml的方法 3、通过@pytest.ma…

    Python 2023年9月11日
    053
  • 两行CSS让页面提升了近7倍渲染性能!

    前言 对于前端人员来讲,最令人头疼的应该就是页面性能了,当用户在访问一个页面时,总是希望它能够快速呈现在眼前并且是可交互状态。如果页面加载过慢,你的用户很可能会因此离你而去。所以页…

    Python 2023年10月14日
    042
  • D435i相机的标定及VINS-Fusion config文件修改

    引言 当我们想使用D435i相机去跑VINS-Fusion时,如果不把标定过的相机信息写入config文件中就运行,这样运动轨迹会抖动十分严重,里程计很容易漂。接下来将介绍如何标定…

    Python 2023年10月26日
    070
  • React的生命周期函数

    概述 在React中,生命周期函数指的是组件在某一个时刻会 自动执行的函数 constructor 在类或组件创建的时候被自动执行,我们可以说它是生命周期函数,但它并不是React…

    Python 2023年10月23日
    031
  • 为了追学姐,用python把她的照片做成了游戏,她看了…

    大家好,我是Lex 喜欢欺负超人那个Lex划重点:马上就到毕业季了,你心中的那个学姐,你真的放下了吗?今天跟着lex,用pygame为你的学姐,定制开发一个拼图游戏【完整项目代码】…

    Python 2023年8月1日
    085
  • 为什么Kubernetes和容器与机器学习密不可分?

    原文出自infosecurity 作者:Rebecca James 京东云开发者社区编译 当前,数字化转型的热潮在IT领域发展的如火如荼,越来越多的企业投身其中,机器学习和人工智能…

    Python 2023年10月25日
    039
  • C#多线程(四)并行编程篇之结构化

    前言 在前三章中我们的案例大量使用到了 Thread这个类,通过其原始API,对其进行创建、启动、中断、中断、终止、取消以及异常处理,这样的写法不仅不够优雅(对接下来这篇,我称其为…

    Python 2023年10月12日
    062
  • python-pandas学习笔记

    文章目录 读写文件 * 一般读写xlsx/csv文件 读写有多个子表的excel表格 查询、遍历 * 获取表头信息 按行遍历 获取某一行并转为list数据 判断表格是否为空 按照列…

    Python 2023年8月17日
    060
  • Asp.Net Core使用NLog+Mysql的几个小问题

    项目中使用NLog记录日志,很好用,之前一直放在文本文件中,准备放到db中,方便查询。 项目使用了Mysql,所以日志也放到Mysql上,安装NLog不用说,接着你需要安装Mysq…

    Python 2023年6月12日
    059
  • 【用ddt思想重构项目】Selenium使用xlrd模块读取excel文件、使用pytest参数化实现ddt

    前言 一直想学习自动化测试,但是都没行动,业余时间学习零零碎碎并记录20210421。 8、用ddt思想重构项目 Selenium读取CSV文件 Selenium读取XML文件 S…

    Python 2023年9月13日
    042
  • verbose stack Error: yorkie@2.0.0 install: `node bin/install.js`

    1218 warn optional SKIPPING OPTIONAL DEPENDENCY: fsevents@1.2.9 (node_modules/fsevents): 1…

    Python 2023年6月3日
    074
  • 滤波笔记二:运动模型(CV&CA&CTRV)

    写这篇文章是因为在学习卡尔曼滤波的时候发现,只有线性运动可以用卡尔曼滤波,而非线性运动需要用到扩展卡尔曼滤波(EKF)或者无迹卡尔曼滤波(UKF)。那么又发现自己不熟悉非线性运动的…

    Python 2023年8月2日
    079
  • 快速入门python看过的一些资料

    我快速入门python看过的一些资料 B站的视频 10天自学Python,轻松掌握Python基础【千锋】 廖雪峰 – Python教程 https://www.lia…

    Python 2023年5月23日
    079
  • Python处理Excel数据的方法

    当Excel中有大量需要进行处理的数据时,使用Python不失为一种便捷易学的方法。接下来,本文将详细介绍多种Python方法来处理Excel数据。 我们在日常工作中常常见到各种后…

    Python 2023年8月1日
    055
  • ChatGPT使用初体验

    啊哦~你想找的内容离你而去了哦 内容不存在,可能为如下原因导致: ① 内容还在审核中 ② 内容以前存在,但是由于不符合新 的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。 可…

    Python 2023年11月4日
    062
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球