机器学习-第2关：信息熵与信息增益

2023年9月27日下午12:30 • Python • 阅读 47

import numpy as np

def calcInfoGain(feature, label, index):

”’

计算信息增益

:param feature:测试用例中字典里的feature，类型为ndarray

:param label:测试用例中字典里的label，类型为ndarray

:param index:测试用例中字典里的index，即feature部分特征列的索引。该索引指的是feature中第几个特征，如index:0表示使用第一个特征来计算信息增益。

:return:信息增益，类型float

”’

Begin

def total_cal(label):

label_set = set(label)

result = 0

for i in label_set:

p=list(label).count(i)/len(label)

result-=p * np.log2(p)

return result

aba=[]

length=[]

for value in set(feature[:,index]):

num=feature[:,index].count(value)

sub_label = []

Original: https://blog.csdn.net/qq_55882332/article/details/124849666
Author: 『东方卿§TIAN』
Title: 机器学习-第2关：信息熵与信息增益

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/785844/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

关于账本数据库：你想知道的这里都有

💕前言：十二月份出个openGuass集合专栏，带领大家浅浅的认识一下国产数据库吧💕 1. 什么是账本数据库区块链大家想必都耳熟能详，比特币、以太坊甚至狗狗币等代币，作为区块链的…

Python 2023年10月7日
0036
pytest之通过yaml实现数据驱动

1、yaml基本语法 1.1 yaml格式 1.2 yaml的基本语法 1.3 yaml的数据类型 1.4 yaml的使用 2、封装读取yaml的方法 3、通过@pytest.ma…

Python 2023年9月11日
0053
两行CSS让页面提升了近7倍渲染性能！

前言对于前端人员来讲，最令人头疼的应该就是页面性能了，当用户在访问一个页面时，总是希望它能够快速呈现在眼前并且是可交互状态。如果页面加载过慢，你的用户很可能会因此离你而去。所以页…

Python 2023年10月14日
0042
D435i相机的标定及VINS-Fusion config文件修改

引言当我们想使用D435i相机去跑VINS-Fusion时，如果不把标定过的相机信息写入config文件中就运行，这样运动轨迹会抖动十分严重，里程计很容易漂。接下来将介绍如何标定…

Python 2023年10月26日
0070
React的生命周期函数

概述在React中，生命周期函数指的是组件在某一个时刻会自动执行的函数 constructor 在类或组件创建的时候被自动执行，我们可以说它是生命周期函数，但它并不是React…

Python 2023年10月23日
0031
为了追学姐，用python把她的照片做成了游戏，她看了…

大家好，我是Lex 喜欢欺负超人那个Lex划重点：马上就到毕业季了，你心中的那个学姐，你真的放下了吗？今天跟着lex，用pygame为你的学姐，定制开发一个拼图游戏【完整项目代码】…

Python 2023年8月1日
0085
为什么Kubernetes和容器与机器学习密不可分？

原文出自infosecurity 作者：Rebecca James 京东云开发者社区编译当前，数字化转型的热潮在IT领域发展的如火如荼，越来越多的企业投身其中，机器学习和人工智能…

Python 2023年10月25日
0039
C#多线程（四）并行编程篇之结构化

前言在前三章中我们的案例大量使用到了 Thread这个类，通过其原始API，对其进行创建、启动、中断、中断、终止、取消以及异常处理，这样的写法不仅不够优雅（对接下来这篇，我称其为…

Python 2023年10月12日
0062
python-pandas学习笔记

文章目录读写文件 * 一般读写xlsx/csv文件读写有多个子表的excel表格查询、遍历 * 获取表头信息按行遍历获取某一行并转为list数据判断表格是否为空按照列…

Python 2023年8月17日
0060
Asp.Net Core使用NLog+Mysql的几个小问题

项目中使用NLog记录日志，很好用，之前一直放在文本文件中，准备放到db中，方便查询。项目使用了Mysql，所以日志也放到Mysql上，安装NLog不用说，接着你需要安装Mysq…

Python 2023年6月12日
0059
【用ddt思想重构项目】Selenium使用xlrd模块读取excel文件、使用pytest参数化实现ddt

前言一直想学习自动化测试，但是都没行动，业余时间学习零零碎碎并记录20210421。 8、用ddt思想重构项目 Selenium读取CSV文件 Selenium读取XML文件 S…

Python 2023年9月13日
0042
verbose stack Error: yorkie@2.0.0 install: `node bin/install.js`

1218 warn optional SKIPPING OPTIONAL DEPENDENCY: fsevents@1.2.9 (node_modules/fsevents): 1…

Python 2023年6月3日
0074
滤波笔记二：运动模型（CV&CA&CTRV）

写这篇文章是因为在学习卡尔曼滤波的时候发现，只有线性运动可以用卡尔曼滤波，而非线性运动需要用到扩展卡尔曼滤波（EKF）或者无迹卡尔曼滤波（UKF）。那么又发现自己不熟悉非线性运动的…

Python 2023年8月2日
0079
快速入门python看过的一些资料

我快速入门python看过的一些资料 B站的视频 10天自学Python，轻松掌握Python基础【千锋】廖雪峰 – Python教程 https://www.lia…

Python 2023年5月23日
0079
Python处理Excel数据的方法

当Excel中有大量需要进行处理的数据时，使用Python不失为一种便捷易学的方法。接下来，本文将详细介绍多种Python方法来处理Excel数据。我们在日常工作中常常见到各种后…

Python 2023年8月1日
0055
ChatGPT使用初体验

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年11月4日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习-第2关：信息熵与信息增益

** Begin **

大家都在看

Begin