面板数据熵值法-Python

2023年7月6日下午9:51 • 人工智能 • 阅读 83

面板数据数据熵值法公式-基于Python

更新时间：2022年11月9日
更新内容：已解决运行代码时出现下述问题：

; 一、理论基础

本文通过王晓红等(2021)中所使用到的面板数据熵值法公式，来讲解如何对面板数据使用熵值法及Python代码的实现，具体过程如下：

; 二、代码实现

import pandas as pd
import numpy as np
import os


def Entory(path0,forwrd_indicator,inverse_indicator):

    df=pd.DataFrame()
    df1=pd.DataFrame()

    data=pd.read_excel(path0,sheet_name=None,index_col=0)
    Sheet_name=list(data.keys())
    for i in Sheet_name:
        df2=pd.read_excel(path0,sheet_name=i,index_col=0)
        df3=pd.DataFrame(df2.to_numpy().reshape(-1, 1, order='F'))
        df=pd.concat([df,df3],axis=1)
        x1=df2.shape[1]
        x2=df2.shape[0]
        y=df2.index
        z=list(df2.columns)
    df.columns=[i for i in Sheet_name]
    df.insert(0,"城市",list(y)*x1)
    df.insert(1,"年份",sorted(z*x2))
    df=df.set_index(["城市","年份"])

    df4=df.copy()
    forwrd_indicator=[i for i in forwrd_indicator]
    inverse_indicator=[i for i in inverse_indicator]
    if forwrd_indicator:
        inverse_indicator=list(set(forwrd_indicator) ^ set(Sheet_name))
    else:
        forwrd_indicator=list(set(inverse_indicator) ^ set(Sheet_name))
    print("正向指标forwrd_indicator：\n",forwrd_indicator)
    print("\n")
    print("逆向指标inverse_indicator：\n",inverse_indicator)
    print("\n")

    if forwrd_indicator or inverse_indicator:
        df4[forwrd_indicator]=(df4[forwrd_indicator]-df4[forwrd_indicator].min())/(df4[forwrd_indicator].max()-df4[forwrd_indicator].min())
        df4[inverse_indicator]=(df4[inverse_indicator].max()-df4[inverse_indicator])/(df4[inverse_indicator].max()-df4[inverse_indicator].min())

    df4=df4.apply(lambda x:x+0.01)
    df5=df4/df4.apply(lambda x:x.sum())
    k=np.power(np.log(df5.shape[0]),-1)
    p=df5/df5.apply(lambda x:x.sum())
    P=(p*p.apply(np.log)).sum()
    entory=-k*P
    D=1-entory
    W=D/D.sum()
    print("权重：\n",W)
    print("\n")

    excel_to_path=os.path.join(os.path.split(path0)[0],"熵值法.xlsx")
    with pd.ExcelWriter(path=excel_to_path) as writer:
        df.to_excel(writer, sheet_name='面板数据')
        W.to_excel(writer, sheet_name='权重')
    print("结果已保存到路径{}下".format(excel_to_path))

path0=r"C:\Users\HP\Desktop\python.xlsx"
forwrd_indicator=["用水量","人均GDP增长率"]
inverse_indicator=[]
Entory(path0,forwrd_indicator,inverse_indicator)

三、实例

在本例中，求用水量与GDP增长率这两个指标所占的比重。
数据格式如下图所示：
注：每个指标单独放在一个sheet表里

数据来源：中国统计年鉴
代码实现过程
此步骤见第二步
结果

其中，最后一行W为各指标的权重，其余各行说明详见代码实现部分

; 四、结果验证

为验证结果的正确性，此处使用spssau进行验证，结果如下图所示：

比较二者的结果，可认为本文所提供的代码具有一定的合理性。

; 五、说明

在计算信息熵时(如下图所示)，由于我们对数据采用的是极差标准化方法，使得标准化后的数据的取值范围在[0,1]之间，也就是说该方法会使得部分数据取到0，而在计算信息熵时（如下图所示），ln0是无效的。而在相关文献中关于P的处理，有以下两种：一种是对标准化后的数据进行平移（本文中采取该方法），另一种则是令P*lnP=0。因此，对于这两种方法所求出来的权重之间的差异如何，本文在此利用上文中的数据对第二种方法进行计算。
第二种方法的处理方式：将下列代码删除即可

df4=df4.apply(lambda x:x+0.01)

结果对比：

由上述结果来看，不同方法求出的权重的确不同，但两者相差大概在0.01左右。因此可根据自己的需求自行选择。

注：本人能力有限，文中错漏之处在所难免，请各位多多包涵。

Original: https://blog.csdn.net/weixin_44121536/article/details/126971851
Author: 没事写写代码
Title: 面板数据熵值法-Python

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/674851/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

One-Stage与Two-Stage区别

在基于深度学习算法的目标检测算法主要分两类：One-Stage与Two-Stage。One-Stage与Two-Stage是两种不同的思路，其各有各的优缺点，本文做一个简单的讲述。…

人工智能 2023年6月16日
0090
HCIP之BGP路由反射器、联邦

目录 HCIP之BGP路由反射器、联邦路由反射器定义路由反射器的反射规则因水平分割而引起的两个属性联邦联邦的思想联邦存在的问题联邦的配置 HCIP之BGP路由反射器…

人工智能 2023年6月28日
00113
【图像处理】PyTorch实战之CIFAR10数据集分类（LeNet分类器）

首先这是一个官方demo， PyTorch官网入门实现一个图像分类器下图是卷积，池化，全连接层在神经网络中的作用（分工）本文是学习B站深度学习与图像处理的up做的笔记本文参考主要如…

人工智能 2023年6月18日
0098
datasets Dataset类（1）

datasets.Dataset( arrow_table: Table, info: Optional[DatasetInfo] = None, split: Optional[…

人工智能 2023年7月7日
0064
yolov5数据集

如果想跳过步骤直接获取YOLOv5格式的kitti数据集评论获取阿里云盘提取码我们再yolov5/dataset下创建文件夹kitti再kiiti中放入我们的数据数据集结构…

人工智能 2023年6月29日
00123
手把手教你安装torch_geometric库（pyg）

正常步骤： 1.在安装前要检查电脑的上的torch和cuda版本 import torch; print(torch.version)检查torch版本； import torch…

人工智能 2023年7月21日
0072
TransUnet官方代码测试自己的数据集（已训练完毕）

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 首先参考上一篇的训练过程，这是测试过程，需要用到训练过程的权重。 1. TransU…

人工智能 2023年6月16日
0082
易景智慧驾考三维可视化系统方案－易景智能驾考系统

随着我国人民生活水平的提高，汽车出行已经成为人们生活中必不可少的一部分，而驾照则时驾车出行的前提。目前市场上的驾校机构众多，质量参差不齐，管理不规范，效率不高。如何提高服务质量，保…

人工智能 2023年6月4日
0093
建立私人知识网站并用cpolar内网穿透发布 1-2

系列文章建立私人知识网站并用cpolar内网穿透发布 1-2 建立私人知识网站并用cpolar内网穿透发布 2-2 维基百科（wiki）相信大家都有所耳闻，作为全球最有名的百…

人工智能 2023年6月26日
0070
ERROR: Could not build wheels for pycuda, which is required to install pyproject.toml-based projects

在安装pycuda时一直出错，比如我遇到的报错： ERROR: Failed building wheel for pycudaFailed to build pycudaERRO…

人工智能 2023年6月23日
0095
Ubuntu 安装 C++ opencv 和opencv_contrib (主要记录出现的问题以及解决方法)

git clone -b 3.4.10 https://gitee.com/mirrors/opencv.git git clone -b 3.4.10 https://gitee…

人工智能 2023年7月19日
0063
安装Pytorch-gpu版本（第一次安装或已经安装Pytorch-cpu版本后）

由于已经安装了cpu&am…

人工智能 2023年6月23日
0095
OpenCV学习笔记(5)_ ellipse绘制函数浅析

OpenCV学习笔记(5)_ ellipse绘制函数浅析文章目录 OpenCV学习笔记(5)_ ellipse绘制函数浅析 * 1. ellipse第一种重载——绘制椭圆弧 &#…

人工智能 2023年5月28日
00100
【吴恩达深度学习】04_week3_quiz Detection algorithms

(1)You are building a 3-class object classification and localization algorithm. the classe…

人工智能 2023年7月10日
0069
Python 离散小波变换（DWT） pywt库

文章目录 * – + 一、小波变换 + * 离散小波变换函数 + 二、Haar 变换 + * 2.1 一维Haar变换 * 2.2 二维离散小波变换 * 2.3 pyw…

人工智能 2023年7月6日
00136
有监督和无监督

来自有监督vs.无监督，傻傻分不清楚？ – 搜狐网网上对于有监督和无监督差异性的文章非常多，本文将重点从应用的角度来阐述如何选择有监督和无监督。对比一：有标签 vs….

人工智能 2023年5月31日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31