【建模算法】熵权法(Python实现)
熵权法是通过寻找数据本身的规律来赋权重的一种方法。
熵是热力学单位,在数学中,信息熵表示事件所包含的信息量的期望。根据定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其熵值越小,指标的离散程度越大,该指标对综合评价的影响(权重)越大。
熵本源于热力学,后由申农(C. E. Shannon)引入信息论,根据熵的定义与原理,当系统可能处于几种不同状态,每种状态出现的概率为p i ( i = 1 , 2 , . . . , m ) p_i(i=1,2,…,m)p i (i =1 ,2 ,…,m ),则该系统的熵就可定义
e = − 1 l n m ∑ i = 1 m p i l n p i . e=-\frac{1}{lnm}\sum^m_{i=1}p_ilnp_i.e =−l n m 1 i =1 ∑m p i l n p i .
熵权法是一种客观赋权方法。在具体使用过程中,熵权法根据各指标的变异程度,利用信息熵计算出各指标的熵权,从而得出较为客观的指标权重。
一、问题描述
请根据下表给出的10个学生8门课的成绩,给出这10个学生评奖学金的评分排序。
表1:学生成绩表
; 二、熵权法的评价步骤
设有n n n个评价对象,m m m个评价指标变量,第i i i个评价对象关于第j j j个指标变量的取值为a i j ( i = 1 , 2 , . . , n ; j = 1 , 2 , . . , m ) a_{ij}(i=1,2,..,n;j=1,2,..,m)a i j (i =1 ,2 ,..,n ;j =1 ,2 ,..,m ),构造数据矩阵A = ( a i j ) n × m A=(a_{ij})_{n\times m}A =(a i j )n ×m 。
基于熵权法的评价方法步骤如下:
(1)利用原始数据矩阵A = ( a i j ) n × m A=(a_{ij}){n\times m}A =(a i j )n ×m 计算p i j ( i = 1 , 2 , . . . , n , j = 1 , 2 , . . . , m ) p{ij}(i=1,2,…,n,j=1,2,…,m)p i j (i =1 ,2 ,…,n ,j =1 ,2 ,…,m ),即第i i i个评价对象关于第j j j个指标值的比重
P i j = a i j ∑ i = 1 n a i j , i = 1 , 2 , . . . , n , j = 1 , 2 , . . . , m P_{ij}=\frac{a_{ij}}{\sum^n_{i=1}a_{ij}},i=1,2,…,n,j=1,2,…,m P i j =∑i =1 n a i j a i j ,i =1 ,2 ,…,n ,j =1 ,2 ,…,m
(2)计算第j j j项指标的熵值
e j = − 1 l n n ∑ i = 1 1 P i j l n P i j , j = 1 , 2 , . . . , m e_j=-\frac{1}{lnn}\sum^{1}{i=1}P{ij}lnP_{ij},j=1,2,…,m e j =−l n n 1 i =1 ∑1 P i j l n P i j ,j =1 ,2 ,…,m
(3)计算第j j j项指标的变异系数
g j = 1 − e j , j = 1 , 2 , . . . , m g_j=1-e_j,j=1,2,…,m g j =1 −e j ,j =1 ,2 ,…,m
对于第j j j项指标,e j e_j e j 越大,指标值的变异程度就越小。
(4)计算第j j j项指标的权重
w j = g j ∑ j = 1 m g j , j = 1 , 2 , . . . , m w_j=\frac{g_j}{\displaystyle \sum^m_{j=1}g_j},j=1,2,…,m w j =j =1 ∑m g j g j ,j =1 ,2 ,…,m
(5)计算第i i i个评价对象的综合评价值
F i = ∑ j = 1 m w j p i j F_i=\sum^m_{j=1}w_jp_{ij}F i =j =1 ∑m w j p i j
评价值越大越好。
三、求解结果
指标变量x 1 、 x 2 、 . . . 、 x 8 x_1、x_2、…、x_8 x 1 、x 2 、…、x 8 分别表示学生的语文、数学、物理、化学、英语、政治、生物、历史成绩。用a i j a_{ij}a i j 表示第i i i个学生关于指标变量x j x_j x j 的取值,构造数据矩阵A = ( a i j ) 10 × 8 A=(a_{ij})_{10\times 8}A =(a i j )1 0 ×8 。
利用Python程序,求得的各指标变量的权重值见表2,各个学生的综合评价值及排名次序见表3。各个学生评价值从高到低的次序为:
9 1 3 7 6 5 4 10 8 2.
import numpy as np
import pandas as pd
data = pd.read_excel('stu_data.xlsx')
label_need=data.keys()[1:]
df=data[label_need]
a=np.array(df)
[n, m]=a.shape
cs=a.sum(axis=0)
P=1/cs*a
e=-(P*np.log(P)).sum(axis=0)/np.log(n)
g=1-e
w = g / sum(g)
F = P @ w
print("\nP={}\ne={}\ng={}\nw={}\nF={}".format(P,e,g,w,F))
print('各个学生评价值从高到低的次序为:')
print(np.argsort(-F)+1)
Original: https://blog.csdn.net/baidu/article/details/125104966
Author: 果州做题家
Title: 【建模算法】熵权法(Python实现)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/732026/
转载文章受原作者版权保护。转载请注明原作者出处!