数据包络分析（DEA）详解（以第八届宁夏省赛为例）

2023年6月17日上午12:25 • 人工智能 • 阅读 98

一、基本介绍

1.1原理

数据包络分析有多种模型，主要为：CCR模型，BBC模型、交叉模型、A&P模型。纵观该方法的各种模型，每一模型的具体数学推理过程基本一致，所得的标准线性规划求解公式也比较相似，它们之间的差异主要体现在每个模型所适用的条件有所不同。在国外，此方法较早地运用于银行医院、城市等方面效率的评价。近些年来，该方法在我国社会经济的许多领域也取得了不少应用成果。由于方法对评价对象的要求相对比较宽松，应用其评价相同类型DMU的相对有效性的优势地位，是其他方法难以取代的。

1.2CCR模型

CCR模型是指对DMU通过”投入一定数量的生产要素，并产出一定数量的产品”的经济系统来判断各个单元的相对合理性和有效性。从投入资源的角度来看，在当前产出的水准下，比较投入资源的使用情况，以此作为效益评价的依据，这种模式称为”投入导向模式”。

定义决策单元j的效率评价指数为：

对上式可以适当的取权系数v和u，使得

，对第

个决策单元进行效率评价，一般来说

越大表明

能够用相对较少的输入而取得相对较多的输出。故只需求得的最大值，即可探究

在这n个DUM中相对来说是不是最优的。

1.3BCC模型

BCC模型是从产出的角度探讨效率，即在相同的投入水准下，比较产出资源的达成情况，这种模式称为”投入导向模式”。所得到的是”技术效益”，DEA=1称为”技术有效”，最优解

是决策单元j的”技术效益”。

二、代码

2.1MATLAB代码

clear
clc
format long
data=[14.40 0.65 31.30 3621.00 0.00
16.90 0.72 32.20 3943.00 0.09
15.53 0.72 31.87 4086.67 0.07
15.40 0.76 32.23 4904.67 0.13
14.17 0.76 32.40 6311.67 0.37
13.33 0.69 30.77 8173.33 0.59
12.83 0.61 29.23 10236.00 0.51
13.00 0.63 28.20 12094.33 0.44
13.40 0.75 28.80 13603.33 0.58
14.00 0.84 29.10 14841.00 1.00]';

X=data([1:3],:);%X&#x4E3A;&#x8F93;&#x5165;&#x53D8;&#x91CF;
Y=data([4:5],:);%Y&#x4E3A;&#x8F93;&#x51FA;&#x53D8;&#x91CF;
[m,n]=size(X);
s=size(Y,1);
A=[-X' Y'];%&#x7531;&#x4E8E;&#x76EE;&#x6807;&#x51FD;&#x6570;&#x6C42;&#x6700;&#x5C0F;&#xFF0C;&#x8FD9;&#x91CC;&#x7684;-X&#x5C31;&#x8F6C;&#x5316;&#x6210;&#x4E86;&#x6C42;&#x6700;&#x5927;
b=zeros(n,1);
LB=zeros(m+s,1);UB=[];
for i=1:n
   f=[zeros(1,m) -Y(:,i)'];
   Aeq=[X(:,i)',zeros(1,s)];
   beq=1;
   w(:,i)=linprog(f,A,b,Aeq,beq,LB,UB);%&#x524D;3&#x5217;&#x4E3A;&#x6295;&#x5165;&#x7CFB;&#x6570;&#xFF0C;&#x540E;2&#x5217;&#x4E3A;&#x4EA7;&#x51FA;&#x7CFB;&#x6570;
   E(i,i)=Y(:,i)'*w(m+1:m+s,i);%&#x4EA7;&#x51FA;&#x503C;*&#x4EA7;&#x51FA;&#x7CFB;&#x6570;
end
theta=diag(E)';
fprintf('&#x7528;DEA&#x65B9;&#x6CD5;&#x5BF9;&#x6B64;&#x7684;&#x76F8;&#x5BF9;&#x8BC4;&#x4EF7;&#x7ED3;&#x679C;&#x4E3A;&#xFF1A;\n');
disp(theta);

2.2Python代码

import gurobipy
import pandas as pd

分页显示数据, 设置为 False 不允许分页
pd.set_option('display.expand_frame_repr', False)

最多显示的列数, 设置为 None 显示全部列
pd.set_option('display.max_columns', None)

最多显示的行数, 设置为 None 显示全部行
pd.set_option('display.max_rows', None)

class DEA(object):
   def __init__(self, DMUs_Name, X, Y, AP=False):
      self.m1, self.m1_name, self.m2, self.m2_name, self.AP = X.shape[1], X.columns.tolist(), Y.shape[1], Y.columns.tolist(), AP
      self.DMUs, self.X, self.Y = gurobipy.multidict({DMU: [X.loc[DMU].tolist(), Y.loc[DMU].tolist()] for DMU in DMUs_Name})
      print(f'DEA(AP={AP}) MODEL RUNING...')

   def __CCR(self):
      for k in self.DMUs:
         MODEL = gurobipy.Model()
         OE, lambdas, s_negitive, s_positive = MODEL.addVar(), MODEL.addVars(self.DMUs),  MODEL.addVars(self.m1), MODEL.addVars(self.m2)
         MODEL.update()
         MODEL.setObjectiveN(OE, index=0, priority=1)
         MODEL.setObjectiveN(-(sum(s_negitive) + sum(s_positive)), index=1, priority=0)
         MODEL.addConstrs(gurobipy.quicksum(lambdas[i] * self.X[i][j] for i in self.DMUs if i != k or not self.AP) + s_negitive[j] == OE * self.X[k][j] for j in range(self.m1))
         MODEL.addConstrs(gurobipy.quicksum(lambdas[i] * self.Y[i][j] for i in self.DMUs if i != k or not self.AP) - s_positive[j] == self.Y[k][j] for j in range(self.m2))
         MODEL.setParam('OutputFlag', 0)
         MODEL.optimize()
         self.Result.at[k, ('效益分析', '综合技术效益(CCR)')] = MODEL.objVal
         self.Result.at[k, ('规模报酬分析', '有效性')] = '非 DEA 有效' if MODEL.objVal < 1 else 'DEA 弱有效' if s_negitive.sum().getValue() + s_positive.sum().getValue() else 'DEA 强有效'
         self.Result.at[k, ('规模报酬分析', '类型')] = '规模报酬固定' if lambdas.sum().getValue() == 1 else '规模报酬递增' if lambdas.sum().getValue() < 1 else '规模报酬递减'
         for m in range(self.m1):
            self.Result.at[k, ('差额变数分析', f'{self.m1_name[m]}')] = s_negitive[m].X
            self.Result.at[k, ('投入冗余率',  f'{self.m1_name[m]}')] = 'N/A' if self.X[k][m] == 0 else s_negitive[m].X / self.X[k][m]
         for m in range(self.m2):
            self.Result.at[k, ('差额变数分析', f'{self.m2_name[m]}')] = s_positive[m].X
            self.Result.at[k, ('产出不足率', f'{self.m2_name[m]}')] = 'N/A' if self.Y[k][m] == 0 else s_positive[m].X / self.Y[k][m]
      return self.Result

   def __BCC(self):
      for k in self.DMUs:
         MODEL = gurobipy.Model()
         TE, lambdas = MODEL.addVar(), MODEL.addVars(self.DMUs)
         MODEL.update()
         MODEL.setObjective(TE, sense=gurobipy.GRB.MINIMIZE)
         MODEL.addConstrs(gurobipy.quicksum(lambdas[i] * self.X[i][j] for i in self.DMUs if i != k or not self.AP) = self.Y[k][j] for j in range(self.m2))
         MODEL.addConstr(gurobipy.quicksum(lambdas[i] for i in self.DMUs if i != k or not self.AP) == 1)
         MODEL.setParam('OutputFlag', 0)
         MODEL.optimize()
         self.Result.at[k, ('效益分析', '技术效益(BCC)')] = MODEL.objVal if MODEL.status == gurobipy.GRB.Status.OPTIMAL else 'N/A'
      return self.Result

   def dea(self):
      columns_Page = ['效益分析'] * 3 + ['规模报酬分析'] * 2 + ['差额变数分析'] * (self.m1 + self.m2) + ['投入冗余率'] * self.m1 + ['产出不足率'] * self.m2
      columns_Group = ['技术效益(BCC)', '规模效益(CCR/BCC)', '综合技术效益(CCR)','有效性', '类型'] + (self.m1_name + self.m2_name) * 2
      self.Result = pd.DataFrame(index=self.DMUs, columns=[columns_Page, columns_Group])
      self.__CCR()
      self.__BCC()
      self.Result.loc[:, ('效益分析', '规模效益(CCR/BCC)')] = self.Result.loc[:, ('效益分析', '综合技术效益(CCR)')] / self.Result.loc[:,('效益分析', '技术效益(BCC)')]
      return self.Result

   def analysis(self, file_name=None):
      Result = self.dea()
      file_name = 'DEA 数据包络分析报告.xlsx' if file_name is None else f'\\{file_name}.xlsx'
      Result.to_excel(file_name, 'DEA 数据包络分析报告')

三、案例分析

3.1案例介绍

3.2案例分析

问题一首先要求我们对原始数据进行分析并预处理，在种类繁多的各项指标中，找到合适的投入与产出指标，构建评价体系，建立数学模型，找到对机构运营效率影响较大的关键内部指标，计算各妇幼保健机构在各分项指标及总体运营效率得分。很明显，这是一个多指标投入和多指标产出对相同类型的单位（部门）进行相对有效性或效益评价的系统分析问题，我们查阅大量文献之后选择利用数据包络分析（DEA）方法来解决该问题。

在对数据进行DEA分析之前我们要对数据进行预处理，首先对原始数据给出的各项指标进行分类，找到他们的二级指标甚至一级指标，从而划分投入指标和产出指标，之后利用Excel和Python将数据集中的错误数据进行清理，在查阅大量文献的基础上，剔除相对不重要的指标，创造出新的数据集，导入MPai数据科学平台，首先对每一年的数据集分别进行DEA分析，最后再计算技术效益、规模效益、综合技术效益的算术均值，即可解决该问题。

相对于问题一，问题二更符合实际情况，研究价值更高，毕竟研究医院管理离不开卫生经济，研究卫生经济离不开国家宏观经济，妇幼保健机构所在地区经济发展水平、人口等客观因素对其发展程度和运行效率的影响是巨大的。当前，我国宏观经济形势进入新常态，下行压力非常大。同时，人口老龄化程度加重，由于缺乏劳动力，对整个经济的发展是不利的，经济问题本质上就是人口问题，整个经济下滑了，对医疗卫生的投入就难以增加，医院的收入就难以增长，只能实行严格的医疗控费。因此，探索不同投入结构变化对最终运营效率的影响刻不容缓。

在问题一的基础上，我们首先访问各省的统计年鉴，获取相应省份医疗卫生费用占GDP的比重以及各省对于妇幼保健机构的支持程度，查阅大量文献，确定影响因子，利用优劣解距离法（TOPSIS）消除量纲的影响，对各个妇幼保健机构进行综合得分评价，从而找到不同投入结构变化对最终运营效率的影响。

通过对问题一和问题二的分析求解，我们了解到某些妇幼保健机构运行效率较低，存在明显的医疗卫生资源浪费的情况，针对于此，我们将在自身研究结果的基础上，致信相应的妇幼保健机构管理者，用报告的形式将他们暴露出来的问题直观的展现到他们面前，并给出针对性的意见，帮助他们更快、更好的解决自身资源使用，提高运行效率，充分使用医疗卫生资源。

3.3案例求解

图1 2020年妇幼保健机构效益分析图

图2 2020年妇幼保健机构象限图

差额变数分析是基于松弛变量(差额变数、超额变数)的分析，根据冗余情况进行适当减少投入冗余、增加产出不足上表展示了差额变数分析投入与产出的部分/全部的增减量，2020年各妇幼保健机构差额变数分析结果如下表3所示。差额变数:指为达到目标效率可以减少的投入量，即非DEA有效单元的实际值和目标值之差，超额变数:指为达到目标效率可以增加的产出量，即非DEA有效地区的目标值和实际值之差。

在学习中成功、在学习中进步！我们一起学习不放弃~
记得三连哦~ 你们的支持是我最大的动力！！欢迎大家阅读往期文章哈~
小编联系方式如下，欢迎各位巨佬沟通交流。

int[] arr=new int[]{4,8,3,2,6,5,1};
int[] index= new int[]{6,4,5,0,3,0,2,6,3,1};
String QQ = "";
    for (int i : index){
        QQ +=arr[i];
}
System.out.println("小编的QQ:" + QQ);

Original: https://blog.csdn.net/qq_48774513/article/details/120198871
Author: 饲养猿
Title: 数据包络分析（DEA）详解（以第八届宁夏省赛为例）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627541/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

实例讲解什么是Meta回归，怎么利用Meta回归发表文章！

Meta分析、临床数据分析一对一指导，符合学术规范，结课直接投稿，+tjzgBL哟！众所周知，阅读高质量的文献，能快速提升自己的科研能力，帮助自己快速理解一些生涩的概念。今天小编…

人工智能 2023年7月18日
00106
分数阶傅里叶变换（FrFT）详细原理与matlab代码实现

本文主要是基于Haldun M. Ozaktas, Orhan等人的论文Digital Computation of the Fractional Fourier Transfor…

人工智能 2023年6月15日
00122
2022李宏毅作业hw1—新冠阳性人员数量预测。

目录事前：一：数据读取。完整代码：二模型设计。完整代码：三训练步骤。完整的训练代码：这一部分被我放在model_utils的train模块里。四：测试和保存…

人工智能 2023年6月15日
00110
Transformer用于超分辨率重建

记录几篇Transformer的超分辨率重建论文。 1 Learning Texture Transformer Network for Image Super-Resolutio…

人工智能 2023年5月26日
0091
14、Pandas：query()函数

利用query函数可筛选、查询数据df.query(expr, inplace=False, **kwargs) 参数： -expr：查询条件，表达式 -inplace ：是否替换…

人工智能 2023年7月16日
0061
AI Studio——百度飞桨初体验

本文介绍了AI Studio的入门使用方法和基础的图形界面，旨在帮助和笔者一样的小白走好深度学习和人工智能的第一步。那么话不多说，现在发车。目录基本概要登录流程用户界面 F…

人工智能 2023年7月28日
0090
TensorFlow 2.0 model的predict()方法详解以及自定义predict实现预测数据和真实数据配对输出

TensorFlow模型训练过程中 fit()可以直接设置 validation_data为test数据集来测试模型的性能。但是通常我们要输出模型的预测值，用来绘制图形等等操作。接…

人工智能 2023年7月5日
0080
cartographer建图，重定位及发布消息结构为nav_msgs::Odometry的odom话题

完整功能包（包含carto建图，重定位以及odom话题发布）上传至https://download.csdn.net/download/zhaohaowu/33647981众所周知…

人工智能 2023年6月11日
00231
YOLOv3详解

YOLOv3详解 1. 什么是YOLO 2. 一个全卷积神经网络——Darknet-53 3. 输出 4. 锚框和预测 * 中心坐标 5.边界框维度 6. 物体分数和类置信度 7….

人工智能 2023年6月16日
0089
YOLOV7:OSError: [WinError 1455] 页面文件太小，无法完成操作的最终解决方案

目录 1.问题描述： 2.现有的解决方案（1）重启电脑（试过了，但是没用）（2）重启pycharm(成本很低，可以试一下，但是依然没用) （3）最火热的一种说法是设置num_w…

人工智能 2023年7月21日
0090
八、各种数据集的格式转换、可视化与编辑更新（以舰船检测数据集为例）

我们经常会用到一些开源数据集或第三方标注的数据，需要根据实际需求对其进行格式转换（如VOC格式转化为DOTA格式，或DOTA格式转化为ESRI Shapefile格式等）和可视化操…

人工智能 2023年7月12日
0069
Android OpenCV（七十一）：DNN 人脸检测 FaceDetectorYN

前言针对人脸检测，之前我们在 Android OpenCV（六十）：HAAR 级联分类和 Android 平台人脸检测并不复杂两篇文章中分别介绍过OpenCV 级联分类器识别…

人工智能 2023年7月19日
0055
Pytorch训练时显存分配过程探究

对于显存不充足的炼丹研究者来说，弄清楚Pytorch显存的分配机制是很有必要的。下面直接通过实验来推出Pytorch显存的分配过程。实验实验代码如下： import torch …

人工智能 2023年6月3日
0086
HMM(隐马尔科夫模型)

HMM模型基础隐马尔科夫模型（Hidden Markov Model，以下简称HMM）是比较经典的机器学习模型了，它在语言识别，自然语言处理，模式识别等领域得到广泛的应用。当然，…

人工智能 2023年5月27日
00103
基于R语言的回归分析实现

目录 1.一元线性模型 1.1绘制散点图 1.2回归参数的估计 1.3回归方程的显著性检验 1.4线性模型常用函数 2.软件实现 2.1绘制散点图 2.2计算回归 2.3做预测 2…

人工智能 2023年6月19日
0095
初学者入门知识图谱必看的能力：推理

摘要：本文从知识推理的基本概念出发，通俗易懂得介绍了知识图谱知识推理的应用和方法。本文分享自华为云社区《0基础入门知识图谱的超能力——知识推理》，作者：Cheri Chen。一…

人工智能 2023年6月1日
00104

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

数据包络分析（DEA）详解（以第八届宁夏省赛为例）

1.1原理

1.2CCR模型

1.3BCC模型

2.1MATLAB代码

2.2Python代码

3.1案例介绍

3.2案例分析

3.3案例求解

大家都在看