对于包含多源自变量的评价模型,常使用评价公式:
[math]y = \omega_1x_1 + \omega_2x_2 + … + \omega_nx_n[/math]
为求出其中的权重[math]\omega_i[/math],并计算出综合评分[math]y[/math],常用层次分析法、熵权法,或CRITIC权重法等,本文将介绍其中的熵权法。
熵权法的原理
熵权法(Entropy Weight Method )是一种客观赋权方法(客观 = 数据本身就可以告诉我们权重)。依据的原理:指标的变异程度越大,事件发生概率越低,信息熵(事件发生的不确定性)越高,应当给予的关注(即权重)也应该越高。
数据标准化
1.正向指标: [math]x’_{ij} = \frac{X_{ij} – \min(X_{1j}, X_{2j}, \ldots, X_{nj})}{\max(X_{1j}, X_{2j}, \ldots, X_{nj}) – \min(X_{1j}, X_{2j}, \ldots, X_{nj})}[/math]
2.负向指标: [math]x’_{ij} = \frac{\max(X_{1j}, X_{2j}, \ldots, X_{nj}) – X_{ij}}{\max(X_{1j}, X_{2j}, \ldots, X_{nj}) – \min(X_{1j}, X_{2j}, \ldots, X_{nj})}[/math]
求各指标在各方案下的比值
假设有 n 个要评价的对象,m 个评价指标,计算第 j 项指标下第 i 个对象所占的比重,将其看作相对熵计算中用到的概率。
[math]y_{ij} = \frac{x’_{ij}}{\sum_{i=1}^{m} x’_{ij}} \quad (i = 1,2,\ldots,n; \, j = 1,2,\ldots,m)[/math]
求各指标的信息熵
对于第[math]j[/math]个指标而言,其信息熵的计算公式为:
[math]e_j = -\frac{1}{\ln m} \sum_{i=1}^{m} y_{ij} \ln y_{ij}[/math]
确定各指标的权重
[math]\omega_j = \frac{1 – e_j}{m – \sum_{j=1}^{m} e_j}[/math]
计算综合评分
[math]S_i = \sum_{j=1}^{n} y_{ij} \omega_{ij}[/math]
总结
- 当已知各个指标的数据,想依据指标的差异程度来求各指标的权重时,熵权法是一个不错的选择。
- 熵权法是一个基础的常用评价模型,在美赛 E 和 F 题的 O 奖论文中十分常见,通常出现在第一问,因为评价模型是整个问题分析的基础。
- 比赛中,常用 SPSSPRO 来实现熵权法,已经足够用了,不需要用 MATLAB 或者 Python 运行代码,效率太低。
- 由于 SPSSPRO 上的熵权法会自动实现指标的正向化和负向化处理,所以在软件操作中不需要进行数据预处理,直接在熵值法中代入数据就行,但在论文中需要写清楚正向化和负向化处理的公式和解释。
- 在论文写作中,可以依葫芦画瓢,按照 O 奖论文的写法,根据相应的题目,修改变量说明即可,公式可以直接照搬,因为比赛只会对文字查重,不会对公式和图片查重。
- 熵权法的缺点:忽略了指标本身重要程度,有时确定的指标权重会与预期的结果相差甚远,同时不能减少评价指标的维数。所以在 O 奖论文中,会发现该方法还需要跟其他评价方法(如层次分析法)联合使用,来弥补自身的不足。
不要说愿不愿意
我不会因为这样而哭泣