|
熵值法,这个是我学的第一模型,虽然后面的模型学的越来越多,但是对第一个情有独钟。志在参与,币随意。
熵值法步骤:
1.基本原理:
在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也就越大。根据熵的特性,我们可以通过计算熵值来判断一个事件的随机性及无序程度
也可以利用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大。
2.熵值的步骤:
(1)选取n个病例,m个指标,则xij为第i个病例的第j个指标的数值。
(2)计算第j个指标下的第i个病例占该指标的权重
p_ij=xij/(sum_{i=1}^n(x_ij))
(3)计算第j个指标的熵值
e_j=-ksum_{i=1}^m(p_{ij})ln(pij)其中,k>0k=1/ln(n).e_j>=0
(4)计算第j项指标的差异系数,对于第j项指标,指标值的差异越大,对方案评价的作用越大,熵值就越小
定义差异系数:
g_i=(1-e_j)/(m-E_e)式中E_e=sum(e_j) 0=<g_j<=1 sum(g_j)=1
(5)求权数
w_j=g_j/sum(g_j)(1=<j<=m)
数据的非负数化处理:
X_ij=Xij-min(xij)/(max(xij)-min(xij))
|