熵值法综合评判阐发流程
熵值法综合评判阐发流程
一、案例布景
当前有一份数据,是各品牌车各个维度的得分情状,如今想要利用熵值法停止综合评判,得到各品牌车的综合得分,从而停止车型好坏比照,为消费者供给购车根据。
数据如下(数据虚构,无现实意义):
二、数据处置
利用熵值法停止阐发,需要对数据停止处置,包罗数据标的目的处置和数据量纲处置。
(1)标的目的处置
当数据标的目的纷歧致时,需要停止标的目的处置,消弭数据标的目的差别的影响。数据根据标的目的差别,可分为正向目标和负向目标,正向目标是指数据越大越好的目标,好比GDP;负向目标是指数据越小越好的目标,好比空气污染指数。停止标的目的处置就是将正向目标停止正向化处置、负向目标停止逆向化处置,如许处置后,数据标的目的就完全一致了。
案例中车辆的油耗、费用,关于消费者来讲,一般期看越小越好,故那2个目标为负向目标,需要停止逆向化处置;而车辆的功率、平安性、庇护性、操做性,一般都期看越大越好,那4个目标为正向目标,需要停止正向化处置。
SPSSAU中能够利用生成变量-正向化/逆向化处置功用,操做如下:
上图展现了负向目标逆向化处置操做,正向目标正向化处置操做同上。
(2)量纲处置
消弭数据标的目的的影响后,还需要消弭因为数据单元差别形成的影响,即停止量纲处置,SPSSAU供给十几种量纲处置办法,那里选举利用数据回一化停止处置。
本案例因为上述阐发中已经停止了正向/逆向此两种处置,而正向/逆向化处置可同时处理标的目的和量纲问题,所以不需要再次停止回一化处置。数据处置完成之后,接下来停止熵值法阐发。
三、熵值法阐发
熵值法是客看赋权法傍边的一种,熵值是对不确定性的一种度量。熵值法用以确定目标权重的根据是各项目标在数值层面的变异水平,因为对客看数据有着高度依靠,熵值法的运用过程中制止了报酬因素对目标权重成果可能形成的误差。熵值法操纵信息熵计算出各目标的权重值,为多目标综合评判供给根据。
将处置好的数据,利用SPSSAU熵值法停止阐发,阐发前勾选【综合得分】,SPSSAU会在阐发时主动保留各变量的综合得分,最初用于综合评判。阐发前还需要勾选【非负平移】,原因在于熵值法计算过程中,含有对数运算,而当数据存在0或负数时,无法停止对数运算,所以SPSSAU供给非负平移功用,假设数据小于等于0,此时平移单元为:最小值的绝对值+0.01,包管数据全数为正数可一般计算。SPSSAU操做如下:
熵值法计算权重成果如下表:
从上表能够看出,利用熵值法计算得到功率、平安性、庇护性、操做性、油耗、费用的权重值别离为0.153, 0.118, 0.130, 0.257, 0.137, 0.206。
熵值法计算公式:
(1)信息熵值e
①计算第j项目标下第i个样本值占比重
②计算各目标的信息熵(列)
此中,k=1/ln(n);
(2)信息效用值d
(3)权重系数值w
得到的权重值,将用于后续综合得分计算。
四、综合得分
(1)综合得分的意义
综合得分是熵值法用于最末综合评判的决定性目标。得到各目标权重后,将各目标数据与对应的权重相乘后停止累加,即为“综合得分”。综合得分可用于权衡各样本的综合程度,综合得分越高的样本越优良。
那个目标其实不需要手动计算,因为在阐发前,勾选了【综合得分】,所以SPSSAU会主动完成计算并保留到【我的数据】中。
(2)好坏比照
SPSSAU生成的综合得分数据如下:
阐发人员将数据下载至当地,将综合得分停止排序,停止样本之间的好坏比照。也可利用SPSSAU生成变量中的Rank排名功用,对综合得分停止排名。操做如下:
最末,将数据下载后利用Excel整理得到各品牌车综合得分排名如下:
从阐发成果来看,本次参与阐发的7辆品牌车,综合得分更高的为车辆6,综合得分更低的为车辆5。阐明车辆6在那7辆车中各方面维度是更优的,最差的是车辆5。
六、总结
本次阐发利用熵值法对7类品牌车辆停止综合评判,在停止熵值法阐发之前,起首对数据停止了标的目的处置和量纲处置,消弭因为标的目的不同一和单元不同一的影响。然后利用SPSSAU停止熵值法阐发,得到各目标权重值以及各样本综合得分值,颠末对综合得分停止排名比照,得到各方面更优车辆为车辆6,最差的为车辆5,阐发完毕。