计算方法
COMPUTING METHOD

指数计算工作主要分三部分。 第一部分为数据预处理,包括标准化处理、缺失值插补等。 第二部分为指标权重计算,采用了两种计算方法。其中,一级指标的权重通过综合专家意见进行确定,二级指标和三级指标的权重通过熵值法确定。 第三部分为加总计算,采取两种计算方法。其中,数字生态总指数与一级指标采用几何加权平均的方式进行计算,体现子指标之间的均衡性,二级指标采用算术加权平均的方式进行计算,体现子指标之间的可替代性。

本报告将合作机构的分指数测量指标线性归一化到10-100 之间以便于对比,对于部分缺失值数据,结合经济统计样本数据通过线性回归进行填补。为体现子指标权重的客观性与科学性,对二级和测量指标采用熵值法确定权重,一级指标采用专家打分法确定权重。数字生态总指数与一级指标得分采用几何加权平均的方式计算,体现子指标发展均衡性。二级指标得分采用算术加权平均的方式进行计算,体现子指标间的可替代性。

具体计算步骤如下:

数据归一化:数据使用Min-Max 方法统一归一化到10-100:

熵值权重法:采用熵值法来确定二级指标和测量指标的权重,指标的离散程度越大,其熵值越

小,权重越大,则该指标对综合评价的影响越大。在指标聚合中,先将各个指标进行归一化处理:

将每个指标转换为一个离散概率分布,计算该概率分布的熵值来判断此指标的离散程度,并利用熵值计算公式的上限,将其归一化:

进一步,将各个指标的熵再转化为权重:

指数聚合方法:总指数和一级指标得分使用几何加权平均的方式如下进行计算:

北京大学大数据分析与应用技术国家工程实验室 版权所有
渝ICP备2021010332号-1