问题如下,第一,基于《中国城市统计年鉴》计算区位熵,这里全国的口径到底是什么?是指《中国城市统计年鉴》里的城市合计(由于行政调整,每年城市都会有部分调整,所有个数不太会保持一致,但总数肯定超过285个)还是指自己研究需要用到的地级市的城市合计呢,比如285个或者233个地级市?
第二,如果这里是指《中国城市统计年鉴》里的所有城市合计,则Ej就应该是城市年鉴里某个产业的从业人员总数,而E应该是所有城市所有产业的从业人员数,我核对了2014年中国城市统计年鉴,发现年末单位从业人员数=第一产业从业人员数+第二产业从业人员数+第三产业从业人员数=农、林、牧、渔业+采矿业+制造业+。。。。。。+公共管理和社会组织;又核对了2007年《中国城市统计年鉴》发现第一产业+第二产业+第三产业从业人员数=农、林、牧、渔业+采矿业+制造业+。。。。。。+公共管理和社会组织,年末单位从业人员数与三产产业人员数之和相差1万人;这里就存在计算区位熵的不同算法了,一种是按照所有城市合计里的三产就业人数之和以及某个城市某个产业就业人数的合计数计算;一种是计算285个地级市中每个城市某一个产业的区位熵的时候,这里的全国所有产业的就业人数对应的是否应该是加总285个城市三次产业就业人数之和或者某个产业285个城市的就业人数之和;我在人大经济论坛里发现有学友计算总的就业人口的时候还用年末单位从业人员数+城镇私营和个体从业人员的和表示所有产业的就业人员,但我理解这样计算是不是不对,因为口径不一致,但到底科学的计算方法是什么,我也不知道怎么算,感觉算法不同得出的结论应该不同,因为这个区位熵只是最终计算指标的一个中间指标,所以很希望有群友帮忙解答一下,这个区位熵计算已经折磨我好几天了,希望有热心的群友给解答一下,非常感谢!!区位熵公式以及2014年中国城市统计年鉴三个类别就业人数截图: