我在用人口进行抽样,使用的人口数据是10年普查数据,用上海市举例,如图
在抽样时使用随机数抽样,将上海市各个行政区的人口降序(为何是降序)排列,并且计算出累积人口数,然后根据生成的随机数抽取行政区
我的问题是:
1.为什么要计算出人口间隔
2.在随机数这一块,遇到两种计算方法,其一,计算出人口间隔,用randbetween(1,人口间隔计算);其二,生成一个0-1的随机数,用总人口*随机数,得到最终随机数。我想知道两种计算方式有何差别,使用时是否有前提条件
3.在抽上海时遇到了问题,前两个随机数都包含在第一个行政区了,不知道应递推还是抽同一行政区
4.如图所示,卢湾区现在其实已经并入黄浦区了,但是因为使用10年的人口数据,还是有卢湾区。如果抽中,是否要标注情况,并抽选黄浦区
5.在抽样时往往要抽街道和居委会,每次都需要去统计局网站找到具体街道和居委会复制粘贴,再抽样,不知是否有更为省时的方法
(发帖前又用randbetween试了一下,发现这次生成的随机数不会包含在同一个行政区了,但是问题还在,还是希望大家能够帮助解答)
因之前的同事都已离职,没有准确的说法与答案,所以请求大家帮助,先在此谢过~!