制作流程:
1、数据获取与处理:从NASA下载经过校正的VNP46A2日度夜间灯光数据,解析HDF5格式文件,获取数据量约4T的500米分辨率的夜间灯光数据。
2、数据清理:剔除因云层、极端事件等导致的数据异常,确保对照网格数量充足,并剔除观测不足的记录。
3、公司位置定位与数据提取:通过百度API匹配上市公司地址经纬度。根据上市公司地址的经纬度,定位到相应网格,通过ArcGIS的提取值至表工具提取该网格及周边8个网格的夜间灯光亮度。
4、时间维度比较:将上市公司所在网格在法定节假日的灯光亮度的中位数作为基准,若某日亮度超过基准,可能表明夜间加班,并剔除法定节假日有效观测值不足5天的数据。
5、空间维度比较:将上市公司周边网格的灯光亮度的中位数作为基准,若某日亮度超过周边网格,可能表明夜间加班,并剔除周边网格灯光有效值小于3个的数据。
6、超时加班判定:同时满足时间和空间维度标准时,认定为超时加班,1为加班,0为不加班。
7、年度加班表:整理每天各公司的加班情况整理成年度加班吧并新增三个字段“OTyear”、“OTnorm”、“OTwend”,其含义分别是:
ü OTyear(全年除法定节假日的加班比例)=除法定节假日的加班天数/当年有数据的总天数-法定节假日
ü OTnorm(工作日加班比例)=工作日加班天数/工作日总天数
ü OTwend(周末加班比例)=周末加班天数/周末总天数
数据格式为xlsx,包含
year | 中文全称 | 股票代码 | 办公地经度 | 办公地纬度 | 所属省份 | 所属城市 | 加班天数 | 不加班天数 | OTyear | OTnorm | OTwend |


雷达卡




京公网安备 11010802022788号







