当下需要找到观测疫情感染情况的代理变量。自“新10条”以后,在“非必要不核酸”的倡议下,整体核酸检测强度不及过去,因此在样本发生变化的前提下,通过数据对比所得出的结论可信度下降。
搜索指数的拐点对判断感染数的拐点具有一定的参考意义。以关键词搜索指数作为代理变量是一个较普适的做法,有诸多学术论文均采用了该方法。并且2022年以来,谷歌搜索指数的峰值对于中国台湾、中国香港的确诊峰值是领先或同步的;而百度指数对于2020年全国疫情确诊病例、2022年上海疫情确诊病例也具有前瞻性。
我们建立了搜索指数的跟踪体系来观测疫情感染变化。以“发烧”为主要关键词,目前全国新冠与发烧的百度搜索量抬升迅速,均创下2020年以来最高,后续需要跟踪观察其拐点出现,且当前全国31个省市中有30个省市的搜索量均创7日内新高。由于石家庄、北京等市是搜索量最早出现上升的几个地方,因此其很可能会最先出现拐点,目前北京、石家庄、保定从峰值明显回落。
如何预测感染的峰值?判断峰值的话可以有如下两种判断方法:一是预测搜索量从抬头到峰值的天数,二是预测超额感染的量级。12月上旬,北京、河北、甘肃等省市每万人发烧搜索量位居前三。我们选取北京、河北下辖的搜索量较高的两市石家庄、保定作为样本进行分析,从抬头到峰值平均在18天;另外爬坡阶段的累计搜索量按照11月上旬的日均搜索量平均需要78天时间。我们对2021年GDP前10的城市进行分析,目前杭州、苏州、南京等地可能仍在爬坡阶段。
风险提示:搜索量可能并不能代表真实确诊数据;搜索网站算法调整等


雷达卡




京公网安备 11010802022788号







