共200w左右新闻报道记录、含原始文本数据
可用于词频统计、情感情绪分析等自然语言处理NLP
数据来源:人民日报网站
self.old_base_url = "http://paper.people.com.cn/rmrb/html/"
self.new_base_url = "http://paper.people.com.cn/rmrb/pc/layout/"
爬取了从1946年到25年11月24日人民日报全国各地区新闻报道的数据
年份 日期 报纸版次 标题 文本内容
人民日报新闻数据库1946-202511全国各地区新闻报道年份日期报纸版次标题文本内容的网盘链接.docx
(36.36 KB, 需要: RMB 99 元)
(近3GB数据的网盘链接)


雷达卡




京公网安备 11010802022788号







