如果对本版的数据分析感兴趣,请先参阅之前的帖子哈:
1.数据交流中心版块发帖的统计分析
2.本版发帖量Top10坛友名单(截止2014年12月27日晚10点)
3.数据交流中心2014-2015主题帖发帖分析
一、我们最关注的帖子
当有一条新的主题帖发出来后,点或者不点,鼠标就在那里,如果我们点了,或多或少说明我们是关心这条帖子的内容的。所以,我们以查看次数作为依据,来定义最关注的帖子。截止统计时间与数据交流中心2014-2015主题帖发帖分析 中的时间相同。以下是2014至2015年发的帖子查看数目排在前20位的,这些帖子都在比较短的时间内,查看次数超过了1万。如果感兴趣,我们已经设置了超链接,方便大家查看。
一个帖子有吸引力,标题好,有内容是基本条件。至于怎么样算是标题好,怎么样的帖子算是有内容,欢迎大家讨论哈!
二 、我们关注的内容有哪些?
从查看数目最多的帖子看过来,总觉得有点粗糙。心里有个小小的疑问——这两年,大家都在忙些什么呢?
我们利用分词技术,对发帖的标题进行了处理。最终得到这么一个表格:
从中,我们依然可以看出,统计年鉴依然是我们最关注的内容,其次是中国的数据,因为是2014到2015年发的帖子,所以2013,2014的年鉴出来了,发得要多一些。在前60的词汇中,我们还能看到城市,全国,人口,世界,省,工业,科技等排名也比较靠前。很奇怪的时,作为专有名词的投入产出表,竟然也能挤进前60.
以上的统计,只是给大家作个参照哈。做得比较粗糙。
三、可视化手段
下方是词云图,把第二部分的表格换了一种表达方式。结论是不变的。


雷达卡








京公网安备 11010802022788号







