数据描述:我有一些样本,每个样本都具备两个标签,记作(A,B),其中A是发生时间(eg:2020/6/10);B表明是否有参加过某活动,B的取值只有两个,即(有/没有)。
问题:这些样本中,“有”参加过活动的样本会扎堆出现,在某个时间段出现很频繁,但在其他时间段很少出现或不出现。我的问题是,想知道有参加过活动(B取值“有”时)的样本,他们在时间轴上,集中出现过几次。
我觉得有可能使用聚类解决这个问题,但是聚类我一点不懂,不用聚类都可以,只要能解决这个问题就行。麻烦告诉我具体做法,越详细越好,对这方面我一点都不懂
万分感谢!!