背景资料如下:
sku_id user_id request_time c
bac4xx 000e05 30mar2018 11:25:59 3
bac4xx 000e05 30mar2018 11:25:24 3
3b23xx 000e05 30mar2018 11:00:17 3
如上所示,我想计算的是一个user一共点击了多少个不同的sku,但是由于有个不同的request time,这个例子里我只能做出来是3,但我需要的应该是2(因为这个人点同一个sku点了两次),我使用的命令如下:
bysort user_id: egen c=count(sku_id)
bysort c: gen number=_N
我想请教各位的是,如何在不缺失request time的情况下能够计算出一个user点击了多少个不同的sku呢?谢谢大家!