楼主: 虾滑真好吃
1737 2

[数据管理求助] 请问如何在统计了某个变量出现次数后,对其进行处理? [推广有奖]

  • 0关注
  • 0粉丝

大专生

25%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
465 点
帖子
10
精华
0
在线时间
75 小时
注册时间
2020-3-11
最后登录
2023-8-3

楼主
虾滑真好吃 发表于 2020-5-10 00:31:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
题目不太能准备表达,具体来看,是我的dataset里有用户的id和sku的id,我现在已经利用egen对每个user点击每个sku的次数进行了统计,代码如下:
by user_id sku_id: egen c=count(request_time)

我现在做出来的结果能够显示每个user点击每个sku的次数,但是问题是我希望它们在一个user和一个sku的情况下只出现一次,这种应该如何处理呢?比如说用户a对sku1点击了两次,我的数据里就有两行
user_id   sku    request_time    count
a             1                13:00        2
a             1                 13:01       2

现在我想让那个2只出现一次,应该如何处理呢?求各位指点,感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Request dataset Quest Count DataS

回帖推荐

蓝色 发表于2楼  查看完整内容

沙发
蓝色 发表于 2020-5-10 10:04:56
  1. collapse (count)  c=request_time,  by(user_id sku_id)
复制代码

藤椅
虾滑真好吃 发表于 2020-8-16 22:56:35
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str10 sku_id str19 request_time double orderdate
  4. "000aa92b82" "2018-03-08 12:43:06" .
  5. "000aa92b82" "2018-03-19 09:10:59" .
  6. "000aa92b82" "2018-03-08 18:55:08" .
  7. "000aa92b82" "2018-03-03 15:29:53" .
  8. "000aa92b82" "2018-03-13 18:19:27" .
  9. "000aa92b82" "2018-03-25 18:55:40" .
  10. "000aa92b82" "2018-03-23 18:32:36" .
  11. "000aa92b82" "2018-03-24 16:01:12" .
  12. "000aa92b82" "2018-03-25 17:26:17" .
  13. "000aa92b82" "2018-03-07 08:18:03" .
  14. end
  15. format %td orderdate
复制代码



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 12:45