楼主: fujingchi
6467 3

[数据管理求助] STATA能否实现统计满足条件的观测数量的功能? [推广有奖]

  • 0关注
  • 0粉丝

大专生

76%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
491 点
帖子
50
精华
0
在线时间
42 小时
注册时间
2014-7-23
最后登录
2015-8-31

楼主
fujingchi 发表于 2014-8-10 09:47:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想解决的问题是这样的:有一数据文件
VAR1       VAR2       ……
1                A
1                B
1                C
2                B
2                D
3                E
……
相同的VAR1值对应的VAR2值是不重复的(因为我事先去除了重复项)。
该文件中数据总量很大,有几万条。VAR2中的不同值有几百个。
我想统计数据中带权重的A\B\C……出现的次数和(表示各种VAR2值的重要性)。即在上面的6组数据中A出现的次数记为1/3=0.3333,B为1/3 + 1/2=0.83333

在EXCEL中我利用公式是可以实现的,但由于数据量过大,处理起来十分缓慢(所有公式计算一次需10小时!!)。所以我想请教大家,能否用STATA实现。EXCEL中我的处理思路是,生成下面的表格,行变量是不重复的VAR1值,列变量是不重复的VAR2值。利用COUNTIFS公式计算表中各个值,各列的和就是我需要的统计量了。
         A               B                 C               D  ……
1
2
3
4
……
     A列求和   B列求和 ……

诚心求教各位高手,如何利用STATA实现上述功能,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata COUNTIF EXCEL Count 统计

沙发
ermutuxia 发表于 2014-8-11 11:18:56
duplicates tag var1,gen(count1)
replace count1=count1+1
gen quan=1/count1
by var2,sort : egen var3=sum(quan)

藤椅
fujingchi 发表于 2014-8-12 11:12:07
ermutuxia 发表于 2014-8-11 11:18
duplicates tag var1,gen(count1)
replace count1=count1+1
gen quan=1/count1
方法可行,非常感谢!

板凳
ermutuxia 发表于 2014-8-12 13:18:20
fujingchi 发表于 2014-8-12 11:12
方法可行,非常感谢!
不客气

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-3 11:36