楼主: 坏半半
6195 5

[一般统计问题] 如何检测多列变量之间的相似度? [推广有奖]

  • 1关注
  • 0粉丝

硕士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
29447 个
通用积分
2.7000
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
2695 点
帖子
108
精华
0
在线时间
146 小时
注册时间
2010-1-8
最后登录
2024-12-6

楼主
坏半半 发表于 2013-5-11 05:19:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这个问题很简单,但是不知道如何用stata来实现,例子如下:

Y                             x1                              x2                         x3
1                              1                                 1                           0
1                              0                                 1                           1
1                              1                                 1                           0
1                              1                                 1                           0
1                              0                                 0                           1
这样数据少的时候,我们可以直观发现,x1与Y的相似度是60%,x2是80%,x3是40%。

如果数据多的时候,比如x10000存在时,可否用stata直接计算输出Y与每个X之间的相似度

求高人指点,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相似度 Stata 求高人指点 tata 高人指点 检测 如何

沙发
坏半半 发表于 2013-5-11 22:04:22
自顶,这个不容易实现么??求指教!

藤椅
蓝色 发表于 2013-5-11 22:15:54
没有标准和定义怎么算?
Y.  X
1.   2
2.   0
1.   3
你说上面相似度是多少

板凳
蓝色 发表于 2013-5-11 22:19:04
y x
1 2
2 1

同样问题,
没有规则,没有定义
就说算什么,我是不知道怎么说

报纸
坏半半 发表于 2013-5-12 02:21:14
蓝色 发表于 2013-5-11 22:15
没有标准和定义怎么算?
Y.  X
1.   2
抱歉啊版主,是我的说明太少了。我前面加个ID,

ID    Y    X1    X2
1      1     1     0
2      1     1     0
3      0     0     1
4      1     1     1
5      1     0     1
固定ID内做比较两列变量,那么Y和X1相似度是80%,因为ID1-4他们的值都相同;Y和X2相似度是40%,因为只有ID4和5他们的值相同。

最近表述能力差,希望你能理解,多谢!

地板
蓝色 发表于 2013-5-12 11:36:08
gen d1=(y==x1)
tab d1

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 02:51