这个问题很简单,但是不知道如何用stata来实现,例子如下:
Y x1 x2 x3
1 1 1 0
1 0 1 1
1 1 1 0
1 1 1 0
1 0 0 1
这样数据少的时候,我们可以直观发现,x1与Y的相似度是60%,x2是80%,x3是40%。
如果数据多的时候,比如x10000存在时,可否用stata直接计算输出Y与每个X之间的相似度
求高人指点,多谢!


雷达卡




京公网安备 11010802022788号







