楼主: mma
44300 44

[编程问题求助] 如何用stata编程,寻找配对样本   [推广有奖]

11
sungmoo 发表于 2011-5-8 17:15:39
jzhyue 发表于 2011-5-8 15:22 不过我们还是不能同时访问它,比如读取某个数据或全部数据,(我们现在的做法是合并数据或将数据存入loca 或mat,(当然如果用mata就可以同时访问多个mat,也等同于同时访问了多个数据库))
如果stata如果有个可以这样的命令:访问命令,比如在内存中有master data,用这个访问命令可以用来读取另外一个using data的数据?没有细查,不知是否有与post功能相反的命令?
这里首先有一个逻辑上的问题。

"访问using data"是何种意义?

是要同时对master data与using data中的变量进行操作吗?

若该操作会改变两data的内容,那么改变“未打开的”using data对于软件使用者而言是否很必要?

若master data与using data的数据结构(比如变量名、变量数、样本量等)很不一样,同时操作两data就可能受到很多限制(甚至没有意义)。

若两data在结构上相似,则这恰好符合merge、joinby、append等的逻辑。由于在未保存之前,merge等命令实际上没有改变master data与using data,只是改变了内存中导入的data。事实上,这些命令把两data的内容同时(当然要按一定逻辑)导入内存,成为整体的操作对象。

同时操作两data(两data同时成为操作对象),应该要求两data有某种内在的逻辑联系,而merge等恰好利用并表现了这种联系。

***************

describe using可以描述未打开(未导入内存)的数据库。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 100 + 8 + 1 + 1 + 1 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 8  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

12
jzhyue 发表于 2011-5-14 19:24:11
有感于woodoo回复中应用的post命令:联想到数据管理时有时候会出现这种情况;一个master data,这个数据可能与另外一个暂称之为using data存在着模糊相关,即两者有联系却不很明确,或两者有相关却不能完美的匹配,这些联系大都是以字符串的形式出现,有的表达甚至没有共同的字条串,仅仅依赖于语意,这种没有具体规律的联系用merg,joinby等是不能处理的或者处理大部分,而某些没有规律的却不能处理,比如以下的讨论;
https://bbs.pinggu.org/thread-893472-1-1.html
https://bbs.pinggu.org/thread-1097873-1-1.html
这时候如果同时参考using data对master data操作,可能会更好些。
正如版主所言:“这里首先有一个逻辑上的问题。”
“若master data与using data的数据结构(比如变量名、变量数、样本量等)很不一样,同时操作两data就可能受到很多限制(甚至没有意义)。”
“同时操作两data(两data同时成为操作对象),应该要求两data有某种内在的逻辑联系,而merge等恰好利用并表现了这种联系。”
stata设计者们的初衷也许就认为一个处理对象就足矣,如果多个有联系的对象可以用merg,jjoinby,append,cross等命令合并成一个对象来处理,如果没有联系的数据就没有必要同时操作。(一个猜想)
问题的关键就是两个数据有不是确切明确的联系,其实这种问题的出处在于原始数据的整理缺乏规范。网上有个reclink命令好像处理这种相关,却在具体应用上不太清楚。


type可以显示未打开(未导入内存)的数据库(以文本方式存在)的内容。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 100 + 8 + 1 + 1 + 1 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 8  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

13
sungmoo 发表于 2011-5-14 20:40:29
jzhyue 发表于 2011-5-14 19:24 如果没有联系的数据就没有必要同时操作。(一个猜想)
这里除了必要性外,可能还要考虑这样的“同时操作”有没有意义,或者有何种意义。

(个人以为,这种“意义”的说明或定义,stata恰好由一定的合并命令来体现或给出)

14
wpwpwppopo 发表于 2012-1-16 18:26:23
非常经典的配对程序,运行良好,延展性也很好,thx!

15
xieqinghua 发表于 2012-1-22 15:29:37
是否可以把程序写简单点

16
sungmoo 发表于 2012-4-1 07:03:05

17
lucywitherspoon 发表于 2012-4-26 00:31:12
请教各位,这个命令只能对表中的数据进行匹配,但是不能实现样本数据和非样本数据的匹配,有可能样本数据和样本数据进行了匹配,该如何改进呢

18
xieqinghua 发表于 2012-4-26 12:06:36
太复杂了,请问有简单的方法么

19
cmeil 发表于 2013-5-18 20:58:08
命令执行过程中没有错误的

20
carweed 发表于 2013-8-31 16:28:03
voodoo 发表于 2010-2-10 23:55
试试:

// 生成模拟数据,非平衡面板数据
很算法!赞!
硬是要挑缺点的话,就是preserve和restore之间的部分太费时间!数据量比较大的话,要很长很长的时间(即使用MP版的,也没见到快多少)。不知道有改进的方法不?
O(∩_∩)O谢谢~!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 14:09