这个问题值得仔细探讨呢。。。大家还有什么别的好方法吗?
我的理解是每个stata instance只能在内存加载一个dataset (preserve或者snapshot具体如何保存不确定,但是要用到这样保存下来的数据也必须明确的restore之后才能正常使用)。用矩阵的话当然是个办法。但是感觉这样的话对变量和obs的使用不方便(我个人认为stata的最大的好处之一是语言简练,如果没有这个优点,还不如用matlab,sas,或者r;另外就是stata给矩阵的行列命名的那套东西始终没学会|||), 而且保存中间结果也很不容易(不确定矩阵能否直接以文件形式存在硬盘上,如果不行的话则还是需要把矩阵转为数据集然后保存,很不方便)。
如果数据很大,使用odbc应该是好的解决办法,让数据库服务器而不是stata完成数据的筛选,从而方便的从两个大数据表里取出需要的内容。数据不大的话stata 12里读取excel文件的命令也可以灵活使用,实现从多个数据表调用数据。我只曾经有一次需要用到mysql数据库(读取和写入)。
我没有太多使用大数据集的经验,也很少遇到需要从多个数据表调用数据的情况。所以只是设想了上述办法,并不是说在实践中会很好用。


雷达卡


京公网安备 11010802022788号







