以上解决问题的方法有一个共同的局限性,如果变量有几十个,命令就会显得冗长而不直观。
推荐的思路是:将两个数据表接在一起,然后用SQL查询语句查出唯一记录即可。标准的SQL查询语句中都带有dictinct关键字,提供了查询不重复记录的途径。
先将a表和b表都纵向连接成了c表,c表中包含有重复记录,查询语句为:
select dictinct * from c
这样就搞定了,查出的是不包含重复记录的数据。 此法最大的优点不论数据表有多少变量都无所谓。
我没有用过SAS的SQL,但上面语句在Access 或 Visual Foxpro 这类提供了SQL的软件中均可实现,我估计SAS的SQL语句中应该有dictinct相应的关键字 。


雷达卡
京公网安备 11010802022788号







