同时对每个消费者的姓名和出生日期作matching,在stata里该怎么做?
消费者的姓名有2个variables: First Name, Last Name (都是美国人)
出生日期只是1个variable,格式是年月日, 如20090103
英文名有很多类似的但写出来不一样,但的确是同一个人,比如Dave, David; Bonnie, Bonita... 这是难点. 用merge只能match exactly same names, but not similar names.
目的:把同一个人的所有observations都找出来放一起,然后可以做别的比如只保留符合某些标准的observations。
所以现在第一步要做的是matching。用stata怎么做?


雷达卡





京公网安备 11010802022788号







