理论上第二列b的编码应该是基于第一列a的,故b列编码的前六位应该与a列的相同,如第一行所示100051 100051501。目前存在异常值,如第三行的100125 110147102,故想把这类异常样本全部剔除,不知道应该如何处理~
---------------------- copy starting from the next line -----------------------
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input double(a b)
- 100051 100051501
- 100051 100051502
- 100125 110147102
- 100435 130155521
- 100453 100453401
- end
- label values a a
- label values b b
------------------ copy up to and including the previous line ------------------


雷达卡





京公网安备 11010802022788号







