有关问题详细内容见下:
数据集说明:
数据集all中有100个变量(上万条观测),
其中1个变量是name;
数据集part中有5个变量(上千条观测),
其中1个变量也是name(其取值大部分都在all的name中);
最终目标:
1.从all中查找到part中的name 并将其输出(输出数据集还包括all中的其他变量,可不包括part中的变量),
且输出数据集中要有一个标示变量(1=在all中找到同name;0=在all中未找到同name)以便于知道哪些未在all的name中找到;
遇到的困难:
因为name是字符型变量,
我想用索引取代where name in ('name1', 'name2',...'namen')括号中的内容,
否则手动写 几千个wherein 括号中的单引号与逗号.
或者用SQl能不能实现,
最好用索引能不能实行“最终目标”.
all与part数据集中的部分数据:
all数据集的name变量为,
叶荣康 苏志勇 毛汉华 毛阳摇 陈征杭 吴树友 叶常青 黄金铎 吴福园 崔保明 温勇坚 谭石换 汤永仁 陆国华 吴开山 邓承永 罗卫真 李国雄 唐静 冯少云 莫为源 孔永清 谭建民 吴文高 谭永雄 李香 姚子平
part数据集中name变量为,
苏志勇 毛汉华 毛阳摇 陈征杭 吴树友 梁炎均 杨宏莲
先谢谢!