楼主: benbenbenben
5401 7

[数据管理求助] 关于不同变量类型的合并问题 [推广有奖]

  • 0关注
  • 0粉丝

本科生

25%

还不是VIP/贵宾

-

威望
0
论坛币
20 个
通用积分
0.0014
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
504 点
帖子
42
精华
0
在线时间
78 小时
注册时间
2005-11-10
最后登录
2017-2-13

楼主
benbenbenben 发表于 2014-5-16 14:32:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
合并多个dta时,同一变量在不同的dta中,有的是字符型,有的是数值型,如果用force,可以合并,但是后续会给分析数据带来问题;
如果统一成字符型,因为变量和文件太多,一一挑出每个文件中哪些变量的的类型是字符型再做修改,工作量实在太大,请问高手,这个问题如何解决。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:变量类型 Force 字符型 dta For 工作量 如何

沙发
ywh19860616 发表于 2014-5-16 14:40:35
如果用force,可以合并,但是后续会给分析数据带来问题

问题在于这样合并的结果是不是完全正确? 还有,会给后面分析带来什么具体问题?

如果要把很多数据中的某一个变量的类型统一,那可以先做预处理,然后再合并,这样不行吗?
一份耕耘,一份收获。

藤椅
benbenbenben 发表于 2014-5-16 14:52:02
ywh19860616 发表于 2014-5-16 14:40
如果用force,可以合并,但是后续会给分析数据带来问题

问题在于这样合并的结果是不是完全正确? 还有, ...
数据集太大了,没有办法一一检查数据发现可能的错误,可能会导致missing value;
关键是文件数量很多,变量也很多,出现这类不一致变量类型的不止一个变量,无规律可循,可有coding提供对这个问题进行数据的预处理?

板凳
ywh19860616 发表于 2014-5-16 15:03:31
benbenbenben 发表于 2014-5-16 14:52
数据集太大了,没有办法一一检查数据发现可能的错误,可能会导致missing value;
关键是文件数量很多,变 ...
假如你有很多数据,按照你说的应该是合并的id这个变量类型不一样,
如果合并所用的变量名不统一,那可以按照自己需要先修改。
设这个变量名为id
  1. mkdir d:\file  
  2. cd d:\file

  3. input str16 id data
  4. 1 0.1
  5. 2 0.2
  6. 3 0.3
  7. end

  8. save d1.dta,replace

  9. clear
  10. input id data
  11. 1 0.4
  12. 2 0.5
  13. 3 0.6
  14. end
  15. save d2.dta,replace

  16. local ff : dir "." files "*dta"
  17. foreach f of local ff {
  18. use `f',clear
  19. capture confirm numeric variable id
  20. if !_rc {
  21. display " id is a numeric variable"
  22. }
  23. else {
  24. destring id,replace
  25. save `f',replace
  26. }
  27. }
复制代码
已有 1 人评分经验 论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 10 + 1 + 1 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

一份耕耘,一份收获。

报纸
benbenbenben 发表于 2014-5-17 13:19:18
ywh19860616 发表于 2014-5-16 15:03
假如你有很多数据,按照你说的应该是合并的id这个变量类型不一样,
如果合并所用的变量名不统一,那可 ...
非常感谢,非常清楚的代码,谢谢。还有一个问题是,因为我有几十个变量,都存在这个问题, 不止这里的一个变量“id", 请问,可否提供这样的代码,如何写代码,代替所有的变量名称。

地板
benbenbenben 发表于 2014-5-17 14:05:40
ywh19860616 发表于 2014-5-16 15:03
假如你有很多数据,按照你说的应该是合并的id这个变量类型不一样,
如果合并所用的变量名不统一,那可 ...
我写了这个coding,请大侠帮我看看,是否有什么错误,谢谢。
复制代码

7
ywh19860616 发表于 2014-5-17 14:12:09
benbenbenben 发表于 2014-5-17 13:19
非常感谢,非常清楚的代码,谢谢。还有一个问题是,因为我有几十个变量,都存在这个问题, 不止这里的一个 ...
假如把数据中所有变量都check一遍,可以使用如下代码

  1. clear
  2. mkdir d:\file  
  3. cd d:\file

  4. input str16 id data
  5. 1 0.1
  6. 2 0.2
  7. 3 0.3
  8. end

  9. save d1.dta,replace

  10. clear
  11. input id data
  12. 1 0.4
  13. 2 0.5
  14. 3 0.6
  15. end
  16. save d2.dta,replace

  17. local ff : dir "." files "*dta"
  18. foreach f of local ff {
  19. use `f', clear
  20. ds *, has(type string)
  21. local vlist `r(varlist)'
  22. foreach x of local vlist {
  23.    destring `x',replace
  24.    save `f',replace
  25. }
  26. }
复制代码
已有 1 人评分经验 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 精彩帖子

总评分: 经验 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

一份耕耘,一份收获。

8
ywh19860616 发表于 2014-5-17 14:19:01
benbenbenben 发表于 2014-5-17 14:05
我写了这个coding,请大侠帮我看看,是否有什么错误,谢谢。
请重新上传。
一份耕耘,一份收获。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-9 04:59