楼主: xdxdd123
4497 12

[数据管理求助] 如何用stata读取以双引号分界的数据项 [推广有奖]

  • 0关注
  • 0粉丝

大专生

40%

还不是VIP/贵宾

-

威望
0
论坛币
1550 个
通用积分
0.4500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
125 点
帖子
8
精华
0
在线时间
99 小时
注册时间
2007-8-2
最后登录
2025-11-16

楼主
xdxdd123 发表于 2013-11-25 11:40:05 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想用stata读取这样的txt文件:

举下面一行数据为例:
"0002989811""1/05/2010""POS FEE MNEMONIC""100""D""99""2650""PFM""11000"

也就是说,每个数据项均以双引号界定:"aa""bb""cc"
用insheet   delimit(`""" ') 不能正确读取

请问有什么办法吗


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 双引号 如何用 delimit 双引号 如何

沙发
xdxdd123 发表于 2013-11-25 14:20:36
在""之间没有comma ,
否则直接insheet 就可以了
请问有没有什么方便的办法可以解决

藤椅
xdxdd123 发表于 2013-11-26 13:35:05
数据项之间没有comma分割,每个数据项又都是以双引号括起来的,
如何读入?

板凳
蓝色 发表于 2013-11-26 13:45:36
你能先都读取到一个单元格也可以的
或者
先把“”在txt文件中替换为“,”,  然后在读取

报纸
xdxdd123 发表于 2013-11-26 14:03:42
蓝色 发表于 2013-11-26 13:45
你能先都读取到一个单元格也可以的
或者
先把“”在txt文件中替换为“,”,  然后在读取
请问读取到一个单元格再split 吗

我自己在split的时候(前面试过用infile with dictionary),经常会把一个长的复杂串(比如双引号里面又有引号的)split 错—— 如果没有comma分割的话

地板
蓝色 发表于 2013-11-26 14:21:29
你还是在txt文件中直接替换了比较省事
stata的数据接口不好

如果能都成一个单元格,那剩下的应该很容易了

7
蓝色 发表于 2013-11-26 16:09:42
  1. . infile str20 v1-v9 using "D:\data.txt", clear
  2. (3 observations read)

  3. . list

  4.      +--------------------------------------------------------------------------------+
  5.      |         v1          v2                 v3    v4   v5   v6     v7    v8      v9 |
  6.      |--------------------------------------------------------------------------------|
  7.   1. | 0002989811   1/05/2010   POS FEE MNEMONIC   100    D   99   2650   PFM   11000 |
  8.   2. | 0002989811               POS FEE MNEMONIC   100    D   99   2650   PFM   11000 |
  9.   3. | 0002989811   1/05/2010   POS FEE MNEMONIC   100    D   99   2650   PFM   11000 |
  10.      +--------------------------------------------------------------------------------+
复制代码

8
115861 发表于 2018-8-29 01:36:15
同求,这种数据中的双引号如何去掉,试过replace,subinstr都是无效 1.png

9
115861 发表于 2018-8-29 01:37:11
由于数据量大,一个个修改不切实际

10
zwc2396 发表于 2019-1-29 20:57:19
115861 发表于 2018-8-29 01:36
同求,这种数据中的双引号如何去掉,试过replace,subinstr都是无效
可以考虑复合引号 `"   "'命令:replace 变量名=subinstr(变量名, `"""', "", .)
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
115861 + 5 + 1 + 3 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 3   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 01:29