搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  x.txt
资料下载链接地址: https://bbs.pinggu.org/a-1233600.html
附件大小:
14.16 KB   举报本内容
大家好,
想咨询一下有没有便捷些的办法来处理写在帖子里的数据?比如像这样的:摘自(https://bbs.pinggu.org/thread-358237-1-1.html)
no group age sex bp0 bp1
-----------------------------------------
1. 1 placebo 35 Male 139 128
2. 2 placebo 44 Female 148 131
3. 3 placebo 50 Female 139 122
4. 4 placebo 48 Male 148 126
5. 5 low 60 Male 135 123
-----------------------------------------
6. 6 low 38 Male 150 130
7. 7 low 31 Female 144 130 把他们黏贴下来开始,一直到能在stata data browser里显示出正确的结构(跟原来帖子里的结构一致的),
[如果复制粘贴到stata里,就成单变量了;
如果贴到txt里,再引用insheet using *.txt,delim(" ")因为都是大空格,所以分隔符用" ",这样会有很多全是missing value的变量,有值的位置还错位,即:一部分在一个变量里,另一部分在另一个变量里,
所以只好手动在栏间加逗号,然后设delimiter(",")]
这中间有没有什么好方法?
先谢谢了。
p.s.
另外是对网页上数据的处理,比如:wikipedia 关于国家、地区代码和所在大陆编码的数据: [贴到txt里的网页数据]
维基百科上说:The data is in a plain text format suitable for automated processing.
“该数据格式便于自处理”,问题是如何快捷处理啊~~~
以下是我做的处理,
insheet using x.txt, delim(" ") clear
drop v2-v6
drop v8-v12
drop v14-v17
drop v19-v22
* concatenate这个指令用于连接多个字串变量,参help egen, ctrl+f: concat 配合punct加字串间的空格:
egen name=concat(v2* v3*),punct(" ")
drop v2* v3*
rename v1 continent
rename v7 ISO2
rename v13 ISO3
rename v18 ISOn
sort continent
save continent,replace
有没有更便捷的方式,比如concat()前drop 那几个missing variables 那里有没有一条指令就能实现的方法。



    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-9 02:48