| 所在主题: | |
| 文件名: x.txt | |
| 资料下载链接地址: https://bbs.pinggu.org/a-1233600.html | |
| 附件大小: | |
|
大家好,
想咨询一下有没有便捷些的办法来处理写在帖子里的数据?比如像这样的:摘自(https://bbs.pinggu.org/thread-358237-1-1.html) no group age sex bp0 bp1 ----------------------------------------- 1. 1 placebo 35 Male 139 128 2. 2 placebo 44 Female 148 131 3. 3 placebo 50 Female 139 122 4. 4 placebo 48 Male 148 126 5. 5 low 60 Male 135 123 ----------------------------------------- 6. 6 low 38 Male 150 130 7. 7 low 31 Female 144 130 把他们黏贴下来开始,一直到能在stata data browser里显示出正确的结构(跟原来帖子里的结构一致的), [如果复制粘贴到stata里,就成单变量了; 如果贴到txt里,再引用insheet using *.txt,delim(" ")因为都是大空格,所以分隔符用" ",这样会有很多全是missing value的变量,有值的位置还错位,即:一部分在一个变量里,另一部分在另一个变量里, 所以只好手动在栏间加逗号,然后设delimiter(",")] 这中间有没有什么好方法? 先谢谢了。 p.s. 另外是对网页上数据的处理,比如:wikipedia 关于国家、地区代码和所在大陆编码的数据: [贴到txt里的网页数据] 维基百科上说:The data is in a plain text format suitable for automated processing. “该数据格式便于自处理”,问题是如何快捷处理啊~~~ 以下是我做的处理, insheet using x.txt, delim(" ") clear drop v2-v6 drop v8-v12 drop v14-v17 drop v19-v22 * concatenate这个指令用于连接多个字串变量,参help egen, ctrl+f: concat 配合punct加字串间的空格: egen name=concat(v2* v3*),punct(" ") drop v2* v3* rename v1 continent rename v7 ISO2 rename v13 ISO3 rename v18 ISOn sort continent save continent,replace 有没有更便捷的方式,比如concat()前drop 那几个missing variables 那里有没有一条指令就能实现的方法。 |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明