楼主: weizhoukkk
16943 16

[数据管理求助] stata中单元格字段的空行如何删除? [推广有奖]

  • 0关注
  • 0粉丝

已卖:101份资源

讲师

59%

还不是VIP/贵宾

-

威望
0
论坛币
50 个
通用积分
0.4653
学术水平
3 点
热心指数
1 点
信用等级
0 点
经验
224 点
帖子
103
精华
0
在线时间
979 小时
注册时间
2006-3-26
最后登录
2025-10-29

楼主
weizhoukkk 发表于 2014-11-8 21:35:46 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如表sample字段,变量auditor第一个观测值 “赵燕”之前有空行,这与无空行的“赵燕”字段不一致,鼠标选中单元格也看不到内容,请问如何删除字段内容中的空行?
变量auditor第二个观测值 “芦玲”右侧与其他名称未对其,表示有某种格式在里面,如何删除呢?
数据量很大,希望有类似        replace         auditor=subinstr( auditor," ","",.)         之类的方法,但是不知道 空行在stata如何表示,所以请大家指教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 单元格 subinstr Auditor replace 如何

sample.rar
下载链接: https://bbs.pinggu.org/a-1669339.html

576 Bytes

本附件包括:

  • sample.dta

已有 1 人评分学术水平 收起 理由
╰不滅信念 + 3 好问

总评分: 学术水平 + 3   查看全部评分

沙发
╰不滅信念 学生认证  发表于 2014-11-8 21:47:06
可是从你的附件中下载下来的数据集看起来没有你描述的问题啊,要不再传一份数据量稍微大一点的数据? screenshot.png
where there is a will there is a way

藤椅
rommelwenhao 学生认证  发表于 2014-11-8 21:52:40
第一个其实是有个软回车,第二个实际上是文字前边有一个空格。可以用stata里边的export导成excel文件,然后在excel里边查找软回车之后替换,具体方法可以百度,然后查找空格之后替换,具体方法百度
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 根据规定进行奖励

总评分: 论坛币 + 20   查看全部评分

板凳
weizhoukkk 发表于 2014-11-8 22:00:59
因为原始数据是程序中部分,希望有 程序语言解决“软回车”和“前面的空格”问题,不需要导出后在其它程序中处理,不知道stata可以实现excel替换软回车和前面空格的方法吗

报纸
weizhoukkk 发表于 2014-11-8 22:03:54
╰不滅信念 发表于 2014-11-8 21:47
可是从你的附件中下载下来的数据集看起来没有你描述的问题啊,要不再传一份数据量稍微大一点的数据?
第一个“赵燕”和双字名“艾鹏”右边不对齐,点击单元格后会发现上面不显示内容,显示空的,复制后粘贴到excel中出现空行,这与复制“艾鹏”后粘贴不同,可以断定存在某种格式
“芦玲”与“艾鹏”右侧不对齐,但选中后有现实,说明它与“赵燕”不是同类情况

地板
╰不滅信念 学生认证  发表于 2014-11-8 22:25:27
找到现在也没有找到一个合适的命令。。

7
weizhoukkk 发表于 2014-11-8 22:29:09
在excel中实验后认为,第二个观测值“芦玲”后面存在空行,比如另一个样本 两个“朱颖”明显不一样,duplicates 命令视为不同

sample2.rar

529 Bytes

本附件包括:

  • sample2.dta

8
╰不滅信念 学生认证  发表于 2014-11-8 22:38:48
只能想办法用正则表达式匹配到中文.
我在找相关的命令

9
weizhoukkk 发表于 2014-11-8 23:09:29
stata中string的标准function好像都无法解决

10
weizhoukkk 发表于 2014-11-8 23:48:12
谢谢╰不滅信念,
软回车的问题,借鉴
https://bbs.pinggu.org/thread-2494070-1-1.html
已经可以解决,即观测值“赵燕”存在的空行,但“芦玲”仍然无法解决,主要不知道存在什么格式在其中,
解决软回车的方法
                                                        keep code auditor
                                                        split auditor, p(`=char(10)')
                                                        drop auditor
                                                        gen n=_n
                                                        tostring n, replace
                                                        gen n1= code+n
                                                        drop code n
                                                        reshape long auditor, i(n1)
                                                        drop if auditor==""
                                                        gen code=substr(n1,1,10)
                                                        keep code auditor

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 10:00