楼主: sunhanhan1996
3014 3

[数据管理求助] stata正则表达式提取中文字符 [推广有奖]

  • 8关注
  • 1粉丝

博士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
379 个
通用积分
8.6450
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
4572 点
帖子
140
精华
0
在线时间
294 小时
注册时间
2019-10-13
最后登录
2024-5-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6 股票代码 strL 回复内容
  4. "000001" "谢谢您的关注。新开设的分行将会扩大我行规模,但需要有逐步增长的过程。"
  5. "000001" "我行对资本市场情况不作评论。如有兴趣,请参看相关市场分析报告。"         
  6. end
复制代码

部分数据如上所述,想把变量“回复内容”中包含某个词的记录保存。例如将含有“风险”或者“信息披露”或者“不确定性”保留。目前只会使用命令为
tempvar match
gen `match' = ustrregexm(回复内容,"风险")
keep if `match' == 1

请问各位老师怎么编写命令能保存带有 “风险”或者“信息披露”或者“不确定性”的字段呢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:正则表达式 Stata tata 表达式 generated 正则表达式

沙发
917968079 发表于 2021-10-18 18:13:07 |只看作者 |坛友微信交流群
用strmatch就可以了

使用道具

藤椅
fengbjmu 发表于 2021-10-20 10:25:25 |只看作者 |坛友微信交流群
strmatch 好像也只能设置一个关键词。

至少对这三个关键词进行三次match,再统一drop或keep是可行的

使用道具

板凳
sunhanhan1996 学生认证  发表于 2021-10-25 19:11:47 |只看作者 |坛友微信交流群
fengbjmu 发表于 2021-10-20 10:25
strmatch 好像也只能设置一个关键词。

至少对这三个关键词进行三次match,再统一drop或keep是可行的
收到,谢谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-13 09:20