楼主: 何妨一下楼
4747 2

[数据管理求助] 【求助】stata统计关键词出现次数 [推广有奖]

  • 7关注
  • 10粉丝

已卖:300份资源

副教授

27%

还不是VIP/贵宾

-

威望
0
论坛币
3459 个
通用积分
499.9123
学术水平
46 点
热心指数
42 点
信用等级
41 点
经验
38167 点
帖子
346
精华
1
在线时间
936 小时
注册时间
2012-9-6
最后登录
2025-10-15

楼主
何妨一下楼 发表于 2013-4-26 08:31:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的数据大概是这样的:

record                                                    negative1            n_negative1
北京真是一个污染严重的城市!              污染                     ???


需要在 n_negative1变量中,求出negative1 这个词在record中出现了几次~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 关键词 negative Record 关键词 统计

沙发
voodoo 发表于 2013-4-26 13:32:04
1. 答案:
help string functions
gen n_negative1 = (strlen(recode) - strlen(subinstr(recode, negative1, "", .)))/strlen(negative1)
2. 建议:
2.1 用Stata处理双字节的中文并不理想
help limits    // see: length of a string variable
2.2 中文文本处理存在分词方面的固有困难,看http://baike.baidu.com/view/19109.htm?func=retitle#5
巫毒上传,必属佳品!
坛友下载,三思后行!

藤椅
peyzf 发表于 2015-8-28 09:43:28
good suggestion~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 00:27