楼主: sunhanhan1996
3143 8

[数据管理求助] 统计文本标点符号的个数 [推广有奖]

  • 8关注
  • 1粉丝

已卖:41份资源

博士生

60%

还不是VIP/贵宾

-

威望
0
论坛币
379 个
通用积分
8.9967
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
4660 点
帖子
160
精华
0
在线时间
355 小时
注册时间
2019-10-13
最后登录
2025-9-18

楼主
sunhanhan1996 学生认证  发表于 2021-11-2 13:27:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求教各位老师,stata怎么统计"回复内容"这列文本中,标点符号的个数。句号(。)、问号(? )和感叹号(! ),表示句尾;逗号(,)、冒号(:)、分号(;)和顿号(、),表示停顿。一共七个标点符号 微信图片_20211102132521.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:标点符号 Stata tata 感叹号

沙发
黃河泉 在职认证  发表于 2021-11-2 20:49:35
你若要问程序,建议请用 (ssc install) dataex 附上相关`代表性’资料 (请尽量不要用截图或其他格式),以供回答者实验之用。请参考说明 https://bbs.pinggu.org/thread-5048204-1-1.htmlhttps://zhuanlan.zhihu.com/p/29911577

藤椅
sunhanhan1996 学生认证  发表于 2021-11-3 23:32:58
黃河泉 发表于 2021-11-2 20:49
你若要问程序,建议请用 (ssc install) dataex 附上相关`代表性’资料 (请尽量不要用截图或其他格式),以供 ...
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input str6 股票代码 strL 提问内容
  4. "000001" "新开业的武汉分行,资金有多少?规模有多大?"                                                
  5. "000001" "股指期货是不是有利于银行股低估的修正"                                                   
  6. "000001" "请问深发展出让持有000693的股份,为什么没有发公告?"                                 
  7. "000001" "深发展A(000001)七年才分了一次红,是否不能申请增发融资?"                        
  8. "000001" "您好!请问:平安收购深发展股权后,深发展的管理层会发生大的变动吗?谢谢"
  9. "000001" "平安既要控股,就应早出方案;说要增发增持,已几个月了,是否缺钱?"         
  10. "000001" "贵公司受放款额度所限是否会影响2-4季度的业绩?"                                       
  11. "000001" "请直接回答投资者的提问,不要忽悠,是否对2-4季度的业绩产生影响?"            
  12. "000001" "贵公司向平安增发股价还是18.26元吗?是否有变动?"                                    
  13. "000001" "什么时间复牌?"                                                                                    
  14. end
复制代码

板凳
sunhanhan1996 学生认证  发表于 2021-11-3 23:34:07
黃河泉 发表于 2021-11-2 20:49
你若要问程序,建议请用 (ssc install) dataex 附上相关`代表性’资料 (请尽量不要用截图或其他格式),以供 ...
黄老师您回来啦~~

报纸
cuiyinzhan 发表于 2022-3-22 19:39:53
请问楼主,问题是否解决

地板
黃河泉 在职认证  发表于 2022-3-23 08:46:10
sunhanhan1996 发表于 2021-11-3 23:32
刚刚才看到,请试试 (你的符号有半形 ? 与全形 ? 之类的,要先处理)
  1. format %100s 提问内容
  2. replace 提问内容 = subinstr(提问内容,",",",",.)
  3. replace 提问内容 = subinstr(提问内容,"?","?",.)

  4. gen len1 = strlen(提问内容)
  5. gen tem = ustrregexra(提问内容,"(。|?|!|,|:|;|、)","")
  6. gen len2 = strlen(tem)
  7. gen wanted = (len1-len2)/3
复制代码

7
sunhanhan1996 学生认证  发表于 2022-3-25 15:44:56
黃河泉 发表于 2022-3-23 08:46
刚刚才看到,请试试 (你的符号有半形 ? 与全形 ? 之类的,要先处理)
收到,谢谢黄老师

8
13113954007 在职认证  学生认证  发表于 2024-1-28 18:12:04
黃河泉 发表于 2022-3-23 08:46
刚刚才看到,请试试 (你的符号有半形 ? 与全形 ? 之类的,要先处理)
谢谢黄老师的解答

9
13113954007 在职认证  学生认证  发表于 2024-1-28 18:19:28
13113954007 发表于 2024-1-28 18:12
谢谢黄老师的解答
原来分步骤做,反而能更快地解决问题。谢谢黄老师的解答和楼主的提问!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 17:53