楼主: 独岛
718 0

[stata资源分享] 政策文本分析应用|主题内容|词袋法|机器学习|自然语言处理等 [推广有奖]

  • 0关注
  • 0粉丝

高中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
24.8308
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
240 点
帖子
13
精华
0
在线时间
37 小时
注册时间
2020-6-1
最后登录
2024-5-16

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
复制链接到浏览器可看【政策文本分析应用|主题内容|词袋法|机器学习|自然语言处理等】 https://www.bilibili.com/video/BV14Y4y187dh?share_source=copy_web&vd_source=54787bdb921bee49fe9f51723dc971cc
应用:公共政策文本基本概念与现实表征,意义表达,政策内容,文献计量,社会网络,趋势方法:主题分析、内容分析、词袋法、监督模型、无监督学习、自然语言处理等基本方法简介步骤:采集整理文本;预处理(分段、分句、分词、去停词、归一化);量化(矩阵化、向量化);建模分析



政策文本分析是指对政策文本的表示及其特征项的选取,以进行相应的文本挖掘、因果推断等数据分析。主要有六类常用的分析技术:

- **主题分析**(Thematic analysis):一般与扎根理论方法相结合,基于研究者自身经验和对事物理解,进行编码分析(Baumer, Mimno, Guha, Quan, & Gay, 2017);  
- **内容分析**(Content analysis)/基于词典的方法(Dictionary analysis):对文本单词/词组频率进行计数,以进行定量研究(Reinard,2008;Short,Broberg,Cogliser&Brigham,2010;McKenny等,2016;Reinard,2008);   
- **词袋法**(Bag-of-words):语料向量化,简化和压缩成为计算机容易理解的文档特征矩阵;  
- **监督学习**(Supervise models):研究人员事先知道需要探寻数据特征X和标签y之间的关系(Roberts等,2014);  
- **非监督学习**(Unsupervised models):通过事先定义的规则对文本数据进行自动分组(L. Jason Anastasopoulos,2019),比如Karoliina Isoaho(2021)等认为主题建模使学者能够将政策理论和概念应用到更大的数据集上;  
- **自然语言处理**(Natural Language Processing):文本分析中自动化程度最高的形式(Manning等,2008),模拟人类如何理解和处理语言(Chowdhury,2003;Collobert等,2011;Joshi,1991)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 语言处理 自然语言 bilibili Source

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 18:57