楼主: mingdashike22
1296 21

[量化金融] Twitter情绪分析在金融领域的应用:美国的一个案例研究 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-8 11:44:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Twitter Sentiment Analysis Applied to Finance: A Case Study in the
  Retail Industry》
---
作者:
Th\\\'arsis Tuani Pinto Souza, Olga Kolchyna, Philip C. Treleaven and
  Tomaso Aste
---
最新提交年份:
2015
---
英文摘要:
  This paper presents a financial analysis over Twitter sentiment analytics extracted from listed retail brands. We investigate whether there is statistically-significant information between the Twitter sentiment and volume, and stock returns and volatility. Traditional newswires are also considered as a proxy for the market sentiment for comparative purpose. The results suggest that social media is indeed a valuable source in the analysis of the financial dynamics in the retail sector even when compared to mainstream news such as the Wall Street Journal and Dow Jones Newswires.
---
中文摘要:
本文对从上市零售品牌中提取的Twitter情绪分析进行了财务分析。我们调查推特情绪和交易量、股票回报和波动性之间是否存在统计上显著的信息。出于比较目的,传统通讯社也被视为市场情绪的代表。研究结果表明,社交媒体的确是分析零售业金融动态的一个有价值的来源,即使与《华尔街日报》和道琼斯通讯社等主流新闻相比也是如此。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computers and Society        计算机与社会
分类描述:Covers impact of computers on society, computer ethics, information technology and public policy, legal aspects of computing, computers and education. Roughly includes material in ACM Subject Classes K.0, K.2, K.3, K.4, K.5, and K.7.
涵盖计算机对社会的影响、计算机伦理、信息技术和公共政策、计算机的法律方面、计算机和教育。大致包括ACM学科类K.0、K.2、K.3、K.4、K.5和K.7中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Social and Information Networks        社会和信息网络
分类描述:Covers the design, analysis, and modeling of social and information networks, including their applications for on-line information access, communication, and interaction, and their roles as datasets in the exploration of questions in these and other domains, including connections to the social and biological sciences. Analysis and modeling of such networks includes topics in ACM Subject classes F.2, G.2, G.3, H.2, and I.2; applications in computing include topics in H.3, H.4, and H.5; and applications at the interface of computing and other disciplines include topics in J.1--J.7. Papers on computer communication systems and network protocols (e.g. TCP/IP) are generally a closer fit to the Networking and Internet Architecture (cs.NI) category.
涵盖社会和信息网络的设计、分析和建模,包括它们在联机信息访问、通信和交互方面的应用,以及它们作为数据集在这些领域和其他领域的问题探索中的作用,包括与社会和生物科学的联系。这类网络的分析和建模包括ACM学科类F.2、G.2、G.3、H.2和I.2的主题;计算应用包括H.3、H.4和H.5中的主题;计算和其他学科接口的应用程序包括J.1-J.7中的主题。关于计算机通信系统和网络协议(例如TCP/IP)的论文通常更适合网络和因特网体系结构(CS.NI)类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Twitter_Sentiment_Analysis_Applied_to_Finance:_A_Case_Study_in_the_Retail_Industry.pdf (1.75 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:twitter 金融领域 案例研究 ITT TWI

沙发
何人来此 在职认证  发表于 2022-5-8 11:44:23
Twitter情绪分析应用于金融:零售业的案例研究阿尔西斯·T·P·苏扎、奥尔加·科尔奇纳、菲利普·C·特雷利夫和托马索斯特计算机科学系,伦敦大学学院,伦敦高尔街,英国,伦敦,伦敦经济和政治科学学院,系统风险中心,伦敦,英国摘要。本文对从上市零售品牌中提取的Twitter情绪分析进行了财务分析。我们调查推特情绪和交易量、股票回报和波动性之间是否存在统计上显著的信息。出于比较目的,传统新闻通讯也被视为市场情绪的代表。研究结果表明,社交媒体的确是分析零售业财务动态的宝贵资源,即使与《华尔街日报》和道琼斯通讯社等主流新闻相比也是如此。关键词:零售、金融市场、数据科学、计算社会科学、社交媒体、新闻分析1简介重大新闻公告可能对金融市场和投资者行为产生重大影响,导致金融投资组合发生快速变化或异常影响。由于人类的反应能力有限,自动新闻分析已经发展成为算法交易的基本组成部分。通过这种方式,交易者可以缩短对突发事件的反应时间。这些新闻分析技术背后的基本原理是预测人类行为并将其自动化,因此交易者可以在做出投资或风险管理决策之前预测资产变动。Twitter数据也成为描述金融动态的越来越重要的来源。

藤椅
nandehutu2022 在职认证  发表于 2022-5-8 11:44:26
它提供了一个细粒度的实时信息渠道,不仅包括重大新闻报道,还包括小事件,如果对这些事件进行适当建模,甚至可以在主要新闻通讯社之前提供有关市场的事前信息。最近的发展反映了社会媒体在金融市场中的突出作用。一个主要的例子是美国证券交易委员会(U.S.Securities and Exchange Commission)的报告,该报告允许公司使用Twitter发布关键信息,以符合公平披露法规[18]。Twitter也表明,这可能会造成快速而剧烈的影响。2013年,美国通讯社AssociatedPress的一个被黑客攻击的推特账户在所谓的“达什崩盘”中虚假披露了一条消息,称白宫遭到袭击,导致道琼斯工业平均指数在几分钟内下跌145点[25]。在[11]中,我们提出了一个使用Twitter进行情绪分类的新模型。我们将传统的词典方法与支持向量机算法相结合,以获得更好的预测性能。在目前的工作中,我们使用[11]中的情绪分析数据集来研究从上市零售品牌中提取的机智情绪与金融股票回报和波动性之间的相互作用。我们验证了这种关系中是否存在统计意义上的信息,并将其与使用传统通讯社进行的相应分析进行了比较。我们将波动性和对数回报视为财务内生变量,并将推特情绪和交易量视为所选股票财务动态中的外生解释变量。为了便于比较,我们还将传统通讯社作为数据源。

板凳
可人4 在职认证  发表于 2022-5-8 11:44:29
因此,主要目标是:(i)验证推特情绪、股票回报和波动性之间是否存在统计上显著的信息;(ii)在使用主流新闻作为市场情绪的代理时,比较这种相互作用。这项工作的主要贡献是一个实证证据,支持在零售业金融市场的背景下使用Twitter作为一个重要的数据源,即使与传统的通讯社相比也是如此。2文献综述自[5]的开创性工作以来,对新闻的市场影响的调查一直是研究的重点。在这项工作中,作者调查了宏观经济新闻在多大程度上解释了回报差异,并分析了重大政治和世界事件后观察到的市场走势。最近,[23]提供了第一个证据,证明新闻媒体内容可以预测股市活动的广泛指标的变动。作者发现媒体的高悲观/低悲观与高市场交易量之间存在相关性。他们进一步分析了新闻情绪、收益和回报可预测性之间的关系[24]。从那时起,随着机器可读新闻的可用性和情绪分析的使用,几部作品发现新闻是财务应用的重要来源:[1]发现《金融时报》提到一家公司的次数与其股票数量之间存在正相关;[12] 调查新闻对交易者行为的影响;[13] 分析Thomson ReutersNews Analytics(TRNA),找出情绪、波动性和流动性之间的因果关系。最近的研究支持这样的假设,即Twitter数据也包含与财务指标相关的统计重要信息。

报纸
kedemingshi 在职认证  发表于 2022-5-8 11:44:34
作为在金融市场背景下分析Twitter的首批调查之一,[2]分析每日推特订阅的文本内容,以确定两种类型的情绪:(i)极性(积极和消极)和(ii)情绪(平静、警觉、确定、重要、善良和快乐)。他们能够提高DJIA指数预测的准确性。类似的研究[27]不仅能够预测道琼斯工业平均指数,还能够预测纳斯达克100指数;除了市场情绪之外,作者还测量了信息之间的情绪一致性。最近,[28]将信息理论与情绪分析相结合,证明推特情绪可以包含关于标准普尔500指数未来价格的具有统计意义的事前信息,还确定了社交媒体情绪每小时变化确实提供提前期信息的证券子集。作为对事件研究领域的贡献,[22]提供了一种方法,用Twitter分析不同类型新闻事件组合的市场反应,以确定从投资者角度来看哪些新闻更重要。以类似的方式,[16]在eventstudy方法中将情绪分析与Twitter峰值识别相结合,以暗示市场演变的方向。此外,从Twitter用户的角度探索社会网络结构[26]提供了Twitter金融社区的经验证据,其中用户的利益与金融市场一致。与目前的工作类似,[21]调查推特的极化测量值与收盘价的每日回报之间的因果关系。作者还使用支持向量机模型得出的情绪将推文分为正面、负面和中性三类。作为对这项工作的贡献,我们不仅研究了收益的因果关系,还研究了股票的波动性。

地板
mingdashike22 在职认证  发表于 2022-5-8 11:44:37
此外,我们还比较了Twitter和传统通讯社。此外,我们集中分析零售品牌,这可以为该领域的应用提供有意义的见解。股市中社交媒体应用的进一步例子包括:使用StockTwits情绪和发布量预测每日回报、波动性和交易量[14];从金融留言板中提取股票市场预测的特征[19]以及将Twitter与博客和新闻等其他来源相结合的方法[27,20,4]。3数据我们对一组在美国股市交易的五个上市零售品牌进行了分析,我们在2013年11月1日至2014年9月30日期间对其进行了监控。被调查股票的名称及相应的路透社仪器代码(RIC)如下:ABERCROMBIE&FITCHCO。耐克公司(NKE.N)、家得宝公司(HD.N)、马特林肯。(MAT.N)和GAMESTOP公司(GME.N)。公司的选择受[11]提供的Twitter情绪分析数据集的限制。考虑到选定的公司,我们考虑三个时间序列数据流:(i)市场数据,以每日股价给出;(ii)由[17]提供的新闻元数据,包括来自道琼斯通讯社、《华尔街日报》和巴伦的10949篇新闻报道;(iii)由[11]提供的社交媒体数据分析,基于42803225条推特消息。3.1新闻分析[17]提供的新闻分析数据以元数据格式提供,其中每条新闻都会根据相关的单个股票接收量化特征(如相关性和情绪)的分数。表1显示了提供的新闻情绪分析数据样本。

7
kedemingshi 在职认证  发表于 2022-5-8 11:44:40
新闻的相关性得分(相关性)在0到100之间,表明公司与潜在新闻故事的相关性有多强,值越高,相关性越大。通常,关联值至少为90表示该实体在新闻项目的主标题或标题中被引用,而较低的值表示在故事正文的更下方被引用。在这里,我们过滤相关度为100的新闻故事。这增加了故事被认为与潜在权益相关的可能性。除了相关性,我们还考虑了事件情绪评分(ESS)。这一衡量指标表明新闻对相关公司的短期正面或负面财务或经济影响;值越高,表示影响越积极。其范围在0到100之间,数值越高表示情绪越积极,而低于50的数值越低表示情绪消极。表1:新闻情绪分析。每一行代表一个与公司有关的新闻故事。所考虑的元数据包括相关性和情感分数以及时间戳。故事公司日期时间相关事件情绪评分(ESS)1耐克公司20140104 210130 33 642美泰公司20140105 41357 100 503耐克公司20140105 145917 93 884耐克公司20140105 150523 100 615美泰公司20140105 193507 44 506美泰公司20140106 170040 99 447美泰公司20140106 222532 100 618美泰公司20140107 32601 100 509美泰公司20140107 172628 55 4010耐克公司。20140110 204027 100 67鉴于这些元数据信息,我们首先将给定故事的事件情感评分(ESS)标准化为时间戳例如,它的范围在-1和1之间,我们将其标记为des((t)∈ [-1, 1].

8
kedemingshi 在职认证  发表于 2022-5-8 11:44:44
然后,我们将每家公司的情绪和数量分析定义为:–GNews(t):每日正面新闻数,即每日新闻总数(t) >0;-B新闻(t):每日负面新闻的数量,即每日总新闻数量(t) <0;-VNews(t):每日新闻总数;——SANews(t):来自新闻的每日绝对情绪:SANews(t)=GNews(t)- BNews(t);(1) –SRNews(t)∈ [-1,1]:来自新闻的每日相对情绪作为情绪得分的每日平均值(t) ,,T∈ [t,t+1).3.2 Twitter分析对于Twitter数据分析,我们使用[11]中的数据集。它提供与公司相关的情绪和数量指标。我们使用以下分析:–GT witter(t):每日积极的英语推文数量;–BT witter(t):每日负面英语推文的数量VT witter(t):无论语言如何,每天的消息总数。表2显示了companyMATTEL INC.的Twitter情绪分析示例。对于极性分类,[11]采用了一种基于现有常用技术(基于词典和基于机器学习)组合的新方法,其表现优于标准基准,详情请参见[11]。请注意,肯定、否定和中立消息的数量总和并不等于总数量,因为前者只考虑英语消息,而总数量包括消息的总数量,而不考虑语言。此外,虽然提供了中性消息的数量,但我们不使用中性消息的数量,因为我们认为极端极性(正和负)可能更具信息性。表2:Twitter情绪分析。美泰公司的分析样本。它显示了与该公司相关的正面、负面和中性英语推特消息,以及无论何种语言的消息总数。日期公司ID数量#正#负#中性2013年11月1日美泰公司。

9
kedemingshi 在职认证  发表于 2022-5-8 11:44:49
1980 8 4 48502/11/2013美泰公司1750 12 2 33903/11/2013美泰公司1700 8 1 51804/11/2013美泰公司272 19 2 42905/11/2013美泰公司1980 11 8 79306/11/2013美泰公司1580 11 47007/11/2013美泰公司1770 7 1 49808/11/2013美泰公司1900 5 4 28809/11/11/2013美泰公司1260 16 2 23610/11/2013美泰公司1700 7 313我们因此计算变量:–每日SAT-witter来自Twitter的绝对情绪:SAT witter(t)=GT witter(t)- BT-witter(t);(2) –SRT witter(t)∈ [-1,1]:来自Twitter的每日相对情绪asSRT-witter(t)=GT-witter(t)- BT-witter(t)GT-witter(t)+BT-witter(t)。(3) 请注意,SRT-witter(t)=+1,代表对所考虑公司的最高积极情绪的两倍;相反,SRT-witter(t)=-1表示最高的负面情绪,而当NSRT witter(t)=0时,我们认为中立。虽然Twitter和新闻是不同的数据源,但我们注意到,我们已经计算了情绪和数量分析,因此我们在这些数据源之间有可比的时间序列。这使我们能够在分析进一步定义的财务数据时,对它们进行比较研究。表3显示了所选公司的简要说明,以及所考虑的故事数量。我们显示了与每家公司相关的新闻总数,以及相关新闻的数量,如前所述,即新闻故事的相关性得分等于100的新闻。此外,我们还提供了与每家公司相关的推文总数。请注意,使用的Witter数据集没有提供任何相关性得分,因此没有进一步的过滤过程。表3:选定公司的汇总表。这五个零售品牌是为分析选择的,以及它们的市值。此外,我们还提供了所选时段内的新闻和推文总数。

10
大多数88 在职认证  发表于 2022-5-8 11:44:52
相关新闻代表相关性得分最高(100)的新闻。公司市值。*(十亿美元)新闻总数相关新闻数TweetsABERCROMBIE&FITCH CO.ANF。N 2.86 1608 174 1352643Nike INC.NKE。N 67.39 2881 178 38033900家得宝公司房屋署。N 111.57 3835 241 1593204材料公司材料。N 15.02 1508 125 613798Gamestop公司GME。N 6.41 1117 167 1209680(*)截至2013年10月31日的市值。资料来源:汤森路透社Ikon。我们可以将时间序列独立地引用到特定的数据源,在这种情况下,我们将其表示为原始符号,但没有文本下标,例如,当在同一上下文中讨论新闻GN ews(t)和Twitter GT witter(t)时,正数将表示为g(t)。4财务变量Let P(t)是一项资产在t日的收盘价,R(t)=log P(t)-对数P(t)- 1) 它的每日日志返回。我们认为,资产的原木收益率超过市场指数的收益率br为:ER(t)=R(t)-bR(t)。(4) 我们将标准普尔500指数的日收益率视为市场指数。作为股票每日波动率的代表,我们定义为:V OL(t)=2Phigh(t)- Plow(t)Phigh(t)+Plow(t),(5)其中Phigh(t)和Plow(t)分别是t天股票的最高和最低价格。图1显示了家得宝公司Twitter上计算出的变量样本。有趣的是,在日志返回的相应下降之后,在这段时间结束时,交易量激增,情绪下降。此外,图2描绘了从Twitter和新闻中获得的相对情绪值的分布。我们观察到,与Twitter相比,这两个网站的分布都是偏态分布,而新闻的分布则更加中性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-23 12:34