楼主: 何人来此
975 24

[量化金融] 一种非线性影响:社交媒体的因果效应证据 [推广有奖]

21
何人来此 在职认证  发表于 2022-5-16 12:55:56
(PFE.N)、微软公司(MICROSOFT CORP.)、可口可乐公司(COCA-COLA CO.)、高盛集团(GOLDMAN SACHS GROUP INC.)、麦当劳公司(MCD.N.)、通用电气公司(GENERAL ELECTRIC CO.)、3M公司(MMM.N.)、联合技术公司(UNITED TECHNOLOGIES CORP.)、Verizon Communications INC.(VZ.N.)、思科系统公司(CISCO SYSTEMS INC.)、家得宝公司(HOME DEPOT INC.)、国际商用机器公司(IBM.N.)、美国运通公司(AMERICAN EXPRESSCO)。(AXP.N)、宝洁公司(PROCTER&GAMBLE CO.)、苹果公司(APPLE INC.)、联合健康集团(UNITEDHEALTHGROUP INC.)、卡特彼勒公司(CATERPILLAR INC.)、埃克森美孚公司(EXXON MOBIL CORP.)、强生公司(JOHNSON&JOHNSON)(JNJ.N.)、沃尔玛商店公司(WAL-MartStores INC.)、沃尔特迪士尼公司(WALT DISNEY CO.)、雪佛龙公司(CVX.N)和旅行者公司(TRAVELERS Companys INC.)。硅。A.2 Twitter数据分析Witter数据分析由PsychSignal提供。com[37]。这些数据包括容量测量和情绪分析。推特消息根据其对公司看涨和看跌的可能性分为两个维度。如果一家公司的股票代码被提及,则该公司被定义为与给定消息相关。该数据集基于英语内容,与Twitter消息的国家来源无关。这些信息以日常方式进行汇总,由以下变量组成:–symbol:情绪数据所指的股票符号(股票代码)utc时间戳:utc格式的分析数据的日期和时间牛市消息:该指标是牛市情绪消息的总数;-熊市消息:该指标是熊市情绪消息的总数。有些信息可能被归类为“中性”,或者至少没有相关的看涨或看跌调。这些类型的消息不会影响牛市消息和熊市消息。也有可能在给定的一天内没有任何消息引用某家公司。

22
能者818 在职认证  发表于 2022-5-16 12:55:59
在这种情况下,分数为零。表四。A展示了公司APPLEINC的Twitter情绪分析示例。表四。B显示了所选公司的摘要描述,以及该期间确定的悲观/乐观推特消息的数量。硅。转移熵估计。B.1信息论测量的定义设X为随机变量,PX(X)为其概率密度函数(pdf)。熵H(X)是X的不确定性度量,在离散情况下定义为:H(X)=-Xx∈XPX(x)log PX(x)。(18) 如果日志以2为基数,则H的单位为位(二进制数字)。这里,我们使用自然对数,它意味着nat(自然信息单位)中的单位。表四。A: 苹果公司的推特情绪分析示例。推特消息中提到公司的股票代码(符号)是根据其淡/淡色调进行分类的。下表显示了苹果公司每日分类的看跌和看涨消息总数示例。时间戳utc symbol bull scored messages bear scored messages 2015-06-19 AAPL。O 216 552015-06-20 AAPL。O 66 252015-06-21 AAPL。O 90 242015-06-22 AAPL。O 241 752015-06-23 AAPL。O 208 752015-06-24 AAPL。O 561 2112015-06-25 AAPL。O 286 1072015-06-26 AAPL。O 192 822015-06-27 AAPL。O 145 122015-06-28 AAPL。O 216 69表SI。B:选定公司的汇总表。2012年3月31日至2014年3月31日期间,道琼斯工业平均指数(DJIA stocks)及其悲观和乐观推文的总数和日平均数。

23
mingdashike22 在职认证  发表于 2022-5-16 12:56:04
处理的消息总数不仅包括标记为看涨和看跌的消息,还包括中性消息。看涨消息看跌消息贴纸总日均总日均总消息SAAPL 151143 279.89 95819 177.443 800638MSTF 16730.98 7062 13.078 139343JPM 11259 20.85 6090 11.278 82265GS 13971 25.87 8023 14.857 75578 IBM 7387 13.68 4284 7.933 53547INTC 6808 12.61 3199 5.924 47653 GE 4888 9.05 1522.819 41271CSCO 5919 10.96 2535 4.694 39665WMT 4708.515 518 XO1788 4473.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 3.3.3.3.3.3.3.3.3.3.3.3 JJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJ35353535353535357 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 968 1.793 20226HD3262.04 1221 2.261 17550MMM 1399 2.59 465 0.861 12382AXP 1740 3.22 674 1.248 12072UTX 1363 2.55 369 0.690 11255DD 1498 2.78 559 1.037 10746UNH 1348 2.50 532 0.987 9196TRV 798 1.53 316 0.604 7990总计287195-157597给定耦合系统(X,Y),其中PY(Y)是随机变量Y和PX的pdf,X和Y之间的点pdf,X和Y之间的联合点,由以下公式给出:-Xx∈XXy∈YPX,Y(x,Y)对数PX,Y(x,Y)。(19) 条件熵定义为:H(Y | X)=H(X,Y)- H(X)。

24
能者818 在职认证  发表于 2022-5-16 12:56:07
(20) 我们可以将H(Y | X)解释为给定X实现的Y的不确定性。转移熵可以定义为条件熵之间的差异:te(X→ Y)=T EXP,YFYP= HYFYP- HYFXP,YP, (21)可以重写为香农熵之和:te(X→ Y)=HYP,XP- HYF,YP,XP+ HYF,YP- HYP, (22)式中,yf是滞后时Y的向前时移版本相对于同时代的乌斯泰系列XP和YP。硅。B.2核密度估计在熵计算中,必须估计经验概率分布。基于组织学的方法和核密度估计是两种主要的方法。HistorogramBased是最简单和最常用的非参数密度估计器。尽管如此,它产生的密度估计值具有不连续性,并且根据垃圾箱的尺寸选择而显著不同。核密度估计(KDE)方法也称为Parzen-Rosenblatt窗方法,它使用相邻观测值来近似x点的密度函数。然而,KDE方法没有像直方图那样根据料仓边缘建立估计,而是使用估计x的每个点作为宽度为2h的料仓的中心,并根据核函数对其进行加权。因此,概率密度函数f(x)的核估计被定义为^f=nhXx∈XK十、- xh. (23)我们在这里使用的核K的一个常见选择是(高斯)径向基函数:K(x)=√2πexp-x、 (24)等式(23)中带宽h的选择问题在密度估计中至关重要。较大的h会过度平滑估计的密度,并掩盖数据的结构。另一方面,较小的带宽将减少密度估计的偏差,而代价是估计中的较大方差。

25
kedemingshi 在职认证  发表于 2022-5-16 12:56:10
如果我们假设真实分布是高斯分布,并使用阿加西核,则使平均积分平方误差(MISE)最小化的最佳h值为:*= 1.06σN-1/5,其中N是总点数,σ可以估计为样本标准偏差。对于核密度估计,这种带宽估计通常被称为高斯近似或西尔弗曼拇指规则[47]。这是最常用的方法,在这里使用。其他常用方法由Sheapler和Jones[48]以及Scott[49]给出。硅。C BDS和因果关系测试的结果稳定。C:BDS测试的结果。社交媒体和股票回报之间线性规定的零假设的重要性。社交媒体看涨作为自变量,股票收益作为结果变量。大于0.05的p值是线性函数形式的误判证据,表明存在非线性忽略关系。测试了长达10天的滞后时间。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 05:40