楼主: 大多数88
587 24

[量化金融] 非线性影响:社交媒体对 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-9 13:32:27
(PFE.N)、微软公司(MICROSOFT CORP.)、可口可乐公司(COCA-COLA CO.)、高盛集团(GOLDMAN SACHS GROUP INC.)、麦当劳公司(MCD.N.)、通用电气公司(GENERAL ELECTRIC CO.)、3M公司(MMM.N.)、联合技术公司(UNITED TECHNOLOGIES CORP.)、Verizon Communications INC.(VZ.N.)、思科系统公司(CISCO SYSTEMS INC.)、家得宝公司(HOME DEPOT INC.)、国际商用机器公司(IBM.N.)、美国运通公司(AMERICAN EXPRESSCO)。(AXP.N)、宝洁公司(PROCTER&GAMBLE CO.)、苹果公司(APPLE INC.)、联合健康集团(UNITEDHEALTHGROUP INC.)、卡特彼勒公司(CATERPILLAR INC.)、埃克森美孚公司(EXXON MOBIL CORP.)、强生公司(JOHNSON&JOHNSON)(JNJ.N.)、沃尔玛商店公司(WAL-MartStores INC.)、沃尔特迪士尼公司(WALT DISNEY CO.)、雪佛龙公司(CVX.N)和旅行者公司(TRAVELERS Companys INC.)。硅。A、 2 Twitter数据分析Stwitter数据分析由PsychSignal提供。com[37]。这些数据由volumemeasures和情绪分析组成。推特消息根据其对公司看涨和看跌的可能性分为两个维度。如果提及某公司的股票代码,则该公司被定义为与给定消息相关。该数据集基于英语内容,与推特消息的国家来源无关。信息以日常方式聚合,由以下变量组成:–symbol:情绪数据所指的股票符号(股票代码);–时间戳utc:utc格式的分析数据的日期和时间;–牛市消息:该指标是牛市情绪消息的总数;-熊市消息:该指标是熊市情绪消息的总数。一些消息可能被归类为“中性”消息,或者至少没有相关的看涨或熊市消息。这些类型的消息不会影响牛市得分消息和熊市得分消息。也有可能在给定的一天内没有消息引用公司。

22
能者818 在职认证  发表于 2022-6-9 13:32:31
在这种情况下,得分为零。表SI。A显示了APPLEINC公司的Twitter情绪分析示例。表SI。B显示了所选公司的摘要说明,其中包含该期间确定的悲观/乐观推特消息数量。硅。B传递熵估计。B、 1信息论测量的定义设X为随机变量,PX(X)为其概率密度函数(pdf)。熵H(X)是X的不确定性度量,在离散情况下定义为:H(X)=-Xx号∈XPX(x)log PX(x)。(18) 如果日志以2为基数,则H的单位为位(二进制数字)。在这里,我们使用自然对数表示nat(自然信息单位)中的单位。表SI。A: 苹果公司的推特情绪分析样本。推特上提到公司股票代码(符号)的消息根据其淡/淡色调进行分类。下表显示了苹果公司每日分类的看跌和看涨消息总数示例。时间戳utc symbol bull scored messages bear scored messages 2015-06-19 AAPL。O 216 552015-06-20 AAPL。O 66 252015-06-21 AAPL。O 90 242015-06-22 AAPL。O 241 752015-06-23 AAPL。O 208 752015-06-24 AAPL。O 561 2112015-06-25 AAPL。O 286 1072015-06-26 AAPL。O 192 822015-06-27 AAPL。O 145 122015-06-28 AAPL。O 216 69表SI。B: 所选公司汇总表。2012年3月31日至2014年3月31日期间,道琼斯工业平均指数(DJIA)股票及其每日平均悲观和看涨推特总数。

23
kedemingshi 在职认证  发表于 2022-6-9 13:32:39
处理的消息总数不仅包括标记为看涨和看跌的消息,还包括中性消息。看涨消息看跌消息贴纸总日均总日均总消息SAAPL 151143 279.89 95819 177.443 800638MSFT 16730 30.98 7062 13.078 139343JPM 11259 20.85 6090 11.278 82265GS 13971 25.87 8023 14.857 75578IBM 7387 13.68 4284 7.933 53547INTC 6808 12.61 3199 5.924 47653GE 4888 9.05 1522 2.819 41271CSCO 5919 10.96 2535 4.694 39665WMT 4702 8.71 2438 4.515 39607XOM 4495 8.32 17803.296 33194 Cat 5854 10.84 4035 7.472 31911VZ 4101 7.59 1651 3.057 30936BA 4432 8.21 1693 3.135 30421JNJ 3575 6.62 1345 2.491 28392MCD 3750 6.94 2157 3.994 28059KO 3786 7.01 1385 2.565 26331DIS 4170 7.72 1282 2.374 25863PFE 3131 5.80 1091 2.020 2481726 3.196 24118CVX 2696 4.99 986 1.826 21322NKE 3549 6.57 1461 2.706 20941MRK 2623 4.86 929 1.720 20708PG 2382 4.41 968 1.793 20226HD3262 6.04 1221 2.261 17550MMM 1399 2.59 465 0.861 12382AXP 1740 3.22 674 1.248 12072UTX 1363 2.55 369 0.690 11255DD 1498 2.78 559 1.037 10746UNH 1348 2.50 532 0.987 9196TRV 798 1.53 316 0.604 7990总计287195-157597-1767997给定耦合系统(X,Y),其中PY(Y)是随机变量Y和PX的pdf,X和Y之间的联合pdf,联合熵由以下公式得出:H(X,Y)=-Xx号∈XXy型∈YPX,Y(x,Y)对数PX,Y(x,Y)。(19) 条件熵定义为:H(Y | X)=H(X,Y)- H(X)。

24
nandehutu2022 在职认证  发表于 2022-6-9 13:32:42
(20) 我们可以将H(Y | X)解释为给定X实现的Y的不确定性。传递熵可以定义为条件熵之间的差异:T E(X→ Y)=T EXP,YFYP公司= HYF公司YP公司- HYF公司XP,YP, (21)可以重写为香农熵之和:T E(X→ Y)=HYP,XP- HYF、YP、XP+ HYF,YP- HYP公司, (22)其中yf是滞后时Y的前向时移版本t相对于同期的乌斯汀系列xp和YP。硅。B、 2核密度估计在熵计算中,必须估计经验概率分布。基于组织学的方法和核密度估计是这方面的两种主要方法。Histogrambased是最简单和最常用的非参数密度估计。尽管如此,它产生的密度估计值具有不连续性,并且根据垃圾箱的尺寸选择而显著变化。核密度估计(KDE)方法也称为Parzen-Rosenblatt窗方法,它使用相邻观测值来近似x点的密度函数。然而,KDE方法没有像直方图那样根据料仓边缘建立估计值,而是使用估计值x的每个点作为宽度为2h的料仓的中心,并根据核函数对其进行加权。因此,概率密度函数f(x)的核估计被定义为^f=nhXx∈XK公司x个- xh公司. (23)我们在这里使用的核K的一个常见选择是(高斯)径向基函数:K(x)=√2πexp-x、 (24)在方程(23)中选择带宽h的问题在密度估计中至关重要。较大的h将过度平滑估计的密度并掩盖数据的结构。另一方面,较小的带宽将减少密度估计值的偏差,而代价是估计值的方差更大。

25
可人4 在职认证  发表于 2022-6-9 13:32:46
如果我们假设真实分布为高斯分布,并使用高斯核,则使平均积分平方误差(MISE)最小的h的最佳值为*= 1.06σN-1/5,其中N是总点数,σ可以估计为样本标准偏差。对于核密度估计,这种带宽估计通常被称为高斯近似或Silverman拇指规则[47]。这是最常用的方法,在这里使用。其他常用的方法由斯奇勒、琼斯(48)和斯科特(49)给出。硅。C BDS和因果关系测试结果稳定SI。C: BDS测试结果。社交媒体与股票回报之间线性规范的零假设的重要性。社交媒体看涨作为自变量,股票收益作为结果变量。大于0.05的p值表明线性函数形式存在误判,表明存在非线性忽略关系。测试了长达10天的滞后时间。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 03:51