楼主: 何人来此
876 28

[量化金融] 用于多尺度解释库存上下文变化的纠结字符串 [推广有奖]

11
能者818 在职认证  发表于 2022-6-11 12:14:58
pill\\u weight(si)=wire\\u weight(si)=0对于W,一个预设窗口,执行以下循环:对于i=W+1到L:邻居(si,W)={si-W,s i-W+1…,…,si-1}如果sj(<i)邻居(si,W){令牌(si)=令牌(sj)}:j=最小{j | sj邻居(si,W),令牌(si)=令牌(sj)}r(si)=r(sj)#将si放置在r(sj),与sj Wire=Wire \\{sj,sj+1,…,si-1}相同的位置#将从sj到si-1的子序列从Wire pill(si)=…=pill(sj+1)=pill(sj)#将si和sj生成的所有事件以相同的pill pill\\u weight(sj)+=i–j#将循环的长度添加到pill中事件sj的权重,否则r(si)=r(s i-1)+a{r(s i-1)-r(si-2)}#地点s i,在从s i-1到s i(a:一个实常数)的线的延伸中,如果发送的每个pill结束,则sext=pill wire\\u weight(sent)=wire\\u weight(sext)=ext–ent中的第一个和最后一个事件#将pill大小指定为16个中的5个的线端上每个事件的权重,这里si表示符号标记(si)出现在给定字符串的第j个位置的事件,而不是符号本身。也就是说,标记(si)对于一个符号是唯一的,并且多个i的si可以对应于相同的符号。在初始设置中,没有缠绕,但存在一根电线,这是给定的顺序。因此,在这个阶段,字符串和导线上的事件可以通过{1,2,…,L}中k的每个wk和sk之间的成对对应关系来关联,其中L是字符串的长度。在初始设置后的循环中,字符串中的每个事件si都将逐个获取。对于每个si,在W的时间距离内,从si之前的事件中搜索与si具有相同标记的事件sj。

12
能者818 在职认证  发表于 2022-6-11 12:15:01
这里,W表示窗口的宽度,以周为单位(例如,W=3表示宽度为3周),由事件反向搜索中的邻居(si)表示,即时间范围的长度[i-W+1,i]。如果发现这样的事件sj,则获取一个pill作为sj和si之间字符串的子字符串。因此,si和sj属于同一个药丸(即,药丸(sj)=药丸(sj))。si和sj被视为同一趋势中同一标记的两个外观。从表面上看,这一趋势是重复标记集的出现,但并不一定意味着出现的具体原因的存在。注:如果后续子序列(W篮子内)中的某个标记与药丸中的标记匹配,则药丸可能最终成为较大药丸的一部分。然后,sj和si之间的子字符串将从表示所有导线的Wire中删除。如图1所示,wk的后缀号k可能不同于表示事件si的对应节点的i,因为在过程中,sj和si之间的连线将从连线中删除,如图1所示。另一方面,如果在si之前的W篮子窗口中找不到令牌(令牌(sj))等于令牌(si)的事件,例如sj,则si和邻居(si)中的所有事件将作为一根导线存在。在所有循环之后,2D空间中的位置(位置i)被分配给每个si。当在pill pill(sj)中添加新事件si作为节点时,由pill\\u weight(sj)表示的扩展pill的权重增加i–j,即此处添加到pill的事件数。也就是说,由于吸收si,药丸尺寸增加,这归因于从sj到sj的新路径在药丸(sj)形成过程中的贡献。

13
大多数88 在职认证  发表于 2022-6-11 12:15:04
所有周期结束后,作为每个药丸中第一个和最后一个事件(即最小和最大t的st)的sent和sext的权重,分别由wire\\u weight(sent)和wire\\u weight(sext)表示,取药丸大小的值。这意味着药丸的大小被计算为加载在连接到药丸的导线边缘上的重量。根据这些重量值,可获得以下关键事件:药丸中的关键事件(可视化为药丸中的项目):最高pill\\u重量值的事件s。如果在一粒药丸的W个连续事件中,s重复频率越高,则该值往往越大。导线上的关键事件(显示为字符串中药丸入口/出口处放大的红色/绿色节点):顶部wire\\u weight(u)值的事件(u)。这些事件不像避孕药中的关键事件那样频繁,但在解释序列中的上下文转换方面发挥了重要作用,例如市场中的主要趋势变化。我们给药丸的入口打电话,给出口打电话。因此,在TS中,如果相应项目在药丸中重复,则事件被视为药丸中的关键事件,而启动或停止药丸的事件被视为电线上的关键事件或电线药丸集合点。例如,假设TS作为等式(1)应用于序列字符串。字符串=1、2、3、2、3、4、3、4、5、6、2、5、6、7。(1) 在这种情况下,如图1和图2(a)所示,由标记“2”表示的项目出现的事件将启动第一个避孕药,包括其本身以及“3”和“4”,因为“2”是字符串重新访问的第一个标记。也就是说,“2”在也是第三个s3之后分配给事件s1。令牌“3”访问三次,即作为{s2、s4、s6}访问,而“4”访问两次{s5、s7}。

14
能者818 在职认证  发表于 2022-6-11 12:15:07
在这个避孕药中,“4”是重复的最后一个标记,被视为出口,是连接下一个避孕药的导线的起点。在这里,TS可视化了序列的流程,突出显示了将集群(即pill)连接到下一个频繁单词的连接线。电线上的事件看起来可能并不突出,因为它们不是频繁出现的药丸中的“流行”事件。然而,在线节点在序列的主流中起着至关重要的作用,因为如果这些事件丢失,整个结构中的连接将被切断。虽然从这个意义上讲,图1和图2(a)中的标记“3”的事件应该是一个候选的连线成员,因为如果我们去掉“3”,结构会被破坏,这里“3”不是连线,而是第一个pill中的主要事件,因为第一个pill中的其他事件与“3”相连窗口宽度W在解决本文所述问题时起着重要作用,因为将W设置为较大的值意味着找到较长时间尺度的丸的入口和出口。虽然获得的药丸时间长度与W不成正比,但通过改变W,我们可以获得缠结串结构的明显变化,并可以找到不同时间尺度的变化点。在图2(a)的情况下,“2”出现两次,因为从第一个和第二个“2”到序列中的距离为7,窗口宽度W设置为5。另一方面,如图2(b)所示,如果W设置为大于相同项目的出现周期,则W的变化会导致结构发生根本变化。实际上,结构从图2(a)更改为(b),从“4”到“3”失去连接,并将(a)中的两个簇统一为(b)中的一个簇。然而,随着W的进一步增加,结构不会发生更大的变化。

15
kedemingshi 在职认证  发表于 2022-6-11 12:15:10
该算法的另一个优点是,计算时间为O(L)的顺序,即与序列长度呈线性关系。对于TS的实际使用,TS输出中每个节点和边的位置通过有线拉伸模型进行了修改【23】,这是一种专门开发的方法,用于可视化具有起始和结束节点的图形。图2:。宽度(W)为6和7(W的单位为周)的缠绕绳。B、 TS的一个扩展,用于处理篮集数据初始设置的篮数据纠结字符串:字符串={#n1,s1,s2…,#n2,s…,…s…,#nT,…sL},其中#n:每个时间t的分隔符。Wire={w1,w 2,w 3,…,wT}其中wj是{nj,s,…,smj(就在#nj+1之前)}对于字符串中的每个s:pill(s)=wj其中sj是wj的成员pill\\u weight(s)=Wire\\u weight(s)=0对于w,预设窗口,执行以下循环:对于字符串中的每个si/{n1,#n2,…,nT}:邻居(si,w)=∪ wk-W+1,…,其中si是wk的成员。如果sj(<i)邻居(si,W)s.t.标记(si)=标记(sj):j=最小{j | sj邻居(si,W),s.t.标记(si)=标记(sj)}r(si)=r(sj)#将si放置在r(sj),与sj Wire=Wire \\{wp,…,wk-1}相同的位置,其中sj是wp的成员。

16
mingdashike22 在职认证  发表于 2022-6-11 12:15:13
pill(s)={si}中所有s的pill(sj)∪ {wp,…,wk-1}pill\\u weight(sj)+=i–j#循环的长度添加到pill中事件sj的权重,否则r(si)=r(s i-1)+a{r(s i-1)-r(si-2)}将s i放置在从s i-1到s i(a:一个实常数)的直线延伸中,如果发送的每个pill的结束,sext=pill wire\\u weight(sent)=wire\\u weight(sext)=ext–ent#将pill大小指定为上述分机中16个分机中7个分机上每个事件的权重,初始设置中的si表示所有事件的第i个,字符串中的“#n”除外,其中字符串对应于给定的目标序列,“#n”表示篮子之间的分隔符。其他设置与前面显示的原始TS类似。在顺序篮数据的扩展TS中,当添加最新事件si时,从si的前邻居(即si之前最近的W篮)中搜索与si相同标记的sj。如果发现sj这样的事件,sj和si之间的子串将变成图1所示的pill。然后,si所在篮子中的所有事件与sj所在篮子中的所有事件加入相同的药丸。如果sj是药丸中的第一个重访事件,则进入组合药丸的是sj,而出口是药丸中的最后一个重访事件(si,如果si是最后一个重访)。3、结果:这里给出的结果是双重的。在3.1中,显示了每周排名靠前的涨价股票的数据概要。在3.2中,我们展示了TS获得的药丸入口和出口与市场中每W的股票平均价格从4、5和6开始上移的一致性。此外,由股票分析专家给出的趋势变化的定性解释,也适用于纠结串的输出数据。

17
nandehutu2022 在职认证  发表于 2022-6-11 12:15:16
然后在3.3中。,我们展示了入口和出口与股票价格的主要变化的一致性。3.1. 股票涨价数据这里的“纠结字符串”(以下简称TS)适用于股票价格数据,其中每周涨价率排名前十的股票为(http://www.kabu-data.info/neagari/neagari_hizuke_w_1.htm). 这些数据取自2007年7月6日至2019年1月4日期间592周的东京股市第一部分。原始数据包括与一家公司相对应的每家公司的名称,但这里我们只取表1中每个公司的股票ID号。每组10只顶级股票被视为一个篮子,如表1所示。我们还使用了日本股票价格趋势(日经指数平均值)的数据来评估TS在检测股市上涨/下跌价格变化方面的表现。表1:。每周追加定价库存号的数据。1否。2否。3……,…,…编号102007.7.6#n…,…,…2007.7.13#n…,…,…,…,n…,…,…,2019.1.4#n…,…3.2。TS的可视化随窗口宽度W的变化TS的可视化如图3至图5所示。在这里,红色和绿色的字母分别表示sent和sext,即事件开始和结束。每个图3、4和5的图(b)中不包括所有sent和sext,但仅包括(a)中相对较大的字母,即,由于空间的限制,算法中显示的wire\\u权重较大。然而,在(a)和(b)中,G之后的绿色节点G和红色节点R之间的距离远小于R和R之后的绿色节点G\'之间的距离。也就是说,药丸的大小(从红色事件到下一个绿色事件)大于将药丸连接到下一个药丸的电线路径(从绿色到红色)。

18
何人来此 在职认证  发表于 2022-6-11 12:15:19
图3(a)中TS显示的序列将窗口宽度W设置为4,对应于图3(b)中日经指数的时间序列。因为TS在11年的数据中获得了19粒药丸,所以将W设置为4意味着以大约0.58年的时间分辨率调查药丸。在16年的这8个周期中,我们没有发现红/绿节点的时间与日经平均指数股票价格的长期变化点之间的明显一致性。另一方面,图4(a)和(b)中的结果用于将W设置为5。因为我们获得了11年的7粒药丸,W=5意味着时间分辨率约为1.6年。在这种情况下,我们发现红/绿节点的时间与日经指数的长期变化之间存在实质性的一致性。也就是说,图4(b)中的7个红色节点中,有5个在日经指数6个月或更长时间单调增长之前的3个月内,4个红色节点在类似长度增长之前的1个月内,3个红色节点在1个月内开始1个y增长。最后,图5中的结果是W=6。因为(a)中的11年有3粒,W=6意味着时间分辨率约为3.7年。图5(a)中的两个红色节点与股票价格开始单调上涨6个月或更长时间的月份一致,一个是2年增长的开始。为了定性解释考虑到红色/绿色节点的变化,以及更多统计评估药丸和相关库存的进出一致性,让我们在下一章讨论。3.3.    股票价格变化和TS中的两种变化点接下来,我们评估了从药丸进入和退出到股票价格变化(即上涨和下跌)的一致性。

19
能者818 在职认证  发表于 2022-6-11 12:15:22
例如,在图6中,入口和出口往往与高价格趋势持续期的开始和停止相一致。图6举例说明了股票价格在入口处上涨的几种情况。另一方面,开始服用(出现在入口)避孕药的股票的价格在退出开始服用的避孕药时趋于下降。为了评估这些趋势,如表2左半部分所示,让我们比较时间长度的趋势t药丸入口前后,对于作为入口出现的库存(TS中的红色字母:参见图7(g)了解)。表2右半部分还显示了对现有库存的比较(TS中的绿色字母:见图7(h))。注:我们没有在表2中包括W=1或2的情况,因为药丸的数量分别为132和93,这意味着平均药丸长度为1个月和1.4个月,即比任何t我们选择(至少3个月)进行评估。此处包括W=3,因为获得了43粒药丸,这意味着平均药丸长度为3.0个月。在这些结果中,两种变化点股票(即作为入口和出口出现的股票)的价格在出现后立即大幅上涨。另一方面,在退出避孕药时(如图7(b)、(e),对应于(h)),入口处股票价格上涨的概率相对小于入口处股票价格上涨的概率(图7(a)、(d),对应于(g))。此外,对于出现在药丸入口的股票,退出后价格上涨的概率(如图7(c)、(f),对应于(i))小于进入时的概率(图7(a)和(d))。

20
kedemingshi 在职认证  发表于 2022-6-11 12:15:25
这些趋势尤其代表了W的较大值。这一趋势将在后面的讨论中解释。在本文中,我们没有将这些结果与[4、5、6]中的机器学习预测方法进行比较,因为其目的是(1)检测变化点,在这些变化点上可以在不同的时间尺度上预测未来的上涨/下跌趋势,并且(2)通过相同的可视化方法从股市的变化点解释或预测长期趋势,未受到现有方法的质疑。此外,表2中获得的精度值高于通过此类机器学习技术对股票涨跌价的预测(例如,在[4]中最好的情况下为65%),尽管长期趋势精度的变化很难,因为在遥远的未来情景中存在不确定性。也就是说,面对这一困难,表2(a)中TS在最坏情况下预测中/长期(3个月或更长时间)增长的精度对于避孕药入口事件是81%,即使增长大于标准偏差也是71%。这些百分比甚至比现有方法更高,这些方法在寻找市场平均值下降的前兆或变化率振荡因子作为买卖信号方面实现了高精度【25】。我们还通过在每个入口和每个出口后输入长度为dt的时间序列数据,检查了获得变化点(入口/出口)的容错延迟。因此,对于4个月或更大W的所有避孕药入口和出口,我们发现dt设置为3个月或更大时获得的入口和出口相同。第9页,共16页图3。W=4(周)的TS结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 04:59