楼主: 何人来此
872 28

[量化金融] 用于多尺度解释库存上下文变化的纠结字符串 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-6-11 12:14:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Tangled String for Multi-Scale Explanation of Contextual Shifts in Stock
  Market》
---
作者:
Yukio Ohsawa, Teruaki Hayashi, Takaaki Yoshino
---
最新提交年份:
2019
---
英文摘要:
  The original research question here is given by marketers in general, i.e., how to explain the changes in the desired timescale of the market. Tangled String, a sequence visualization tool based on the metaphor where contexts in a sequence are compared to tangled pills in a string, is here extended and diverted to detecting stocks that trigger changes in the market and to explaining the scenario of contextual shifts in the market. Here, the sequential data on the stocks of top 10 weekly increase rates in the First Section of the Tokyo Stock Exchange for 12 years are visualized by Tangled String. The changing in the prices of stocks is a mixture of various timescales and can be explained in the time-scale set as desired by using TS. Also, it is found that the change points found by TS coincided by high precision with the real changes in each stock price. As TS has been created from the data-driven innovation platform called Innovators Marketplace on Data Jackets and is extended to satisfy data users, this paper is as evidence of the contribution of the market of data to data-driven innovations.
---
中文摘要:
这里最初的研究问题一般由营销人员提出,即如何解释市场所需时间尺度的变化。Tangled String是一种基于隐喻的序列可视化工具,将序列中的上下文与字符串中的缠结药丸进行比较,在此扩展并转移到检测触发市场变化的股票,以及解释市场中上下文变化的场景。在这里,12年来东京证交所第一部分周涨幅前10位的股票序列数据是由复杂的字符串可视化的。股票价格的变化是各种时间尺度的混合,可以使用TS在所需的时间尺度集中进行解释。此外,还发现TS找到的变化点与每个股票价格的实际变化具有很高的精度。由于TS是从数据驱动创新平台“数据夹克创新者市场”(Innovators Marketplace on data Jackets)创建的,并扩展到满足数据用户的需要,因此本文证明了数据市场对数据驱动创新的贡献。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
--> Tangled_String_for_Multi-Scale_Explanation_of_Contextual_Shifts_in_Stock_Market.pdf (1.25 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上下文 字符串 Applications Quantitative Mathematical

沙发
大多数88 在职认证  发表于 2022-6-11 12:14:31
用于多尺度解释股市背景变化的纠结字符串大坂由纪夫、林志远和高崎吉野2隶属关系1;2东京大学工程学院,附属机构2;日清资产管理公司*通信:info@panda.sys.t.u-东京。ac.jp;7-3-1 Hongo,Bunkyo ku Tokyo 113-8656摘要:这里的原始研究问题一般由营销人员提出,即如何解释市场预期时间尺度的变化。Tangled String是一种基于隐喻的序列可视化工具,将序列中的上下文与字符串中的缠结药丸进行比较,在此扩展并转移到检测触发市场变化的股票,以及解释市场中上下文变化的场景。在这里,12年来东京证交所第一部分周涨幅前10位的股票序列数据是由复杂的字符串可视化的。股票价格的变化是各种时间尺度的混合,可以使用TS在所需的时间尺度集中进行解释。此外,还发现TS找到的变化点与每个股票价格的实际变化具有很高的精度。由于TS是从数据驱动创新平台“数据夹克创新者市场”(Innovators Marketplace on data Jackets)创建的,并扩展到满足数据用户的需要,因此本文证明了数据市场对数据驱动创新的贡献。关键词:多时间尺度分析;变更说明;股票市场数据市场1。引言:问题定义股票交易商和分析师通常简单地分为原教旨主义者和技术分析师,即图表学家。前者考虑显著影响股票交易商决策的事件的基本影响,而后者分析图表,即。

藤椅
何人来此 在职认证  发表于 2022-6-11 12:14:34
股票价格的时间序列。尽管这两类交易商往往被视为不同类型的交易商,但图表学家很自然会在图表以外的数据中考虑社会事件的影响,而原教旨主义者可能会参考股价的顺序数据,。这两种方法的存在部分类似于真实(人类)分析师和机器学习的定位。机器学习工具最近被用来根据数据预测市场需求[4,5,6],被视为技术分析师思维的部分自动化。然而,仅仅从数据中学习模式很难解释外部事件导致的市场变化,因为外部事件意味着经销商决策的根本原因,而这些根本原因可能不包括在可用数据中。不仅经销商,而且市场的政治规划者不仅需要预测变化,还需要解释变化,即将观察结果的变化与其可能是外部事件的原因联系起来。假设我们有股票市场数据    }, 式中,Bt代表经销商在时间t的高阶偏好中的一个篮子(即项目集i的一组成员,即构成共现单元的项目或单词,例如超市中的购物篮、文档中的一句话或一组顶级定价股票),t是数据的序列长度。此类篮子数据已用于解释市场的模式和变化[7,8,9]。例如,假设医疗保健业务公司股票的周平均价格在一个月内的股市涨幅最大,而去年电子行业的股票涨幅更大。

板凳
何人来此 在职认证  发表于 2022-6-11 12:14:37
这一新趋势的原因可能是经销商对医疗保健的兴趣,因为去年年底上映的一部电影呼吁日常食品对人类健康的负面影响。如果股票分析员向经销商播报其分析,并在同期关注16部电影中的2部(当然不在第一集),则可以解释这种因果关系。然后,分析师可能会提出一个策略,在电影上映期间向股票交易商推销医疗保健股票。此外,如果这一新趋势在很长一段时间内被认为是可持续的,那么国家政治部门可以制定一项政策来支持医疗保健企业。在机器学习方法中,在时间序列模型特征(参数模型中的参数)的变化上检测到变化点。例如,通过将数据投影到主成分,如果该方法用于检测成分的相关性、方差和平均值随时间的变化,则变化检测的灵敏度会提高[10]。在离散时间序列(11、12、13)和连续时间序列(14)中检测到捕捉潜在因果关系结构的模型中参数的变化,后者的方法也适用于前者。这里假设参数集的值发生了变化, 从时间t开始-t到t,学习为 [t-t、 t]- [t-t型-t、 t型-t] 在哪里t是要学习的数据的训练时间长度 来自,和t是之前给定的时间步长(t-t) 表示要比较的(t)。对于较大的t可被视为容忍延迟的一部分,即分析应等待检测到变化的时间长度。

报纸
能者818 在职认证  发表于 2022-6-11 12:14:40
在[8]中,作者指出,需要从这个角度来看,很难快速解释变化。另一方面,在本文中,重点是检测序列中的事件,为符合分析师或交易商目的的时间尺度的变化提供有意义的解释。对于上面的机器学习观点,这对应于关于检测到的值为的变化点t为用户提供,而不是t、 作为有用的信息,即使缺乏准确性,也可以通过添加外部信息来解释变化。经销商不仅可以检测变化,还可以解释变化,可以考虑使用方法从顺序数据中学习潜在主题。通过动态主题模型(DTM)获得连续的时间段,每个时间段与有限数量的潜在主题(没有与主题对应的已知标签)空间中的向量相关【15】。通过对销售数据应用DTM,可以将消费者兴趣的变化检测为与主题向量的不连续变化相对应的所获得的时间段之间的边界。如果消费者c的行为以Bt、c而不是上述Bt的形式反映在数据上,则主题跟踪模型(TTM)也可以用来分析每个消费者的变化【9】。还学习了主题的层次结构[16]。这些主题模型有可能解释观察到的事件背后的变化,并与潜在主题相关联,这些主题是一种外部信息,代表时间序列中各个时期的趋势。

地板
大多数88 在职认证  发表于 2022-6-11 12:14:43
另一方面,本文的目的是处理一个目标序列,它可能是不同时间尺度的多个事件序列的混合物,可以不同地解释为各种场景,由变化点上的事件触发的从/到趋势的转变。例如,如果我们按年度时间尺度看,十年来的股价序列可以解释为时尚商业领域的变化,但如果我们按月份的时间尺度看,我们可能会发现不同的变化点,例如政客的广播言论对经销商态度的影响,这与行业趋势的变化不同。因此,我们现在可以将D视为       代替    } 如上所述,其中i代表时间刻度,Bt是Bi,t的并集,表示{1,2,…,n}中的所有i。注意,不同i的Bi,t之间存在交点。因此,这里的问题是         和       其中,enti,t和exti,t分别表示时间t的事件,该事件作为所考虑的第i个时间尺度趋势的入口和出口。如果在时间t上没有事件扮演角色,则enti、t和exti、t都应将NULL作为值。然而,如果一个工具只是分析以将这些集合显示为输出,那么它们之间的链接就无法显示,因此对于人类分析师或原教旨主义者来说,解释仍然很困难。通过为两类经销商(如果我们可以分类的话)提供所需的参考信息,数据可视化方法可能成为整合原教旨主义者和技术分析师方法的关键技术。

7
何人来此 在职认证  发表于 2022-6-11 12:14:46
例如,如果显示了价格过渡的关键转折点,以便经销商能够将信息与股票市场相关事件的外部信息结合起来,那么纯粹的股价图表可能会成为这方面有用的可视化工具。此外,股票地图和新闻中文字的16幅图形可视化图中的第3幅提供了关于市场中人们对股票相关事件的积极/消极情绪的提示【17,18】。在本文中,我们扩展并应用了纠结串(TS),它处理模式无序的序列,即各种时间尺度的模式共存,使得趋势和趋势边界难以识别。这样的序列通常出现在推特等社交网站的通信日志中,或者在参与者不了解或不明确了解社会主题或市场趋势的市场中。在股票价格序列的背后,不同的投资者购买和/或出售股票的原因确实不同,这反映了他们在不同时间尺度上对社会动态的兴趣,以不同的方式理解市场。在这种情况下,一个段如果形成,就不能以特定的典型模式或特定的词频分布为特征。通过使用TS,不仅可以获得上述输出集,还可以可视化趋势与前后趋势的关系。2、从数据市场发明的缠结字符串在本节中,我们介绍了缠结字符串(以下简称为[19,20])作为序列数据分析和可视化的方法。该工具有望实现前一节中所述的目的,即分割各种模式共存的序列,这些模式随着事件发生顺序的改变而重复出现。A.

8
能者818 在职认证  发表于 2022-6-11 12:14:49
纠结字符串的起源TS的原始版本是创新者数据夹克市场(IMDJ)的副产品,这是一个类似市场的创意支持系统【21,22】。在IMDJ中,数据提供者显示数据和/或可能的数据分析方法,数据用户对数据和分析技术提出需求。TS是根据供应商对IMDJ中潜在数据用户提出的要求的响应创建的。TS分析和可视化给定序列数据中的事件,其中每个事件的重要性根据其在序列中的位置计算。这种可视化设计符合IMDJ中提出的用户需求。为了实现下面的方法M1以满足需求R1,已经为那些希望从SNS中关于灾难的消息(DJ1)中检测出社会影响最大的消息的人发明了TS,同时考虑到之前和后续消息中的上下文。选择这些词语后,将使用有关灾害的其他信息(DJ2)来验证所选词语对应的信息的可信度需求R1:收集对业务决策有用的信息o方法M1:按顺序评估消息的影响,并将其与外部信息链接o实现M1的数据:{DJ1:通信日志文本,DJ 2:灾难信息}TS的性能已证明满足上述R1和其他人在分析时间线中的文本时的要求,以及基于传感器的办公室人员活动日志【19】。TS也被要求如下所示。

9
可人4 在职认证  发表于 2022-6-11 12:14:52
o要求R2:检测市场中消费者行为引爆点的事件o方法M2:通过TS获得一个序列中的高影响事件,并将其与外部信息相结合,以解释因果关系o实现M2的数据:{DJ3:消费或购买历史记录,DJ4:社会事件和新闻},R2以股票市场为目标市场,以股票经销商为消费者。如果我们认为这纯粹是TS的应用,那么这里的新颖之处在于,我们将M1中的通信日志与M2中的消耗日志进行类比,并将M1的需求方法数据关系与R2中M2的需求方法数据关系进行类比。在TS中,序列由一个字符串建模,其中每个纠缠部分称为一个丸。避孕药被定义为一系列事件,从事件(项目的外观)到序列中相同项目的外观。一粒药丸可能包括其他药丸,任何其他药丸都不包括的最大药丸以后称为药丸。为了减少歧义,让我们将表示项目(本文中定价的股票)的符号称为标记。在自然语言文本中,同一标记可能表示不同的项目,同一项目可能由不同的标记表示。另一方面,当我们指代币所指的实体时,该实体称为项目。在本文中,每个项目表示一个ID号的股票(一个表示唯一股票的标记),其价格上涨称为事件。因此,项目和标记彼此唯一对应,事件是项目在序列中的特定时间(或特定位置的标记)的外观。由于共享相同的标记,序列上形成的药丸可能会彼此相遇。因此,带有药丸的绳子可能会与自身交叉,形成更大的药丸。

10
大多数88 在职认证  发表于 2022-6-11 12:14:55
例如,请参见图1中w1\'和w1之间的子字符串。这里,包括{w1\',s2}和{w1,s6}的两个药丸分别在s2和s6接合,形成一个药丸,因为s2和s6的标记相同。序列中的事件按结果分为两类:(1)pills中的事件和(2)连接pills的子串上的其他事件。一个标记可能在一个固定的时间窗口内多次出现在一个药丸中,这意味着一个项目在对应于该药丸的趋势中重复出现。另一方面,连线上的事件代表了基本的上下文流,从避孕药代表的趋势到下一个趋势。从这个意义上讲,通过导线连接药丸有望用来解释序列的变化。通过药丸和电线构成的结构,我们旨在可视化顺序数据,使用户能够解释上下文或因果流。下面让我们展示TS算法,其中序列中所有事件的周期遵循初始设置步骤。图1:。一个与字符串相关的缠结字符串的示例。缠结字符串的原始版本算法(从[19]修订而来,没有改变其含义)初始设置:字符串={s1,…..si,…..sj,…..sL},导线={w1,w 2,w 3,…,wL}={s1,s2,s3,…,sL},对于i=1到L:pill(si)=si,其中pill(s)表示包含事件s的pill。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 21:08