学习不公平交易：一个来自美国的市场操纵分析 - 第2页 - 外文文献专区

11楼

发表于 2022-5-9 10:25:22

2.交易员可以选择操纵资产价格，以此刺激流动性。3.2哄骗价格哄骗是一种非法交易策略，交易员使用这种策略，目的是在没有执行意图的情况下，通过发布大额订单（哄骗订单）来操纵给定资产的价格，但在资产供求方面向其他市场参与者提供误导性信息，从而导致价格变化（Lee、Eom和Park 2013）。一旦价格受到影响，交易者就会取消虚假订单，并将真实订单放在交易的另一方。在我们的模型中，模拟如下所示。考虑到这样一种情况，即通过采取欺骗行动，交易者可以扭转资产β流动性不足的局面，并利用价格上涨的优势。在图3中，这对应于障碍物从顶部中心仓切换到底部中心仓，显示了购买更多合同时的操纵效果（障碍物可以切换到其他单元格，但不允许在解决优化问题时分析操纵的效果，如下一节所述）。这可以为交易者带来收益，例如，从s开始，交易者可以采取“操纵买入”的行动(=>)” – i、例如，使用spoo fi fi购买β，方法是为β下一个大的卖出订单，取消订单，然后以更高的价格购买β。一旦遇到切换到底部垃圾箱的障碍，特工就会发现自己进入s，接近s0*.图3中的两个表示具有相同的增长水平，但与市场流动性相关的条件不同，因此给出了价格操纵效应的概念。

12楼

kedemingshi

发表于 2022-5-9 10:25:25

这种影响与市场影响有关，大多数诚实的交易者会避免这种影响，因为它代表了间接的额外成本，但对于像恶搞者这样的操纵者来说，它代表了可能加速投资组合增长的风险。270271272273274275276277278279280281282283284285286287828929029129229294295296297298299300301030230330430530630830931031131231331431731831932032122323S1S2S3S4S4S*s*s5s1s6s2s7s5s8s4s′的*s*图10:GridworldSellα买入α卖出β买入β（a）诚实交易行为（Ah）。买入α（操纵）卖出α（操纵）买入β（操纵）卖出β（操纵）（b）操纵行为（As）。图11：交易行为。s2s1s3s*S4图12:Gridworlds2s1s3s*s4s6s5s7s′*S8图13:GridWorldS2S1S3S4S*s4s*s6s6s5s5s7s5s′*s*S4S8图14:GridWorld6图3：说明欺骗在投资增长最大化过程中的影响的图示。3.3欺骗作为马尔可夫决策过程§3.2中描述的场景的自然模型是马尔可夫决策过程（MDP）（Nevmyvaka、Feng和Kearns 2006；Yang等人2012）。通常，MDP由元组{S，A，T，R}定义，其中S和A分别是状态和动作的集合∈ S和a∈ A），是奖励的集合（r∈ R） T是一组转移概率（{P（s|s，a）}∈ T其中P（s | s，a）表示动作a）后从s过渡到状态sF的概率。根据政策π（s，a）采取行动，该政策定义了在s状态下采取行动的概率。考虑到增长状态是状态变量，交易者的问题是根据交易成本ζt，找到买卖合同α和β的最佳策略，以实现目标中短期增长*. 图3中的状态表示确定了欺骗的完整状态集，因为它捕获了采取任何行动后的不同增长水平。

13楼

可人4

发表于 2022-5-9 10:25:28

这些动作与买卖合约的过程相关，交易者使用这些动作在图3的状态空间中导航，这是由A={↑, ↓, ←, →} 类似地，操纵动作集A={, , <=, =>} （“操纵性买入α”、“操纵性卖出α”、“操纵性卖出β”、“操纵性买入β”，分别），以及“买入并持有”A的“不做任何事”动作={o}, A=A∪ A.∪ A.回报由交易成本ζt表示，这可能取决于所采取的行动和交易者所在的增长水平。转换概率与合约α和β在给定时间点t的流动性程度有关，因此良好的流动性将有助于交易员的订单完成并转换到新的增长水平，而低流动性将限制这些转换。3.4 pingping的价格操纵类似于欺骗，定义为买卖价差内的限价订单（订单簿中列出的best buy和sell报价之间的价差），没有执行意图，但几乎立即取消（Scopino 2015）。HFTs通过利用速度优势来实施这一策略，目的是在市场上寻找隐藏的流动性，即订单簿中没有显示的订单，就像机构投资者下的大订单一样。这种策略有一系列更复杂的事件——提交ping订单并几乎立即取消它们，检测隐藏的流动性，在大型投资者追求的交易端获取流动性，然后以更高的价格下真正的订单。为了使ping成为一种成功的策略，HFT必须能够找到隐藏的流动性，这一过程依赖于ping订单，这有助于建立对此类流动性存在的信念。

14楼

nandehutu2022

发表于 2022-5-9 10:25:31

然而，众所周知，投资者更喜欢在暗池中下大订单，即在普通公众看不到资产交换的私人通道中，因此没有人能看到谁在买卖，但谁的价格取决于成熟市场的当前市场价格。这给HFT带来了隐藏流动性存在的不确定性，因为它没有显示在订单簿中。为了在ofFig的表示中模拟这一点。4.我们引入观察的概念，指导交易者在给定状态下采取的行动。例如，在短期内观察到β合约的卖出端存在隐藏的流动性（障碍），因此HFT可以通过控制受监管市场的价格来产生利润，同时在暗池中针对隐藏的流动性进行交易。然而，在SME层面上观察到这种流动性并不存在，并且采取操纵行为可能会产生损失。270271272273274275276277278279280281282283284285286287828929029129229294295296297298299300301030230330430530630830931031131231331431731831932032122323S1S2S3S4S4S*s*s5s1s6s2s7s5s8s4s′的*s*图10:GridworldSellα买入α卖出β买入β（a）诚实交易行为（Ah）。买入α（操纵）卖出α（操纵）买入β（操纵）卖出β（操纵）（b）操纵行为（As）。图11：交易行为。s2s1s3s*S4图12:Gridworlds2s1s3s*s4s6s5s7s′*图13:GridWorlds2O2S1O1O3O3S*o*s4o4s6o2s5o1s7o5s′*o*O4S8图14:GridWorld6图4：演示Ping交易的图示，同时尝试最大化投资增长。3.5 ping作为部分可观察马尔可夫决策过程，如§3.4所述，可以用部分可观察马尔可夫决策过程（POMDP）建模（Baffa和Ciarlini 2010）。

15楼

mingdashike22

发表于 2022-5-9 10:25:35

通常，POMDP由元组{S，A，T，R，O，Ohm}, 也就是说，MDP元组扩展为{O，Ohm}, 其中O代表一组观察结果（O∈ O）及Ohm 是一组给定状态s和动作r（{O（O|s，r）}）的观测概率。对于POMDP，根据代理对处于给定状态的信心采取行动，并根据观察结果进行计算。同样，每次交易员的订单完成后，必须支付相应的交易成本。流动性是指有利于α和β合约交易的流动性，因此在资本重新平衡后，交易者可以过渡到不同的增长水平。这些观察结果代表了交易员对隐藏流动性（障碍）的检测，这些流动性可能会在寻求利润的同时起到帮助或适得其反的作用。4方法在这两种模型中，交易员的目标都是实现*这代表了最大的投资增长，而且，由于这是一个牛市，最高的收益来自于拥有最多的合约，这一过程可以通过在州代表中导航来实现（在熊市[当悲观情绪持续且价格趋于下跌时]，交易者可能更倾向于卖出合约），反之亦然。我们选择了图3和图4中的状态表示，作为牛市期间单个代理人获取合同的行为模型，选择诚实或操纵行为作为“最佳”行为。

16楼

可人4

发表于 2022-5-9 10:25:38

其他具有更复杂结构的网格也可能重现交易策略的最优性，但根据模拟的市场条件，操纵行为可能不会成为“最优”行为，从而消除了本文分析的核心。无论操纵交易是否被允许，代理的最佳交易行为顺序（最优策略）都可以通过简单的方式确定，例如，强化学习。在本文中，对于MDP模型，这是通过简单的数值迭代（Sutton和Barto 1998）来实现的，以找到最佳的数值函数Vπ*（s） =maxa∈A“R（s，A）+γXs∈SP（s | s，a）V（s）#，（3）其中0<γ<是贴现系数。POMDP形式主义旨在对不完全可观测的状态进行建模，解释为什么需要观测函数来解决这个问题。观察功能，Ohm（a，s，o），是在行动a之后从状态s观察到o的概率（Kaelbling、Littman和Cassandra，1998）。对于POMDP来说，解决方案是通过使价值函数最大化的行动找到最优政策。基于主体对状态（增长水平）的当前信念，该值函数可以表示为一个联立方程组asV*（b） =maxa∈A“ρ（b，A）+γXb∈Bτ（B，a，B）V*（b） #，（4）其中b∈ B是一个信念状态，ρ（B，a）=Ps∈Sb（s）R（s，a）是信念状态的预期回报；τ（b，a，b）=P{o∈O | b=b}P（O | a，b），状态转移函数。最优价值函数考虑了未来所采取行动的潜在回报，因此它捕获了在长期内产生最多回报的最佳行动。这个论点使我们能够通过分析（PO）MDP模型中最终由两个因素决定的最佳行动，来检验§1末尾确定的问题：奖励和过渡函数。

17楼

大多数88

发表于 2022-5-9 10:25:41

无论操纵策略是否最优，通过扩展奖励函数（交易成本）的概念，并加入市场监管机构施加的“高额罚款/财务处罚”的概念，我们认为这将鼓励交易员停止自己的行为，以公平的方式进行交易。此外，我们认为，增加操纵过度流动性影响的不确定性可能是阻止滥用行为和促进更有效市场的另一个原因。5实验在本节中，我们对§3中描述的三种策略的可行性以及（PO）MDP模型中投资组合增长优化方面的最佳行动进行了模拟。5.1模拟首先，我们模拟牛市期间的“买入并持有”、诚实和欺骗策略，将市场指数标准普尔500指数和纳斯达克综合指数作为契约稳定1：在牛市下模拟的稳定性。策略平均利润率（%）标准开发分别购买和持有5.83%0.041925%6.85%0.059576%和7.68%0.059576α和β。我们使用92天的收盘价，模拟短期来产生利润。表1显示了模拟的结果，我们发现，平均而言，欺骗优于其他策略，这一结果是通过采取操纵措施后增长的增加产生的。诚实交易是第二好的策略，击败“买入并持有”，因为后者长期表现良好。下一步是分析在前面章节中描述的（PO）MDP模型中出现的操纵动作的最佳性。5.2欺骗的MDP模型。欺骗是最佳策略吗？在这里，我们展示了是否根据§3.3中描述的模型发生了欺骗，如果发生了，鼓励欺骗的因素是什么。

18楼

何人来此

发表于 2022-5-9 10:25:45

首先，我们试图建立一个所有参与者在相同条件下参与的市场模型——所有策略支付相同的交易成本，交易者的交易结果完全确定。作为基线，在任何一个州的边缘方向上的所有诚实行为都是零成本的，并使代理返回到同一个州。操纵动作也一样，只是障碍物改变了位置（从而改变了表现形式）；否则，操纵行为就会付出代价-1.所有州。在不同的州内过渡需要付出代价-1与障碍物的碰撞为0/-1所有诚实/操纵行为的成本。终端状态，s*和s0*奖励+1意味着交易者已经达到了期望的增长状态。“什么都不做”(o) 动作在所有状态下都是零成本的，但代理无法转换。所有的转换都是确定性的，这意味着P（s | s，a）=1，对于所有的s，a。我们设置γ=0.95，并求解方程（3），以在MDP模型中找到最优的操作。表2显示了基线的结果，我们发现大多数州都会发生欺骗行为，与诚实的行为共享最佳状态。结果表明，在交易成本相同的条件下进行交易时，交易员可以利用欺骗获得利润并达到预期的增长水平。二、在SpoofingNow中加入财务处罚，我们试图通过模拟市场监管机构对欺骗者实施罚款/财务处罚，鼓励交易员诚实行事。

19楼

能者818

发表于 2022-5-9 10:25:48

为此，在§5.2中描述的基线中。i、我们改变了奖励函数，增加了所有州所有操纵行为的成本，直到-4.53并使用γ的相同值来求解（3）。表2再次显示了这种设置的结果，唯一的最佳措施是与诚实交易相关的措施。从监管角度来看，两种市场条件之间存在明显差异，一种考虑自由市场（基准），另一种考虑操纵者的定义。例如，在从表2开始的基线中：在奖励和转移函数的不同条件下，MDP模型的最佳行动。州基线增加了流动性定义的不确定性50%对50%10%对90%s↑, →, → => =>s=> ↓ , <= ↓s→, , => → →, => →, =>s↑, ↑ ↑, ↑, s↑, , => ↑ ↑ ↑s→ → → =>s→, => → →, => →, =>s↑, ↑ ↑, ↑, 国家情报局只需两步就能到达*(=> 在s；=> 在s）中，在实施定义后，最诚实的交易者将采取四个步骤(↓ 在s；→ 在s；→ 在s；和↑以达到相同的增长水平。iii.增加流动性的不确定性第二次尝试阻止欺骗行为是通过提供流动性操纵影响的不确定性。这可以通过采用§5.2中所述的基线来实现。i、改变所有状态下所有操纵动作的转移函数。我们对不确定性采取了两种不同的测量方法：障碍切换/停滞的概率为50%/50%–10%/90%，目的是看看哪种测量方法可以消除欺骗。我们对γ取相同的值，然后求解（3）。表2显示了这种新设置的结果，我们得出结论，以某种方式控制流动性的实施机制不如将定义应用于操纵者那样有效。尽管对流动性的影响很模糊，但欺骗仍在发生。

20楼

nandehutu2022

发表于 2022-5-9 10:25:52

然而，我们必须注意到，在这两种不确定性度量中，几乎所有的最佳行为（包括欺骗行为）在向欺骗者提供定义时都是朝着诚实行为的方向进行的，这意味着对流动性的影响是模糊的，正是因为市场中已经存在流动性，这一结果与我们在§3.1.5.3 Pingingi POMDP模型中描述的模型一致。ping是最佳策略吗？在这里，我们将展示ping是否会成为一种最佳策略，同时实现增长最大化。首先，我们使用与§5.2相同的基线。i、关于奖励和转变，以及图4所示的观察结果。我们设置γ=0.95，并求解（4）。表3显示了POMDP模型中基线的结果，在同等交易成本条件下，ping是所有可观测状态下的最佳操作。诚实的行为只有在观察到的状态下才是最佳的，这意味着无论HFT实际观察（检测）到隐藏的流动性，她都会从不一定下大订单的其他投资者那里获得利益。二、增加ping的交易成本我们希望通过改变可能影响交易员决策的参数来阻止HFT进行ping。由于ping不被认为是非法的，因此我们将报酬函数的变化等同于增加与ping相关的直接交易成本。我们改变了奖励函数表3：POMDP模型在不同奖励和转移函数条件下的最佳行动。观察基线增加增加了流动性交易成本的不确定性50%对50%对10%对90%o →, ↑ ↑ ↑, =>o=>, → →, ↓ →, => →, =>, ↓o → → →o ↑ ↑ ↑o=> → → →在§5.3中考虑的基线中的POMDP模型。i、并将所有ping操作的成本增加到-4.91在所有州。

[量化金融] 学习不公平交易：一个来自美国的市场操纵分析 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群