楼主: 大多数88
17222 32

[量化金融] 决策分析中的Choquet积分——公理化的教训 [推广有奖]

11
可人4 在职认证  发表于 2022-5-30 21:50:45
实际上,从实际角度来看,使用一个更简单但更快的模型,能够实时提供近似答案,可能比使用更精确但也更昂贵的模型更可取,因为该模型需要花费数小时或数天的时间来构建。在本节中,我们将研究Choquet积分学习的各个方面,并强调我们的公理化结果对该过程的影响。我们从当前学习技术的概述开始,然后看看在完全通用的情况下学习Choquet积分模型时出现的困难。为了学习Choquet积分,我们需要从数据中导出模型的两个部分:o值函数fi:Xi→ R、 和ocapa cityν。以下各节提供了这些组件的详细信息。3.1学习能力迄今为止,大多数理论和应用文献只关注capa城市的学习(“识别”)。在这种方法中,假设给出了值函数。通常,对于数值坐标fi(xi)=取下的xiare(可能在重新缩放后)。对于分类数据,有时会使用任意的数值拉贝尔(参见例如AHP),尽管这种方法的理论问题非常明显。inGrabisch等人【2008年】对现有的能力建设方法进行了很好的回顾。在大多数情况下,学习过程基于一些损失函数(MSE、MAE或类似函数)的最小化,或基于找到一些有意义表达式的极值,如方差或熵。通常,数据用于制定对可能参数(即容量)空间的约束。例如,如果x<y,则ν必须是C(ν,f(x))≥ C(ν,f(y))(记住,值函数被认为是已知的)。由于积分是容量的线性函数,我们得到了线性约束。

12
何人来此 在职认证  发表于 2022-5-30 21:50:48
最终,所有可能容量的多面体由以下数据定义:学习集。“学习集”元素之间的成对偏好X.标准重要性。定性描述多标准模型最直观的方法可能是确定其组成部分的相对权重。该过程在语义上类似于加法模型;然而,由于不可加性,我们不能再仅仅依赖于单态的值,还必须考虑N.标准相互作用的所有其他子集。关于标准的一种更为复杂的知识类型是其综合影响的特征。特别是,标准可以相互补充,这也被称为积极协同作用,或者是多余的(分别是消极协同作用)。否决和赞成标准。有时,该模型还包括非常重要的标准,因此对其估值较低的备选方案也不可避免地会得到较低的总体判断。这种标准在文献中通常被称为“否决权”。相反的情况是有一个(或多个)标准,即高价值的资产会自动产生较高的整体估值。这些被称为“恩惠”。复杂性控制。通常认为,大于k的群中的相互作用可以忽略,以提高模型的计算性能。实现这一点的机制称为k加性。最常见的是使用2-加法容量。以下指标最初用于非加性测量的行为分析。然而,它们也允许我们制定和解决容量识别的反问题(见Marichal和Roubens,2000年及其参考文献)。定义5(Shapley,1953)。Shapley值是一个相加度量值φν:2N→ [0,1]定义为φν(i)=XTN\\i(| N|-|T型|-1) 哦|T ||N |![ν(T∪ (一)- ν(T)]。

13
kedemingshi 在职认证  发表于 2022-5-30 21:50:51
(34)也可以通过M¨obius变换系数表示:φM(i)=XTN\\i | T |+1m(T∪ i) 。(35)对标准i的Shapley值的语义解释∈ 文献中的N是上述标准在决策问题中的相对重要性。更正式地说,它等于该标准对N的所有子集的平均边际输入。作为概率度量,Shapley值在所有i∈ N表1:标准重要性建模标准i比jφν(i)更重要- φν(j)>δshi和j同等重要-δSH>φν(i)- φν(j)6δsh演示了如何将Shapley值用于容量识别问题(δ是一些较小的值–差异系数)。关于标准相对重要性的直觉可以表示为φν(i)=k或φν(i)∈ [kl,ku],尽管如此,就像在加法情况下一样,这样做并没有严格意义。Murofushi和Soneda[1 993]针对成对元素引入了标准相互作用特征和强度的度量,随后Grabisch[1997a]对其进行了推广。定义6。s子集T的相互作用指数x N定义为iν(T)=N|-|T | Xk=0ξ| T | kXKZ\\T,| K |=kXLT型(-1) | T|-|L |ν(L∪ K) ,(36),其中ξpk=(| N)|-k- p) 哦!k(| N)|-p+1)!。(37)对于实际问题,我们特别感兴趣的是对{i,j}:iν(ij)=XT的索引表达式N\\ijξ| T |[ν(T∪ ij)- ν(T∪ (一)- ν(T∪ j) +ν(T)],(38)或,当用M¨obius变换系数表示时:Im(ij)=XTN\\ij | T |+1m(T∪ ij)。(39)单态相互作用指数与Shapley值一致。指数可以解释为集合T中元素之间的相互作用程度。

14
kedemingshi 在职认证  发表于 2022-5-30 21:50:54
其值位于[-1.1] ,其中1对应于最大正相互作用(互补),以及-1,从而达到最大的负面交互(冗余)。表2总结了识别问题中的索引使用情况。表2:建模标准相互作用标准i和j相互补充0 6 iν(i,j)6 1标准i和j相互补充强于k和l iν(i,j)- Iν(k,l)>δICriteria I和j以类似于k和l的方式相互作用-δI>Iν(I,j)- Iν(k,l)6δITo模型“否决”和“赞成”标准我们可以按照以下方式进行【Grabisch,1997b】。如果某个标准i是“否决”标准,则ν(a)=0A+i.(40)否则,如果某个标准i是“有利”的,则ν(A)=1A. i、 (41)最后,如果问题允许我们使用学习集,DM可能会被要求表达他对其元素的偏好。在识别问题中,这对应于表3中列出的线性约束(因为积分在ν中是线性的)。表3:对学习集对象的偏好选择ZI优先于zC(ν,f(z))- C(ν,f(z))>δ1 DM在zand和z之间是不同的-δLS>C(ν,f(z))- C(ν,f(z))6δl将可用信息表示为一组线性约束,我们得到了集U。总结上一节的结果,U可以写成方程(42)。值得注意的是,所有约束都是线性的,因此集合U是Rn+中的多面体。其尺寸可以减小到2n- 2如果我们排除 和N个坐标,具有固定值。通过使用k-加性容量可以进一步减少,但这并不总是可能的。通过解决可行性问题minνs.t.ν∈ U、 (43)我们可以检查是否至少存在一个符合给定数据的容量。如果找不到这样的容量,可以解决以下问题:minνL(U)s.t。

15
可人4 在职认证  发表于 2022-5-30 21:50:57
ν是一个容量,(44),其中L(U)是dat a的一些损失函数(例如偏好反转的数量)。损失函数,无论是基于误差的函数还是上面提到的其他函数,通常是一个凸函数,因此优化问题非常有效。如果模型是为了预测目的而建立的,也可以使用调节离子技术【Tehrani和Huellermeier,2013,Tehrani等人,2012,2011a,b】。此外,识别问题可能有多个解决方案,这导致了下面讨论的问题。3.2学习价值函数另一方面,学习价值函数是一件不同的事情。让我们先考虑一下该过程是如何在附加值函数模型中执行的。回想一下modelU:来自DMφν(i)的信息- φν(j)>δSH,i,j∈ 1.n- δSH>φν(i)- φν(j)6δSH,i,j∈ 1.nIν(I,j)- Iν(k,l)>δI,I,j∈ 1.n- δI>Iν(I,j)- Iν(k,l)6δI,I,j∈ 1.nC(ν,f(zi))- C(ν,f(zj))>δLS,i,j∈ 1.n- δLS>C(ν,f(zi))- C(ν,f(zj))6δLS,i,j∈ 1.nν(A)=1,A. 优惠标准ν(A)=0,A 6 否决标准技术约束ν() = 0ν(N)=1ν(B)≥ ν(A)B A. 附加约束sk- 可加性。并非始终适用。(42)图1:将信息编码为对电容集的约束,对于m:x<y<==>nXi=1fi(xi)≥nXi=1fi(yi)。(45)此类学习问题中的数据通常以集合X中某些点的成对偏好给出。由此产生的pr问题是LP,因为对于我们要学习的每个拟合,加法值函数都是线性的。与加值模型学习相关的一系列众所周知的学习方法被称为“UTA方法”【Siskos等人,2005年】。函数值假定为学习点的线性插值(即。

16
mingdashike22 在职认证  发表于 2022-5-30 21:51:00
它们是分段线性的),但有时会使用多项式或基于样条曲线的版本【Sobrie等人,2016年】。尽管如此,该过程仍然具有计算效率。请注意,以这种方式学习的值函数不会向分析员提供有关数据的任何“定性”信息。它们可用于预测目的,但由于加性模型的限制,无法说明标准或类似概念的“重要性”。相反,学习值函数和Choquet积分中的容量是有价值的,即使是以非参数方式学习值函数。事实上,正是这种能力能够显示多维问题的标准之间的定性关系,正如大多数现有实际应用在某种程度上所测试的那样。然而,这个过程有两个复杂性:计算复杂性和容量与值函数的混淆。如上所述,对文人的绝大多数理论和实践贡献都假设存在价值函数,或者说存在相同的价值函数,这是衡量问题所有属性的共同尺度。这显然是一个非常有力的假设,但它也导致了学习过程的显著简化。实际上,在这种情况下,我们只需要学习容量,这通常是一个凸极小化问题。相反,在学习容量函数和值函数时,我们必须解决一个困难的非凸优化问题。只有少数人试图解决这个问题【Angilella等人,2004年,Goujon和Labreuche,2013年,Angilella等人,2015年】,他们都提供了一些启发式方法和小规模的例子。这并不奇怪。实际上,对于somex,y,考虑数据点x<y∈ 十、

17
nandehutu2022 在职认证  发表于 2022-5-30 21:51:03
在Choquet积分模型中,它由以下表达式表示:C(ν,f(x))≥ C(ν,f(y))。由于积分是ν和f(x)元素的乘积之和,与仅考虑容量未知的情况相比,约束不是线性的。此外,它通常是非凸的。因此,容量和值函数的构造过程涉及到解决一个非凸优化问题,这是已知的计算困难的问题。3.3能力和价值函数的混淆Choquet积分学习问题的第二个问题是产生的能力的非唯一性。即使在只学习能力的情况下,系数的指数数(2n- 2,不包括ν() ν(N))意味着随着模型维数的增加,模型学习的任务很快变得非常困难。通常情况下,一个不太大的学习数据集不允许以精确的方式进行学习。这是一般学习理论中一个非常著名的问题【H¨ullermier和Tehrani,2012年】,可以通过多种方法来解决。在这些方法中,我们可以提到一般正则化方法【Tehrani和Huellermeier,2013,Tehrani et al.,2 012,2011a,b】,但也可以提到一些特殊方法,当模型用于特定应用时,可以应用这些方法,如排序【Angelella et al.,2015,2010】。此外,还开发了许多使用Choquet积分进行稳健决策的方法。因此,在Timonin【2013】中,我们提出了一种当容量仅属于某个集合时遗憾最小化优化的算法,而Benabou et a l【2015年2月,2014年】则研究了使用交互式数据进行稳健容量建设的问题。这项工作中引入的公理化为唯一性问题增加了另一个层次的复杂性。

18
大多数88 在职认证  发表于 2022-5-30 21:51:07
事实上,唯一性结果表明,只有当模型表现出足够的不可分性水平时,才可能对容量和价值函数进行有意义和唯一的分解。特别是,ij三重对消的成对违反应充分存在,以获得唯一容量(特别是,llvariables应在同一交互组中,请参见第节)。因此,即使是不确定的数据量,没有包含足够丰富的偏好结构的数据,也会导致非常非唯一的容量。事实上,很容易证明这种情况下的容量几乎可以任意取用。考虑一个极端的例子,当模型中没有双向交互时。在这种情况下,我们有n个大小为1的相互作用组,或者换句话说,一个加值模型。在表达式wf(x)+···+wnfn(xn)中,我们可以通过fi的比例变化来补偿“权重”wi的增加或减少。然后可以重新调整整个模型的比例,使权重总和达到1。这些修改不会影响表述的有效性,这是微不足道的。容量的非唯一性不一定是预测应用程序的问题;然而,通常基于能力指数得出的定性结论变得毫无意义。例如,考虑Li等人[2012]的论文。这里,使用Choquet积分对tripadvisor网站上的hotelevaluations数据进行分析。每一家酒店都会根据价格、位置等多个标准进行审查。此外,每一家酒店都会得到一个总体分数,这使得作者能够构建酒店的一般吸引力与其特定特征或其组合之间的关系。评论家分为几个社会群体(“美国商人”、“欧洲家庭”等)。

19
何人来此 在职认证  发表于 2022-5-30 21:51:10
本文通过发现为相应数据集提供最佳2-加性Choquetintegral的能力,说明了哪些属性和属性组合对每个组都很重要。这些容量的Shapley值和交互指数提供了所需的信息。从我们的角度来看,重要的一点是,假设评估是在相同的尺度上进行的。每个标准都从一到五颗星给出,全球评估也是如此。当然,在评论者的心目中,各种不可通约的概念,如“离火车站5分钟”和“非常干净”,以某种方式映射到一个全球“满意度”量表上,这似乎并非完全不合理,事实上,心理学文献中有许多这样的“跨模态”映射的例子(见第4.2节)。然而,没有真正的证据支持这一说法,我们也可以假设,每个维度上的星星只表示维度内的排名,而不是作者猜测的跨维度排名。这种假设的另一个结果是尺度是等距的,即一颗星和两颗星之间的(基数)差异与二颗星和三颗星以及四颗星和五颗星之间的差异相同。显然,这不一定是真的,而且往往不是真的。不仅可以满足能力,还可以满足价值函数,这就解决了这些方法论问题。显然,这也应该提高fit的质量。然而,如果我们假设一个共同的规模,某些标准之间缺乏相互作用不是一个问题——我们仍然获得一个独特的能力(另请参见Aximatizatios inWakker,1989和Schmeidler,1989)和相应的指数,这将显示lackof相互作用。

20
kedemingshi 在职认证  发表于 2022-5-30 21:51:13
相反,如果没有可公度性假设,即使有两个交互组,也意味着我们无法在全球范围内讨论“标准重要性”,而只能在这些组内讨论。这里的问题不在于用于能力解释的工具,在本例中是Shapley值,而在于模型本身的局限性。不幸的是,不容易看出这个问题是如何解决的,因为事实上,这与在加性模型中不可能有意义地使用“标准权重”的说法是同一个问题【Bouyssou等人,2000年】(第6章)。然而,值得注意的是,对于来自不同交互组的任何两个元素,交互指数的值都将保持为零,无论我们如何转换容量!4本论文的解释和讨论主要来自MCDA应用程序。然而,我们的结果也可以应用于决策理论的其他几个子领域。在本节中,我们将讨论其中的两个问题——依赖于国家的效用问题和社会选择问题。4.1多标准决策分析MCDA可能为我们的结果提供了最自然的背景。事实上,在多标准背景下,决策空间维度的异质性是自然的,先前结果的不足是显而易见的,并且已经在多个时代进行了讨论(例如,Bouyssou等人,2009)。在前几章中,我们已经介绍了在MCDA中使用Choquet积分的许多方面。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 09:44