楼主: 能者818
851 52

[量化金融] 挑选赢家:一种数据驱动的质量评估方法 [推广有奖]

31
kedemingshi 在职认证  发表于 2022-6-13 23:02:46
这表明,使用公司特定的扩散系数可以改善模型。表1 2010年观察年度培训的每个模型的偏差信息标准得分。模型类型DIC ScoreHomoskedastic 41026.51异方差分析38650.72稳健异方差分析52741.08稳健异方差分析模型的DIC得分最高。这可能是因为当我们为退出概率加入额外的项时,这相当于添加额外的数据点。由于概率小于1,这可能会导致较低的似然值。这意味着我们无法直接将该模型与基于DIC的其他模型进行比较。然而,尽管DIC较高,但我们将在第8节中看到,该模型实际上在选择公司进行投资组合方面做得最好。与DIC相比,样本外投资组合绩效是比较不同模型的更好方法。6.2. 稳健异方差模型我们现在更详细地研究稳健异方差模型估计结果,因为这是投资组合构建方面表现最好的模型(见第8节)。我们使用参数的后验样本箱线图给出结果。我们只包括在其90%后验可信度区间中不包含零的特征,因此在贝叶斯意义上显示出显著性。图6所示为β后验样本的箱线图,其中包含扇区非扇区特征的单独图。我们发现,动画、保险和广告等通常不具有周期性且以持续收入来源著称的行业是积极的,且在统计上具有显著意义,因此与更高的公司漂移相关。

32
kedemingshi 在职认证  发表于 2022-6-13 23:02:50
然而,社交媒体、生物技术、金融和医疗保健等以高度竞争或监管著称的行业都是负面的,统计意义重大,因此与较低的公司漂移相关。从显示非部门特征的方框图中,我们可以看到,公司高管之前的创业成功会产生更大的公司漂移(高管IPO和高管收购特征)。图7所示为γ后验样本的箱线图。我们并没有看到任何明显的传播趋势。然而,对于非扇区功能,我们看到之前的成功增加了分流器Saini,和Zaman:Winning-20-10 0 10 20 30 40 50 602010Health CareE CommerceMobileVertisingFinanceEducationBiotechnologyInternetSearchEngine社交媒体商业智能保险人SourceLogisticsAnimationGPUβ2010强健的异性恋模型行业特征-30-20-10 0 20 30职业IPO高管收购数家与CompanyBachelorsMastersedu类似的附属教育公司重叠stdCompetitors BCCompetitors acquisition2010稳健异方差模型非部门特征2010β图6重要部门(左)和非部门(右)特征的β后验样本值箱线图。在90%后验可信区间内,显著性被定义为不为零。扩散系数,与β相似。我们可以从这一分析中得出的主要结论是,先前的成功增加了漂移和扩散,从而增加了退出的可能性。这一结论与风险投资行业的常识一致,但我们的模型提供了一种量化这种直觉的方法。回想一下,对于时变β参数,我们有标准偏差δ,它表征了这些参数随时间的变化。

33
大多数88 在职认证  发表于 2022-6-13 23:02:53
表2和表3显示了行业特征和非行业特征的顶部变异系数,定义为后验三角洲δ除以历年β样本后中位平均值的绝对值。变异系数最大的参数的β平均值非常小。因此,显示大量时间波动的系数可能不会对公司的漂移和退出概率产生强烈影响。最后,我们在表4中显示了定时参数的统计信息。我们发现,ν的后验分布平均值为3.21年,第五分位数和第九十分位数分别为2.99年和4.00年。我们发现τ的后验平均值为3.50年,第五分位数和第九十分位数分别为2.71年和4.03年。ν的估计值是有意义的,因为我们数据中的大多数退出都是收购,正如我们从数据分析中看到的,收购需要大约三到四年的时间。四年之后,我们看到公司的漂移和扩散都在衰退。根据我们的数据,τ的估计值,漂移和扩散衰减的速率也是有意义的,因为七年后,很少有公司退出。亨特、赛尼、,和Zaman:Winning 2010 Robust Heteroskedastic Model部门特征2010 Robust Heteroskedastic Model非部门特征-15-10-5 0 5 10 15应用个人健康手机生物技术医疗设备信息保险机器学习-20-15-10-5 0 5 10 15工作IPOJob收购执行收购Advisory IPOMax收购比例数附属公司竞争对手竞争对手acquisitionHad competitor infoγ图7重要部门(左)和非部门(右)特征的γ样本值箱线图。

34
能者818 在职认证  发表于 2022-6-13 23:02:56
在90%后验可信区间内,显著性被定义为不为零。表2:按变异系数大小递减排序的部门特征的β、δ和变异系数的后验统计数据。行业特征平均β中位数δ变异系数Facebook-0.0125 1.558 124.51计算机-0.0517 3.911 75.71开源-0.0628 2.1379 34.05生物技术-0.1699 3.0617 18.02健康诊断0.1302 1.4768 11.34表3非行业特征的β、δ和变异系数后验统计数据,通过变异系数大小的降低来分级。非行业特征变量平均β中值δ中值系数高中-0.2795 1.951 6.979最大ipo比例0.2777 1.735 6.246竞争对手D 0.2988 0.042 4.599教育重叠标准偏差0.6290 2.580 4.102Phd-0.7373 2.850 3.865表4ν和τ的后验分布统计。后中位显示在括号中,第五个和第九十个分位数。参数中值(第5个分位数,第95个分位数)ν3.21(2.99,4.00)τ3.50(2.71,4.03)Hunter、Saini和Zaman:Winning 7。挑选赢家投资组合现在展示了挑选赢家投资组合框架,我们将使用该框架来评估我们模型的性能。我们对该框架进行了总体描述,并对投资组合构建算法进行了理论分析。我们还将我们的框架与著名的对数最优投资组合框架进行了比较。7.1. 目标函数考虑概率空间上定义的一组事件E={Ei}mi=1(Ohm, F、 P),带样本空间Ohm, σ代数F和概率测度P。每个事件E对应于项目i获胜。目的是选择子集S [m] ={1,…,m}的大小k,这样我们可以最大化至少一个项目inS获胜的概率,这是由P给出的硅∈软件工程研究所. 为了便于记法,我们表示U(S)=P硅∈软件工程研究所.

35
nandehutu2022 在职认证  发表于 2022-6-13 23:02:59
我们要解决的优化问题是thenmaxS[m] ,| S |=kU(S)。(7.1)一般来说,解决此优化问题可能很困难。事实上,我们有以下结果。定理7.1最大化U(S)是NP难的。尽管最大化U(S)的计算复杂,但目标函数具有一些优良的性质,我们可以利用这些性质有效地获得好的解,这是由以下众所周知的结果给出的。引理1函数U(S)是非负的、非递减的、子模的。单调非减次模函数有一个重要的性质,即可以限制贪婪解的次最优性。这样的解决方案是通过将元素顺序添加到集合S中来获得的,这样每次新的添加都会导致目标函数的最大边际增加。形式上,让SG=(f,f,…,fk)是优化问题的贪婪解。贪心解是一个有序集,在贪心优化的第i步加上fib项。设SiG=(f,f,…,fi)为第i项添加到SG后获得的溶液,SG=. 然后,添加到sgis的第i项由fi=arg maxf给定∈[m] /Si-1GU硅-1克[f-U硅-1克, 1.≤我≤k、 (7.2)对于子模函数,我们有以下众所周知的结果。定理7.2(Nemhauser et al.(1978))设U(S)为非递减子模函数。设Sg为U(S)的贪婪最大化子,Sw为U(S)的最大化子。ThenU(SG)U(SW)≥1.-e-1.(7.3)Hunter、Saini和Zaman:WinningThere,贪婪解决方案对子模块最大化问题有性能保证。此外,很多时候,它们可以很容易地计算出来。出于这些原因,我们将使用贪婪的方法来解决我们的问题。7.2. 独立事件我们首先考虑最简单的情况,即所有EI都是独立的。设pi=P(Ei),eci表示Ei的组成。

36
mingdashike22 在职认证  发表于 2022-6-13 23:03:02
由于事件的独立性,我们可以重写目标函数asU(S)=1-P\\i∈SEci!=1.-易∈S(1-pi)。(7.4)然后可以将优化问题写为axs[m] ,| S |=kU(S)=分钟[m] ,| S |=kYi∈S(1-pi)。(7.5)独立事件的目标函数形式导致了一个简单的解决方案,由以下定理给出。定理7.3对于一组独立事件E={E,E,…,Em},让pi=P(Ei),在不损失一般性的情况下,假设P≥ p≥ ... ≥ 下午。让k元素子集SW [m] 最大化U(S)。然后,SW由pi最大的指数组成,即SW=[k]。从方程式(7.4)中U(S)的形式可以明显看出这一结果的证明。从定理7.3我们可以看出,如果事件是独立的,那么我们只需选择最可能的事件,以最大化至少发生一个事件的可能性。这个简单的解决方案在很大程度上依赖于事件的独立性。当事件独立时,另一个有用的属性涉及贪婪解。引理2对于一组独立事件E={E,E,…,Em},设k元素贪婪最大化子of u(S)为SG。然后SW=SG。在这种情况下,贪婪解也是最优解。事实上,独立事件案件的解决几乎微不足道。这也表明,当事件的相关性较低时,贪婪的解决方案应该表现良好。亨特、赛尼和扎曼:赢得7.3分。挑选赢家和对数最优投资组合我们现在研究挑选赢家投资组合和另一个众所周知的对数最优投资组合之间的关系。为了做到这一点,我们考虑了一个模型,其中项目有一个顶重回报结构,类似于挑选赢家的问题。我们将让随机变量Xidenote返回与索引i相关的项,并且我们假设有m个可能的项。

37
mingdashike22 在职认证  发表于 2022-6-13 23:03:05
特别地,我们将考虑返回值a和b有两个可能的值,使得0<a<b的情况,并且我们将使ω的xi(ω)=b∈ Ei和Xi(ω)=a,否则。这可以近似地模拟一家初创公司的回报,如果它退出,回报是巨大的,否则可以忽略不计。由于很难预测一家公司退出时的准确回报率,因此可以假设在没有其他信息的情况下,它们都具有相同的平均值b。通过这种方式,区别公司的唯一因素是它们退出的可能性。构建投资组合的方法有很多种。传统的马科维茨方法将平均投资组合收益最大化,但其方差有一个上界(马科维茨1952)。这些投资组合是参数化的,因为必须选择方差的上限。另一种方法是对数最优投资组合(log optimalportfolio),其中构建的投资组合最大化了portfolioreturn(封面1991)的预期自然对数。在我们的分析中,我们假设每个项目的投资决策都是二元的,即项目要么在投资组合中,要么不在投资组合中。我们不允许对这些项目进行持续投资。在这种情况下,投资组合是[m]的子集,如挑选赢家问题。我们确定投资组合的asPi回报∈SXi/| S |。相应的预期日志返回isV(S)=E“lnXi∈SXi/| S |!#。(7.6)我们将投资组合约束为包含k个元素,如挑选赢家问题。然后,对数最优投资组合由以下优化问题确定:maxS[m] ,| S |=kV(S)。(7.7)与马科维茨投资组合不同,对数最优投资组合公式中没有任意参数。这允许我们直接比较对数最优和挑选赢家投资组合。我们再次开始考虑事件{Ei}mi=1独立的简单情况。

38
大多数88 在职认证  发表于 2022-6-13 23:03:09
我们得到以下结果:定理7.4对于一组独立事件E={E,E,…,Em},让pi=P(Ei),在不损失一般性的情况下,假设P≥ p≥ ... ≥ 下午。让k元素子集SL [m] 最大化V(S)。然后,SL由pi最大的指数组成,即SL=[k]。将上述结果与定理7.3进行比较,我们发现,当事件相互独立时,确定对数最优投资组合的问题简化为寻找pickingHunter、Saini和Zaman的贪婪解决方案的问题:Winning Winners问题。等效性仅依赖于0<a<b和独立性的假设。特别是,我们对边际概率P(Ei)的值不作任何假设。虽然独立性假设导致对数最优和pickingwinners投资组合之间完全等价,但实际上这一假设将被违反。然而,我们对特定项目获胜概率很小的示例感兴趣。在这种情况下,我们可以量化两种投资组合类型之间的偏差程度。定理7.5让SL表示对数最优投资组合,即对于(7.7)它是最优的,让SW表示对于挑选赢家问题是最优的投资组合。设gl表示基数为l的[m]的所有子集的集合。假设存在λ∈ [0,1]和p∈0,k这样对于所有人来说∈ [k] ,对于所有T∈ GLT以下保持(1-λ) pl(1-p) k级-l≤P\\我∈TEi\\\\j∈S\\TFcj≤(1+λ)pl(1-p) k级-l、 (7.8)然后是U(SW)-U(SL)U(SW)≤2ζ(3)λkp(1-p) ln公司1+b-又称作(1 -λ)(1 -(1 -p) k)。式中,ζ(s)是在s处计算的黎曼-泽塔函数,即ζ(s)=sPn=1ns。我们将从解释定理7.5的假设开始。我们首先考虑(7.8)。这种假设有效地限制了事件之间的依赖关系。

39
kedemingshi 在职认证  发表于 2022-6-13 23:03:12
为了获得一些直觉,考虑所有事件具有相同概率的情况,并让pi=p表示所有i∈[m] 。很明显,λ是事件之间依赖关系的度量。特别是,当事件是独立的时,我们可以选择λ=0,并且随着事件变得更加相关,我们希望我们必须选择一个更大的λ来保持方程(7.8)。此外,定理7.5并不要求所有事件的概率都相同,它只要求存在一些p∈0,k和一些λ∈[0,1],其中(7.8)适用。如果该项的pi值非常不同,那么定理7.5可能会产生一个非常弱的界。如果所有感兴趣的事件都有相等的获胜概率,那么我们再次让p=π表示所有i∈ [m] ,然后是假设p∈0,k这意味着对于任何大小为k的投资组合,预期的中奖项目数为一个或更少。对于我们感兴趣的应用程序,获胜的概率有些小,因此这似乎是一个合理的假设。定理7.5的主要观点是,对于我们感兴趣的特定应用程序,对数最优组合也必须是挑选赢家问题的一个很好的解决方案。在整个讨论过程中,假设定理中的条件成立。例如,假设λ=0.5,k=10,p=0.01。这假设单个项目获胜的概率很低,并允许存在某种相关性。对于可能的亨特、赛尼和扎曼:收益的赢取值,让我们假设b=10美元,a=1美元(这些是非常成功的退出的近似值,例如Facebook)。然后应用定理7.5,我们得到了目标函数(至少一个赢家的概率)中赢家和对数最优投资组合的百分比差小于27%。

40
可人4 在职认证  发表于 2022-6-13 23:03:15
这个例子说明,在这些与投资初创公司相关的条件下,挑选赢家问题的最优投资组合在性能上与逻辑最优投资组合相似。7.4. 布朗运动模型的投资组合构造我们现在讨论布朗运动模型的投资组合构造。将EIA定义为公司在未来某个时候退出的事件。我们希望建立一个由k家公司组成的投资组合,以最大限度地提高至少一家公司退出的可能性。为此,我们必须能够评估退出概率。在我们的模型中,这很容易做到。回想一下,对于一组公司S,我们定义U(S)=P硅∈软件工程研究所.我们现在展示如何计算退出概率。如果我们假设公司的业绩是独立的,那么我们只需要计算每个公司i的ispi=P(Ei)∈ S来构建投资组合。回想一下,这是公司布朗运动达到7级的概率 在有限的时间内。我们假设公司i给出了ui(t)和σi(t)。然后,从(4.2)中,退出概率ispi=limt→∞F(t;0,ui(t),σi(t),7). (7.9)此外,请记住,我们对βy的未来值不确定。这会导致漂移的不确定性,从而导致公司不再独立。要了解为什么会出现这种情况,假设我们得到了参数向量βy-1、当我们根据y年以前的数据进行培训时,情况就是这样-1并尝试为y年成立的公司建立投资组合。因此,我们需要知道βy=[βy1,βy2,…βyM]。回想一下,βyi与平均βy呈正态分布-1,i和标准偏差δi。这会导致y年成立的所有公司的随机漂移系数。我们不知道公司漂移的确切值,但我们知道,它们都会受到βy实际实现的相同影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 10:23