楼主: 大多数88
1092 52

[量化金融] 挑选赢家:一种数据驱动的质量评估方法 [推广有奖]

41
nandehutu2022 在职认证  发表于 2022-5-31 23:20:37
这就是不确定性如何在公司之间产生正相关性。为了计算U(S),我们简单地对βy中的不确定度进行平均。使用方程式(7.4)和(7.9),我们得到U(S)=Eβy“P[i∈软件工程研究所βy!#=1.-Eβy“Yi∈S(1-pi)#=1-Eβy“Yi∈S(1- 限制→∞F(t;ti,ui(t),σi(t),7))#. (7.10)Hunter、Saini和Zaman:Winning由于βyis联合正常,并且很容易计算F(·),因此可以使用蒙特卡罗积分轻松实现这一期望。对于我们的模型,因为我们选择的初创公司数量相当多,所以我们使用贪婪的方法创建我们的投资组合。这在计算上是可行的,因为在实践中,投资组合不会很大(典型的风险投资公司管理的公司不超过几百家),并且很容易对一组投资组合的美国进行评估。我们在第8.8节中考虑了使用我们的模型构建的投资组合的绩效。模型验证与挑选赢家组合虽然我们在许多不同年份测试了我们的模型,但我们报告了2011年和2012年的测试结果。我们之所以使用这些年,是因为这给了公司足够的时间来实现退出(我们收集了数据,以便在2016年末进行此分析)。对于每个测试年,测试集等于基线年(最早融资年)等于该年的公司,以及模型估计中使用的所有其他公司构成培训集。用于计算测试公司退出概率的功能仅使用在公司最早的一轮融资时可用的数据构建。我们使用方程式(7.2)中的贪婪投资组合构建方法。我们在两个假设下构建投资组合,一个假设是公司是独立的,另一个假设是公司是独立的。这两种假设的不同之处在于我们如何平均漂移参数的不确定性。

42
可人4 在职认证  发表于 2022-5-31 23:20:40
对于相依假设,我们联合对所有公司进行平均,如等式(7.10)所示。对于独立假设,我们分别对每个公司的不确定性方程(7.9)进行平均,然后使用由此产生的退出概率构建投资组合。使用蒙特卡罗积分进行平均。具体而言,对于每个β样本,我们从测试年β向量的每个元素的正态分布中随机抽取,平均值由β或β(取决于测试年)给出,标准偏差由δ中的相应元素给出。然后,我们对这些随机变量的相关函数求平均值。我们为第5节详述的模型构建了最多30家公司的投资组合,这对于一家典型的风险投资公司来说是合理的规模。我们还使用对应于公司在测试年之前实现的最大一轮的功能和标签,将我们的模型与有序LogisticRetression模型进行对比。为了可视化我们投资组合的绩效,我们绘制了投资组合规模与投资组合中退出图8中所选模型的公司数量的对比图。我们将其称为portfolioperformance曲线。它类似于机器学习中用于评估二进制分类器性能的接收器工作特性(ROC)曲线。我们考虑不同类型的投资组合。如前所述,有序逻辑回归是我们的基准模型。关联对应于我们的布朗运动模型的依赖性假设。完美对应于每个公司都退出的投资组合。随机对应于投资组合,其中退出数量是投资组合规模乘以测试集中退出的分数。

43
大多数88 在职认证  发表于 2022-5-31 23:20:43
对应的调车员Saini,和Zaman:赢得0 5 10 15 20 25 30投资组合规模0 5 10 15 20 25 30退出2012年Sequeoia CapitalFounders FundGreylock Capitalhosla Ventures KPCBhomoskedatsic Correlated Heteroskedastic Correlated Robust Heteroskedastic Correlated Ordered Logistic0 5 10 15 20 25 30投资组合规模0 5 15 15 20 25 30退出2011年Sequeoia CapitalFounders FundGreylock Capitalhosla Ventures KPCBA16homoskedatsicCorrelatedHeteroskedastic CorrelatedRobust Heteroskedastic CorrelatedOrdered LogisticPerfectRandomPerfectRandomFigure 8 2011年(左)和2012年(右)使用种子或系列基金公司构建的不同模型投资组合的绩效曲线。此外,还显示了风险投资公司Greylock Partners(Greylock)、创始人基金(Founders Fund)、Kleiner Perkins Cau field&Byers(KPCB)、红杉资本(Sequoia)和科斯拉创业公司(Khosla)的业绩。同时给出了随机投资组合和完美投资组合的绩效曲线,以供参考。随机挑选投资组合。我们还展示了这些年顶级风险投资公司的绩效点。这些点的坐标是风险资本投资的测试公司数量和2017年之前退出的公司数量。我们发现,稳健异方差模型在这两年的表现最好。2011年,该公司以10家公司的投资组合退出SSIX,退出率为60%。这高于图8所示的顶级风险投资公司。相反,同向和异向模型的表现并不一致。此外,有序逻辑模型在2011年的表现很糟糕,但与2012年的同质模型一样好。我们在表5和表6中列出了稳健异方差模型投资组合的公司。可以看出,Allexit是收购,比IPO更常见。

44
nandehutu2022 在职认证  发表于 2022-5-31 23:20:46
一些收购非常重要。例如,格力于2012年以2.1亿美元收购了2011年投资组合中的移动游戏公司Funzio(Cutler 2012)。我们在附录E.9中显示了所有车型和年份的投资组合。结论我们提出了一个利用在线数据评估初创公司质量的贝叶斯建模框架。我们首先分析了从数据集构建的特征,以从经验上了解影响公司成功的因素。然后,我们引入了一个布朗运动模型来描述创业公司融资轮的演化,以计算相关的退出概率。在此基础上,我们使用不同的似然或先验分布规范开发了布朗运动模型的四种变体。我们根据数千家公司的数据估算了这四个模型。因为我们关注的是aHunter、Saini和Zaman:WinningTable 5,这是我们2011年投资组合中使用贪婪优化和robustheteroskedastic相关模型构建的顶级公司。显示的是公司名称、达到的最高融资轮数、预测退出概率和贪婪目标值(至少一次退出的概率),当公司四舍五入到最接近的百分之一时。退出的公司以粗体突出显示。2011年公司最高融资轮退出概率目标值Funzio收购0.54 0.54长板媒体收购0.43 0.74 AirTouch Communications A 0.49 0.86 Sequent B 0.47 0.92 Bitzer移动收购0.47 0.95SHIFT收购0.44 0.96 LiveStar收购0.38 0.97Jybe收购0.40.98Whitetruf fl Seed 0.40.99A互动A 0.27 0.99表6 2012年公司排名采用贪婪优化和鲁棒异方差相关模型构建投资组合。

45
nandehutu2022 在职认证  发表于 2022-5-31 23:20:49
显示的是公司名称、达到的最高融资轮数、预测退出概率和贪婪目标值(至少一次退出的概率),当公司四舍五入到最接近的百分之一时。退出的公司以粗体突出显示。2012年公司最高融资轮退出概率目标值SQ收购0.76 0.76 MetaResolver收购0.73 0.93Trv C 0.67 0.97Glossi Inc Seed 0.75 0.99Boomerang Seed 0.71 0.99Alicanto A 0.3 1.0SnappyTV收购0.25 1.0AVOS Systems A 0.17 1.0Adept Cloud收购0.17 1.0Runa收购0.21 1.0贝叶斯建模框架,我们能够使用我们的参数估计来确定哪些特征与具有统计意义的成功公司相关。此外,我们使用层次贝叶斯模型(hierarchicalBayesian modeling)来估计行业特定模型,使我们能够深入了解不同行业的公司的成功因素是如何不同的。除了我们评估初创企业质量的框架外,我们还提出了挑选赢家框架,用于构建回报巨大或回报非常低的项目组合。我们将这个问题模拟为一个最大化至少一个项目获得高额回报或获胜的概率的问题。这种概率的子模块性允许我们使用agreedy方法有效地构建投资组合。我们将我们的投资组合构建方法应用于初创公司,这些公司具有这种顶级回报结构。为了计算获胜的相关概率,我们使用了估计的布朗运动模型。我们用我们的方法构建投资组合,其表现优于顶级风险投资公司。

46
kedemingshi 在职认证  发表于 2022-5-31 23:20:52
TheHunter、Saini和Zaman:Winningresults表明,我们的建模和投资组合构建方法是有效的,并为评估初创公司的质量提供了量化方法。这项工作还有几个后续步骤。一个是关于公司退出的处理方式。在我们的模型中,收购和ipo是等价的,但实际上ipo要难得多,可以带来更高的回报。我们的模型可以进行修改,以区分IPO和收购,也可以纳入IPO或收购的货币价值。对于IPO,该估值数据是公开的,但收购数据通常是私有的,可能很难获得。另一个方向涉及模型中使用的特性。虽然我们包含了许多相关功能,但可能还有其他有用的功能具有预测能力。例如,公司成立年份不同宏观经济指标的价值可能会影响其退出概率。除了所使用的功能类型之外,还可以探索将它们合并到模型中的方式。我们在特征与漂移和扩散之间使用了简单的线性映射。然而,使用非线性映射的更复杂模型可能会提高性能。附录A:证明A。定理7.1的证明我们通过将U(S)最大化问题化为最大覆盖问题,证明了U(S)最大化是NP难的。在这个问题中,一个给定了一个由n个元素组成的集合U和一个由U的n个子集组成的集合E={Ei}Ni=1,这样se∈EE=U。目标是从E中选择M集,使它们的并集具有最大基数。这是一个NP难优化问题。为了证明这是最大化U(S)的一个实例,我们假设样本空间Ohm 是可数的且与R元素是有限的。我们还假设每个元素ω∈Ohm 概率相等,即P(ω)=R-设F为的σ-代数Ohm.

47
nandehutu2022 在职认证  发表于 2022-5-31 23:20:55
对于任何集合S∈F、 我们可以写U(S)=R-1 | Sω∈Sω|。然后我们有马克斯E、 | S |=MU(S)=最大E、 | S |=MR-1.[ω∈Sω= 最大值E、 | S |=M[ω∈Sω.因此,最大化U(S)等价于最大覆盖问题。A、 2。引理1的证明函数U(S)是非负且非递减的,因为它是一组事件的概率。我们必须证明它也是子模。满足函数的子模函数S【v】-f(S)≥fT【v】-f(T)(A.1)对于所有元素v和集合S和T对,S T我们证明了函数U(S)是子模的,如下所示。我们假设概率空间的σ-代数为F。考虑集S,T,v∈F使S T我们可以在定义vS=vTS、vT=vTTTSc和v=vTTc的地方编写EV=VSSVTSV。那么我们有了T【v】-U(T)=P(v)Hunter、Saini和Zaman:WinningandUS【v】-U(S)=PvT[伏≥P(v)≥UT【v】-U(T),从而表明U(S)满足子模块化条件。A、 3。定理7.4的证明我们将首先定义一些符号。对于0≤ l≤ k、 设Gl(S)表示基数为l的S的所有子集的集合。此外,对于0≤q≤k、 我们还将事件Wq(S)和Yq(S)定义为以下Wq(S)=[T∈Gq(S)\\我∈TEi\\\\j∈S\\TEcjYq(S)=k[t=qWt(S)。特别是,Wq(S)是事件,其中事件EI的q正好为i∈发生。当然,Yq(S)是指EIQ或更多事件∈发生。使用这种表示法,当S是基数k时,我们得到以下v(S)=kXq=0P(Wq(S))lnqb+(k-q) ak公司=k-1Xq=0(P(Yq(S))-P(Yq+1(S)))lnqb+(k-q) ak公司+ P(Yk)lnkbk公司= ln(a)+kXq=1P(Yq(S))ln1+b-a(q-1) b+(k-q+1)a. (A.2)以上第二行源自Yq(S)和Wq(S)的定义,第三行源自对数的基本属性。我们现在将通过证明S=[k]使(A.2)中给出的和中的每一项最大化来结束,因此它是最大化V(S)。

48
能者818 在职认证  发表于 2022-5-31 23:20:58
现在,因为假设b>a,我们有1+b-a(q-1) b+(k-q+1)a> 0.对于所有q∈ [k] 。由于该值的正性,最大化(A.2)中给出的和中的每一项将减少最大化P(Yq(S))的问题。最后,我们证明了对于所有q,S=[k]使P(Yq(S))最大化∈ [k] 。如果[k]是P(Yq(S))的最大化子,那么我们就完成了。我们定义了SL=[k],出于矛盾的目的,我们假设存在基数k的S+,使得S+6=SL,且P(Yq(S+))>P(Yq(SL))。因此,我们知道存在ar∈S+和a t∈SLR/∈SL,t/∈S+,和pt≥pr,否则我们将得到S+=SL。然后从Yq(S)的定义来看,我们得到了thatP(Yq(S+))=prPYq(S+)| Er+ (1)-pr)PYq(S+)| Ecr= PYq(S+)| Ecr+ 公关部PYq(S+)| Er-PYq(S+)| Ecr= P(Yq(S+\\{r}))+prPYq公司-1(S+\\{r})-PYq(S+\\{r}).Hunter、Saini和Zaman:根据类似的逻辑,我们有That P(Yq(S+∪{t} \\{r})=P(Yq(S+\\{r}))+ptPYq公司-1(S+\\{r})-PYq(S+\\{r}).最后,Yq-1(S+\\{r}) Yq(S+\\{r}),因此P(Yq(S+))≤P(Yq(S+∪{t} \\{r}))。通过对不在SL中的S+的所有元素重复此论点,我们可以得出结论P(Yq(S+))≤P(Yq(SL))。然而,这是一个矛盾,因此SLI是P(Yq(S))的最大化子。A、 4。定理7.5的证明我们将以一种与第a.3节中的证明非常相似的方式开始。特别是,我们首先定义l的Wq和YQ∈[k] 如下wq(S)=[T∈Gq(S)\\我∈TEi\\\\j∈S\\TEcjYq(S)=k[t=qWt(S)。现在,让sk表示一个参数为k和p的二项式随机变量。然后,根据定理陈述中给出的假设,我们得到对数最优投资组合SL,p(Yj(SL))=kXi=jXT∈Gi(SL)P\\E∈TE\\\\F∈SL\\TFc≤kXi=jXT∈Gi(SL)(1+λ)pi(1-p) k级-i=(1+λ)kXi=jki公司pi(1-p) k级-i=(1+λ)P(Sk≥j) 。对于所有j∈[k] 。

49
何人来此 在职认证  发表于 2022-5-31 23:21:02
根据同样的逻辑,我们也得到了挑选赢家投资组合SW,P(Yj(SW))≥(1)-λ) P(Sk≥j) 。然后,利用方程(A.2)、上述不等式以及P(Y(S))=U(S)的事实,我们得到V(SL)-V(SW)≤(U(SL)-U(SW))ln1+b-又称作+ 2λkXj=2P(Sk≥j) ln公司1+b-aka+(j-1) (b)-(a).现在,使用切比雪夫不等式,一个二项式随机变量的方差,以及上面的不等式,我们得到了thatV(SL)-V(SW)≤(U(SL)-U(SW))ln1+b-又称作+ 2λkXj=2P(| Sn-kp公司|≥j-kp)ln1+b-aka+(j-1) (b)-(a)≤(U(SL)-U(SW))ln1+b-又称作+ 2λkXj=2kp(1-p) (j)-kp)ln1+b-aka+(j-1) (b)-(a).Hunter、Saini和Zaman:WinningNow,回想一下ln(1+x)≤x代表x>-1、因此(SL)-V(SW)≤(U(SL)-U(SW))ln1+b-又称作+ 2λkXj=2kp(1-p) (j)-kp)j-1.≤(U(SL)-U(SW))ln1+b-又称作+ 2λkp(1-p) kXj=2(j-1) 对于第二个不等式,我们使用假设p∈0,k. 给出了SV(SL)的进一步分析-V(SW)≤c项次1+b-又称作+ 2λkp(1-p) kXj=2(j-1)≤(U(SL)-U(SW))ln1+b-又称作+ 2λkp(1-p)∞Xj=1j≤(U(SL)-U(SW))ln1+b-又称作+ 2λkp(1-p) ζ(3)。(A.3)现在,由于SLI是对数最优的,我们得到了V(SL)-V(SW)≥使用此关系,我们可以重新排列方程式(A.3)以获得(U(SW)-U(SL))ln1+b-又称作≤2λkp(1-p) ζ(3)U(SW)-U(SL)≤2λkp(1-p) ζ(3)ln1+b-又称作. (A.4)我们使用定理7.5的假设和二项分布的基本性质,得出下一个下界U(SW)=P(Yj(SW))=(1-λ) P(Sk≥1)≥(1)-λ)(1 -(1)-p) k)。

50
可人4 在职认证  发表于 2022-5-31 23:21:05
(A.5)将该下限与方程(A.4)相结合,我们得到了最终结果。U(SW)-U(SL)U(SW)≤2λkp(1-p) ζ(3)ln1+b-又称作(1)-λ)(1 -(1)-p) k)。附录B:行业名称我们从Crunchbase数据库中使用的行业名称包括:3d打印、广告、分析、动画、应用程序、艺术智能、汽车、自动汽车、大数据、生物信息学、生物技术、比特币、商业智能、云计算、计算机、计算机视觉、约会、开发者API、电子商务、电子学习、edtech、教育、Facebook、,幻想运动、时尚、智能、金融、金融服务、能力、gpu、硬件、医疗保健、健康诊断、医院、保险、互联网、物联网、iOS、生活方式、物流、机器学习、医疗、医疗设备、消息传递、移动、纳米技术、网络安全、开源、个人健康、宠物、光共享、可再生能源、骑乘共享、机器人、,搜索引擎、社交媒体、社交网络、软件、太阳能、体育、交通、视频游戏、虚拟现实和虚拟化。Hunter、Saini和Zaman:WinningAppendix C:顶级学校名称用于顶级学校功能的学校有:伯克利、布朗、加州理工学院、卡内基梅隆、哥伦比亚、康奈尔、达特茅斯、杜克、哈佛、约翰霍普金斯、麻省理工学院、西北、普林斯顿、斯坦福、芝加哥大学、宾夕法尼亚大学、沃顿和耶鲁。附录D:MCMC取样器的详细信息我们使用Gibbs方案中的阻塞Metropolis从模型参数的后验分布中采样。在附录D.1中,我们描述了用于参数采样的Metropolis步骤的细节。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 08:07