楼主: mingdashike22
1576 25

[量化金融] 高维金融数据的若干统计问题 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-10 09:37:57
在前一个例子的情况下,在某些情况下,只要维数p的增长速度不超过样本量n.8.2质心规则和k-近邻规则,则朴素贝叶斯分类器输出rmsFisher判别函数。如果质心规则到第k类的质心的距离小于到任何其他类的质心的距离,则质心规则将对象分类到第k类。该方法的优点如K=2所示。假设nand nare FIXED和p→ ∞ 在每个类别中,观察值为iid。对高维金融数据的一些统计问题的观察19两类可分别用Z=(Z,Z,…,Z1p)和Z=(Z,…,Z2p)表示。假设p→ ∞,pPpi=1var(Z1i)→ σ、 pPpi=1var(Z2i)→ τ、 σ/n>τ/nandpPpi=1[E(Z1i)- E(Z2i)]→ κ新的观察结果正确分类,概率收敛到1 asp→ ∞ ifκ≥σ/n-τ/n【15】。k-近邻规则通过训练数据中k个最近的数据点来确定新观测的clas。新的观察家被分配到最接近tog(X)=kXi:Xi的类别∈Nk(X)yi其中,Nk(X)是X.8.3支持向量机在贝叶斯分类中的k个最近点集,正如我们所讨论的,我们试图最小化关于g(.)的EPII(g(X)6=Y)。但很难使用s指示器函数。s指示器函数既不是光滑的,也不是凸面的。因此可以考虑使用凸损失函数。支持向量机(SVM)声称可以解决这个问题。假设对于二进制分类问题,Y取-1和1表示两个类。SVM用凸hing e损失H(x)=[1]代替零一损失- x] +其中,[u]+=max{0,u},u的正部分。SVM尝试最小化相对于g的epiH(Yig(Xi))+λJ(g)。这里λ是tunning参数,J是g的复杂度惩罚。如果最小值为^g,则SVM分类被视为符号(^g)。

22
可人4 在职认证  发表于 2022-6-10 09:38:00
J(.)可被视为Lpenalty。结果表明,函数极小化E(H(Y g(X))+λJ(g))为正号(P(Y=+1 | X=X)-) [19]. 与Bayes Classifier SVM中的P(Y | X=X)不同,Infac t直接尝试估计决策边界{X:P(Y=1 | X=X)=}。8.4 AdaBoostAmong最近开发的最重要的方法之一是Boosting。这是一种将许多“弱者”分类结合起来形成强大“委员会”的方法。AdaBoost是最常用的Boosting算法。该算法的一个有趣结果是,它不受过度拟合的影响,即随着越来越多的分类器的加入,测试误差会持续减小。假设我们有两个类,表示为-1和1,并用y表示。我们有n个训练数据点(x,y),(x,y)。。。,(xn,yn)。我们希望产生一个委员会F(x)=PMi=1cmfm(x),其中FMI是一个弱的20 Arnab Chakrabarti和Rituparna Senclasso fier(值为1或-1) 这比随机猜测要好。初始分类FMS是在加权版本的训练样本上进行训练的,为当前错误分类的案例赋予更多权重。最终预测将基于符号(F(x))。以下算法称为ddiscrete AdaBoost(因为初始分类器只能获得两个离散值+1和-1)[13]。离散AdaBoost算法:1。对于i=1(1)n2,从权重wi=/n开始。重复m=1(1)m:a。拟合分类器fm(x)∈ {-1,1},权重为训练数据。b、 计算误差r em=Ew[I(y6=fm(x))],其中Ew是对训练数据的期望,权重为w=(w1,w,…,wn)和I(.)是一个指示器功能。c、 cm=对数(1-emem)d.设置wi← wiexp[cmI(yi6=fm(xi))]对于i=1,2。。,n,然后重新规范化为getPiwi=1.3。最终分类:标记(PMm=1cmfm(x))基本分类(fm(.))离散的AdaBoost算法是二进制的。

23
nandehutu2022 在职认证  发表于 2022-6-10 09:38:04
它可以进一步泛化,以获得对离散AdaBoost算法的修改。Real AdaBoost算法:1。对于i=1(1)n.2,从权重wi=/n开始。重复m=1(1)m:a。拟合分类器以获得类别概率估计值pm(x)=^Pw(y=1 | x)∈ [0,1],训练数据上的权重w=(w,w,…,wn)。b、 设置fm(x)←日志(pm(x)/(1- pm(x)))∈ R、 c.设置wi← wiexp公司[-yifm(xi)],i=1,2。。,n并重新规范化,使piwi=1.3。最终分类标志【Pmfm(x)】。可以看出,AdaBoost分类方法与前向阶段的加性logistic回归模型相当[13]。结论:随着高维经济和金融数据的可用性,许多经典统计方法表现不佳。我们讨论了与高维金融数据推断相关的一些常见问题。在许多方法中,一些高维财务数据的统计问题可以通过偏差-方差权衡得到显著改善。讨论了问题的一些可行解和一些有效算法。值得注意的是,还有许多其他挑战与高维数据有关。基于模拟研究提出了一些解决方案,但没有理想的理论调整。参考文献1。Yoav Benjamini和Yosef Hochberg。控制错误发现率:一种实用且强大的多重测试方法。皇家统计学会杂志。系列B(方法学),第289–300页,1995.2。Peter J Bickel、Elizaveta Levina等。Fisher线性判别函数、朴素贝叶斯的一些理论,以及当变量比观测值多时的一些选择。伯努利,10(6):989–10102004.3。Peter J Bickel,Elizaveta Levina,等。阈值化协方差正则化。

24
大多数88 在职认证  发表于 2022-6-10 09:38:07
《统计年鉴》,36(6):2577–26042008.4。弗拉基米尔·博金斯基(VladimirBoginski)、塞尔吉·布滕科(SergiyButenko)和帕诺斯·帕达洛斯(Panos M Pardalos)。金融网络的统计分析。《计算统计与数据分析》,48(2):431–4432005.5。托尼·蔡和刘卫东。用于稀疏协方差矩阵估计的自适应阈值。《美国统计协会杂志》,106(494):672–6842011.6。加里·张伯伦和迈克尔·罗斯柴尔德。大型资产市场的套利、因子结构和均值方差分析,1982.7。陈一伦、阿米·维塞尔和阿尔弗雷德·奥赫罗。高维方差矩阵的收缩估计。声学、语音和信号处理,2009年。ICASSP 2009。IEEE国际会议,第2937–2940页。IEEE,2009.8。阿瑟·P·邓普斯特。协方差选择。生物特征学,第157–175页,1972.9。Mathias Drton和Michael D Perlman。高斯模型选择中的多重测试和误差控制。《统计科学》,第430–4492007.10页。布拉德利·埃夫隆。大规模推理:估计、检验和预测的经验贝叶斯方法,第1卷。剑桥大学出版社,2012.11。托马斯·费舍尔和孙晓倩。高维多元正态协方差矩阵的改进stein型收缩估计。《计算统计与数据分析》,55(5):1909–19182011.12。Jerome Friedman、Trevor Hastie和Robert Tibshirani。图形套索稀疏逆协方差估计。生物统计学,9(3):432–4412008.13。Jerome Friedman,Trevor Hastie,Robert Tibshirani,et al.《加性逻辑回归:促进的统计观点》(作者进行了讨论和反驳)。《统计年鉴》,28(2):337–4072000.14。LR办公室。多元正态协方差矩阵的经验贝叶斯估计。《统计年鉴》,第586-5971980.15页。彼得·霍尔、詹姆斯·斯蒂芬·马龙和一位蒙农·尼曼。

25
何人来此 在职认证  发表于 2022-6-10 09:38:10
高维、低样本数据的几何表示。皇家统计学会杂志:Serieb(统计方法),67(3):427–4442005.16。Ian T Jolli ffe、Nickolay T Trenda filov和Mudassir Uddin。基于o类的修正主成分技术。计算与图形统计杂志,12(3):531–5472003.17。Olivier Ledoit和Mi chael Wolf。高维方差矩阵的一个条件估计。多元分析杂志,88(2):365–4112004.18。尚宝林。协方差矩阵四种估计量的蒙特卡罗比较。多变量分析,6:411–4291985.22 Arnab Chakrabarti和Rituparna Sen19。Yi Lin.分类中的支持向量机和贝叶斯规则。数据挖掘与知识发现,6(3):259–2752002.20。Brett Naul、Bala Rajaratnam和Dario Vincenzi。等渗算法在斯坦因协方差矩阵估计中的作用。计算统计,31(4):1453–14761016.21。Theophilos Papadimitriou、Periklis Gogas和Georgios Antonios Sarantitis。欧洲商业周期同步:复杂网络视角。《经济学和金融网络模型》,第265-275页。斯普林格,2014.22。Mohsen Pourahmadi。高维协方差估计:高维数据,第882卷。John Wiley&Sons,2013.23。亚当·J·罗斯曼。大协方差矩阵的正定义估计量。Biometrika,99(3):733–7402012.24。Adam J Rothman、Elizaveta Levina和Ji Zhu。具有协方差估计的稀疏多元回归。《计算与图形统计杂志》,19(4):947–9622010.25。朱利安·谢弗和科尔宾·斯特里默。大规模协方差矩阵估计的收缩方法及其对功能基因组学的意义。遗传学和分子生物学中的统计应用,4(1),2005.26。查尔斯·斯坦。

26
kedemingshi 在职认证  发表于 2022-6-10 09:38:14
多元正态分布均值的常用估计的不可容许性。技术报告,斯坦福大学,美国斯坦福大学,1956.27。查尔斯·斯坦。协方差矩阵的估计,rietz讲座。1975年和1975年在佐治亚州亚特兰大举行的第39届年会上。Charles Stein等人,《多元非线性分布平均值的常规估计的不可容许性》。《第三届伯克利数学统计与概率研讨会论文集》,第1卷,第197-206页,1956.29。N Vandewalle,F Brisbois,X Tordoir,et al.《股票市场的非随机拓扑》。《定量金融》,1(3):372–3742001.30。Daniela M Witten、Robert Tibshirani和Trevor Hastie。一种惩罚矩阵分解,应用于稀疏主成分和典型相关分析。生物统计学,10(3):515–5342009.31。薛凌舟、马时谦、邹辉。正定义1-大协方差矩阵的惩罚估计。《美国统计协会杂志》,107(500):1480–149120012.32。袁明和林怡。高斯图形模型中的模型选择和估计。Biometrika,94(1):19–35,2007年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 09:39