楼主: nandehutu2022
1292 28

[量化金融] 自相关分量的噪声独立分量分析 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.2521
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-5-31 11:48:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Noisy independent component analysis of auto-correlated components》
---
作者:
Jakob Knollm\\\"uller, Torsten A. En{\\ss}lin
---
最新提交年份:
2017
---
英文摘要:
  We present a new method for the separation of superimposed, independent, auto-correlated components from noisy multi-channel measurement. The presented method simultaneously reconstructs and separates the components, taking all channels into account and thereby increases the effective signal-to-noise ratio considerably, allowing separations even in the high noise regime. Characteristics of the measurement instruments can be included, allowing for application in complex measurement situations. Independent posterior samples can be provided, permitting error estimates on all desired quantities. Using the concept of information field theory, the algorithm is not restricted to any dimensionality of the underlying space or discretization scheme thereof.
---
中文摘要:
我们提出了一种从噪声多通道测量中分离叠加、独立、自相关分量的新方法。所提出的方法同时重构和分离组件,同时考虑所有信道,从而显著提高有效信噪比,即使在高噪声区域也允许分离。可以包括测量仪器的特性,以便在复杂的测量情况下应用。可以提供独立的后验样本,允许对所有所需量进行误差估计。该算法利用信息场理论的概念,不局限于底层空间的任何维数或其离散化方案。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Physics        物理学
二级分类:Instrumentation and Methods for Astrophysics        天体物理学仪器和方法
分类描述:Detector and telescope design, experiment proposals. Laboratory Astrophysics. Methods for data analysis, statistical methods. Software, database design
探测器和望远镜设计,实验建议。实验室天体物理学。资料分析方法,统计方法。软件,数据库设计
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--
一级分类:Quantitative Biology        数量生物学
二级分类:Quantitative Methods        定量方法
分类描述:All experimental, numerical, statistical and mathematical contributions of value to biology
对生物学价值的所有实验、数值、统计和数学贡献
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Noisy_independent_component_analysis_of_auto-correlated_components.pdf (705.66 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:自相关 Quantitative Mathematical Astrophysics Experimental

沙发
大多数88 在职认证  发表于 2022-5-31 11:48:21
自相关分量的噪声独立分量分析。185748 Garching,GermanyLudwig Maximilians Universit–at M–unchen,Geschwister Scholl Platz 1,80539 Munich,Germany我们提出了一种从噪声多通道测量中分离叠加、独立、自相关分量的新方法。所提出的方法同时重建和分离组件,将所有通道都考虑在内,从而大大提高了有效信噪比,即使在高噪声条件下也能实现分离。可以包括测量仪器的特性,以便在复杂的测量环境中应用。可以提供独立的后验样本,允许对所有所需量进行误差估计。利用信息场理论的概念,该算法不局限于底层空间的任何维数或其离散化方案。关键词:信息论,概率论,随机分析,数据分析,时间序列分析,贝叶斯方法。引言在科学和技术领域的各种不同背景下,分离多通道测量中的独立源是一个基本挑战。对这种方法的极大兴趣来源于生物医学,即研究大脑活动的神经科学【1】,但也包括金融时间序列分析【2】或我们宇宙中天体物理成分的分离【3】,仅举几例。主要存在两种不同的成分分离方法,即主成分分析(PCA)和独立成分分析(ICA)。主成分分析对数据进行线性变换,以获得相互不相关的正交方向,即所谓的主成分。

藤椅
可人4 在职认证  发表于 2022-5-31 11:48:24
对于不同的主成分,如果对数据集进行平均,则其协方差消失:hssi- hsihsi=0(1)PCA在数据可以用正交过程描述的情况下非常有用。然而,这并不意味着独立性,因此高阶相关性可能不会消失[5]。获得的主要组件的数量取决于所涉及的数据空间的维度。其中一些组件是由生成数据的过程引起的,其他组件可能只是由噪声引起的。在这些组件类别之间划一条线需要仔细考虑获取数据的上下文。ICA只在其概率分布因式分解P(s,s)=P(s)P(s)(2)ICA算法试图通过最大化一些独立性度量来估计独立分量。使用了一些这样的度量,例如峰度、负熵或互信息来命名视图。这些都依赖于成分的非高斯统计。高斯成分的混合物仍然是高斯的,没有传统ICA中使用的非正交相关方向。因此,我们经常假设非高斯性是ICA的先决条件。然而,在时间或空间域中利用自相关会破坏这种高斯对称性,并允许识别组件【8】。PCA方法的一个例子是多元奇异谱分析(MSSA)[4],该方法可以在与本文讨论的方法非常相似的环境中使用。考虑到自相关,它也可用于有噪声的多通道测量情况。这是通过使用向量的多个延时版本扩展原始信道测量来实现的。

板凳
nandehutu2022 在职认证  发表于 2022-5-31 11:48:27
然后计算所有可能信道和时延的相关矩阵。将该矩阵对角化得到正交主分量,通过时间延迟合并时间相关性。然后,可以使用最相关的主成分来描述数据的主要特征,从而分析底层系统的动态特性。然而,我们想要确定数据中真正独立的成分,如等式2所示。为此,基于公式1中最弱标准的PCA方法是次优方法。在独立分量分析方面,我们有大量广泛使用的算法,其中比较流行的算法包括FastICA[6]和JADE[7],它们在无噪声环境中依赖于上述独立性度量。也不使用单个组件通常固有的时间或空间相关性。一种使用它的算法是AMUSE[8],它利用无噪声场景中的时间结构。ICA方法的一个问题通常是测量噪声的存在。噪声阻碍了单个组件的统一展示,并要求对问题进行概率描述。通过使用最大似然法【9】或高斯混合法【10】,已经进行了几种方法来解决这个问题。本质上,这种方法将遵循类似的路径。然而,到目前为止,文献中的一般建议是首先对测量进行去噪,然后将结果视为无噪声,然后使用suitbaleICA方法进行处理[11]。

报纸
kedemingshi 在职认证  发表于 2022-5-31 11:48:30
这种方法严重影响高噪声区域,因为它仅限于单个测量的信噪比。我们要介绍的方法将自相关概念与噪声测量相结合,并通过同时重建和分离组件来克服此限制,综合所有测量通道的信息,从而大大提高有效信号音调比,同时考虑各个组件的空间或时间相关性。使用这种方法,我们可以通过添加额外的通道来改善结果,即使在高噪声环境下也能获得令人满意的结果。我们通过遵循贝叶斯框架来实现这一点,以一致地将自相关性包括到成分的后验估计中。然而,后验值在分析上是不可访问的,最大后验值估计对于这个问题是不够的。因此,我们将提供一个能够捕捉其基本特征的真实后验的近似值。我们将使用Kullback-Leiblerdivergence在信息理论背景下对模型参数进行最优估计。此外,我们将制定非物理场的组成部分,而无需规定任何离散化。这使我们能够使用信息场理论语言(IFT)[12]开发一种抽象算法,该算法不受任何限制,可用于特定网格或特定数量的维度。IFT是领域信息论,推广了函数的概率分布的概念,即超连续空间。在这个框架中,我们可以制定一个先验分布来编码组件的自相关性。首先,我们描述了噪声独立分量分析的一般问题。在下一节中,我们将描述连续空间中的自相关,以及如何将其包含在我们的模型中。

地板
kedemingshi 在职认证  发表于 2022-5-31 11:48:33
第二节讨论了如何以可行的方式近似模型。四、 为了推断所有参数,我们必须从近似的后验数据中提取样本。我们描述了如何获取此类样品的过程。在简要说明了整个算法之后,我们讨论了它的收敛性,并在两个显示不同测量情况的数值示例上演示了它的性能。二、噪声ICA【13】描述了在存在噪声的情况下,不同混合物中相同成分的多次测量情况。在某个位置或时间x处的每个单独测量i产生数据di,x,其具有噪声贡献ni,x,以及所有组件sj,x的线性组合mijo,这些组件也具有一些空间或时间结构。这个过程的数据方程由Di给出,x=Mijsj,x+ni,x。(3)这里我们使用多个索引的求和约定。混合液在所有位置上的模拟量相等,因此不依赖于位置指数。我们可以简单地删除位置索引,将这些量解释为向量,从而简化上述方程的表示法。剩下的是测量和成分指数。di=Mijsj+ni(4)我们可以进一步引入多重测量向量d作为向量向量向量,包含单个测量值,噪声n,以及由所有分量组成的多重分量向量s。然后可以使用通常的矩阵与混合物M相乘,得到这个方程的无指数公式,即d=Ms+n。(5) 我们想用两种方式修改这个表达式。第一种方法是将组件描述为字段,而不是向量。一方面,真实的组件通常应该类似于一些物理现实,而不限于任何离散化,因此最好用连续字段来描述,thereforesj,x→ sj(x)。

7
何人来此 在职认证  发表于 2022-5-31 11:48:38
(6) 另一方面,我们的数据d永远不可能是具有有限分辨率的连续字段,因为这将对应于有限数量的信息。因此,有必要介绍测量过程的描述,其中某种仪器以混合连续组件的形式探测物理现实。一般来说,该仪器是一个线性算子,具有连续的物理域和离散的目标数据空间。包括该响应操作符R,数据方程为di,X=^dx Ri(X,X)Mijsj(X)+ni,X。(7)大写字母X表示数据的离散位置,而X是连续位置。我们可以再次删除所有索引,并在运算符符号D=RMs+n中陈述上述等式。(8) 现在,我们已经将数据域与组件解耦。我们也不能用有限的分辨率来表示组件,一旦我们想要进行数值计算,我们就必须以某种方式指定离散化,但引入响应操作符允许我们从数据和测量过程中选择完全独立的表示。响应操作符还允许我们考虑任何线性测量,使用不同的仪器对各个通道进行测量。可以很容易地以一致的方式包含屏蔽操作、卷积、变换或任何其他线性仪器特定特性。现在我们将推导此数据模型的可能性。在数据域中,噪声n将被假定为具有已知协方差n和消失平均值的高斯噪声。我们描述它asP(n)=G(n,n)=2πn | e-n+n-1n。(9) 表达式n+是复共轭转置噪声向量。这将通过矩阵乘法得到指数中的标量。利用这个数据方程,我们可以推导出数据d、给定分量s、混合M和噪声实现N的可能性。

8
能者818 在职认证  发表于 2022-5-31 11:48:41
这是一个增量分布,因为数据完全由给定数量决定。P(d | s,M,n)=δ(d- (RM s+n))(10)然而,噪声的实现并不有趣,我们将使用等式9中给出的高斯噪声模型将其边缘化。P(d | s,M)=Dnδ(d- (RM s+n))G(n,n)(11)=G(d- RM s,N)(12)取负对数为我们提供了似然的信息哈密顿量,也称为负对数似然。H(d | s,M)≡ - ln[P(d | s,M)]=(d- RM s)+N-1(d- RM s)+ln | 2πN |(17)III.自相关我们想要分离的成分表现出自相关,我们想要利用这个基本特性。分量si(x)在其连续域的每个位置都有一些值。我们将两个领域的scalarproduct定义为j+s≡'dx j*(x) s(x),其中j*(x) 表示场地jat位置x的复共轭。我们可以表示两点自相关asSi(x,x)≡ hsi(x)s*i(x)iP(si),(18)是一个线性运算符,用于编码组件si的内部相关性。假设统计同质性,两个位置ssi(x,x)之间的相关性仅取决于它们彼此之间的相对位置。Si(x,x)=Si(x- x) (19)信息哈密顿量来自信息论与统计物理的类比(或等效):P(s | d)=P(s,d)P(d)≡e-H(s,d)Z(d),信息哈密顿量(13)H(s,d)=- lnP(s,d)和配分函数(14)Z(d)=^Ds e-因此,H(s,d)(15)H(s,d)包含关于信号s的所有可用信息,并且通常是比等效概率分布进行do计算更实际的对象,因为信息哈密顿量是相加的:H(s,d)=H(d | s)+H(s)(16),现在,我们可以应用维纳·金奇诺雷姆(Wiener-Khinchintheorem)[14],并确定与相关谐波域相关的本征基,其中的频域对应于傅里叶基。

9
mingdashike22 在职认证  发表于 2022-5-31 11:48:44
这对于算法的实现很方便,因为它允许我们在傅里叶空间中应用相关运算符,其中它只是一个对角运算,并且也可以有效地实现分量的傅里叶变换。这种方法即使对于组件的高分辨率也是可行的,因为协方差的表示在傅立叶空间中大致呈线性,但在位置空间中呈二次方。对于在多个维度上具有相关性的组分,假设统计各向同性也可能是有利的。这样,相关性仅取决于两点之间距离的绝对值。然后我们可以用一维功率谱来表示相关结构。在本文中,我们假设组件的关联结构是已知的。原则上,它也可以通过关键过滤的数据推断出来[15]。临界滤波的思想是对功率谱进行参数化,并进一步推断其参数。这使我们能够在事先不知道相关结构的情况下分离自相关组件。关键过滤已成功应用于多个应用领域【16–18】,并可直接包含在此模型中。为了保持模型的简单,我们选择不在这里详细讨论这个案例。我们使用已知的相关结构SIT构造成分si的先验分布,为算法提供有关自相关的信息。具有此特性的信息量最小的先验是高斯先验,其均值和协方差为零(si)=G(si,si)。(20) 从概念上讲,这是连续场si上的高斯分布。在任何数值应用中,我们都必须以离散化的方式表示场,而该分布再次成为一个规则的多元高斯分布。

10
nandehutu2022 在职认证  发表于 2022-5-31 11:48:54
假设各分量独立,先验分布因式分解,我们写下eP(s)=YiG(si,si)(21)≡ G(s,s)。(22)高斯分布的乘积可以写成多分量向量s上组合高斯的紧凑形式,具有块对角相关结构,表示彼此不同分量的独立性,即hsi(x)sj(x)iP(s)=0,i 6=j。之前的独立性实际上实现了公式2中所述的任何ICA方法的基本假设。值得强调的是,这种制定相关结构的方式允许我们应用结果算法,而不考虑维度。最后,我们将演示一维情况以便于演示,但不作任何更改,该算法将推广到二维、三维和n维情况。甚至可以通过用相应的调和基替换fourierbase来考虑球面上弯曲空间上的相关性。该先验分布的信息哈密顿量由h(s)=s+s给出-1s+ln | 2πS |。(23)现在,我们根据数据模型和成分的先验分布构建了一个可能性,并对其自相关性进行编码。利用Bayes定理,我们可以导出组分s及其混合物M viaP(s,M | d)=P(d | s,M)P(s,M)P(d)的后验分布。(24)我们没有讨论混合物M的任何先验分布,因为我们无论如何都不想限制它。关于混合的任何特定问题的见解都应该在这里表达出来。在我们的情况下,以前的发行版可以写成asP(s,M)∝ P(s)=G(s,s)(25),因此隐式假设M的条目具有一定的独立先验。P(d)的评估不可行,因为它涉及联合概率分布的混合和信号的积分。因此,我们不得不考虑近似方法。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-27 01:33