相关日志
-
-
分享
8种量化因子模型选股
-
accumulation 2017-3-14 17:09
-
一、基本面量化选股模型 1.风格轮动量化选股模型:利用市场的风格特征进行投资,比如投资者有时偏好成长股,有时偏好价值股,投资者不同的交易行为形成了市场风格,在风格转换的初期介入,是可以获得较大的收益。相对来说,投资风格是针对股票市场的,投资于具有共同收益特征、价格行为的股票。 2.多因子量化选股策略:采用一系列的因子作为选股标准,买入满足这些因子的股票,卖出不满足的。可以说是应用最广泛的一种选股模型。多因子选股模型有两种判断方法:①回归法:在过去股票收益率的基础上,对多因子进行回归后将得到一个回归方程,回归方程内代入最新的因子值,得到一个对未来股票收益的预判,再以此为依据进行选股;②打分法:根据各个因子的大小对股票进行打分,再对个股的所有因子值进行加权得到一个总分,根据总分挑选出分数较高的股票。总体来说,打分法主观性较强烈,但也相对较为直观、稳健。 3.行业轮动模型:经济周期的原因,所以会有一些先启动的行业,而有的行业跟随,对这些轮动的行业依次进行配置,就能获取很大的收益。那么,行业轮动策略有效性原因是什么呢?内在价值影响着资产价格,且随着宏观经济因素变化而波动。 二、市场行为量化选股模型 1.动量反转量化选股模型:股票强弱变化的情况,过去一段时间表现好的股票,在下一段时间表现依然出色,叫做动量效应。过一段时间表现较差的股票,在接下来的时间里走强,叫做反转效应。在动量效应持续时买入强势股,出现反转效应时买入弱势股。熊市中动量策略表现出色,牛市中反转策略将有更好表现。 2.资金流量化选股模型:是一种反映股票供求关系的指标,利用资金流向判断股票的跌涨,把资金流入流出的情况编成指标,未来一段时间内股票的涨跌情况,就可通过该指标来判断,与此同时构建相应的投资策略。 3.一致预期量化选股模型:利用大多数分析师的看法来进行股票的买入卖出操作。预期基本面因子分为两种:①预期成长因子;②预期估值因子。在构建量化选股模型中,需要综合预期基本面因子和预期情绪面因子。 4.趋势追踪量化选股模型:本质上来说,趋势追踪是一种追涨杀跌策略,当股价出现上涨趋势时追涨买入,出现下跌趋势时杀跌卖出,有很多指标可判断趋势,比如EMA、MACD、MA等,而均线策略是当中既简单又有效的。 5.筹码选股量化选股模型:如果主力资金慢慢收集筹码时,就是要拉升一支股票,而慢慢分派筹码时,是要卖出一支股票,想要预测股票未来上涨或下跌,可以根据筹码的分布和变动情况。
-
个人分类: 金融工程|0 个评论
-
-
分享
宏观经济模型的多样化需求(转)
-
Yiqing_Lv 2017-2-12 15:54
-
Blanchard 教授说:“不同研究目的需要不同类型的宏观模型。” 本文主要关注两类模型 : 理论模型 ,旨在一般均衡框架下阐述理论问题。这类模型应该构建于核心解析框架之上,并有严谨的理论结构。例如,它们应该被用于分析银行资本比率提高的影响,或者分析公共债务管理的效应,或者分析特殊形式的非传统货币政策效应。而核心框架就是被广泛接受来当做基准点,并可以适应新增扭曲要素的分析框架。简而言之,它应该推进宏观理论学家之间的探讨。 政策模型 ,旨在分析现实宏观经济政策问题。这类模型应该拟合数据的主要特征,包括动态性质、允许政策分析以及反事实分析。例如,它们应该被用作分析中国经济增速放缓对美国的影响,或者美国财政扩张对新兴市场的影响。 如果一个模型能同时达到这两个目的,即严谨、精炼的理论结构以及较好地拟合数据,那么这是非常棒的模型。但是这也是一场白日梦。可能,经济研究(至少在宏观中,以及 Blanchard 的个人研究经历)的主要启示之一就是研究结果乱七八糟,理性化总体动态性质非常困难,以及随着时间推移许多经济关系都不稳定。这可能并不奇怪。例如,我们知道加总过程会使得总体关系与其个体行为之间没有多少联系。 因此,旨在同时达到两个目的的模型都注定在两个维度上失败 。 使用理论模型。 DSGE 建模者会通过增加外部消费习惯(不仅仅是有规律的、旧的习惯),投资调整成本(不仅仅是资本变化的成本),以及价格指数(我们在现实中观察不到的指数)等等来扩展原始模型结构。建模者就会面对复杂的动态性质以及数据拟合程度的合意性。这些扩展完全是临时设置的,没有对应于任何微观证据,且使得利率模型结构变得更加繁重、更加不透明。 使用政策模型。政策分析建模者关注于紧缩他们所建立模型的理论结构。且在某些情况下,建模者尝试从一些最优化形式中得到所观测的滞后结构。例如,在美联储所使用的主要模型中—— FRB/US 模型,动态方程受约束于解高阶调整成本结构下的最优化问题。而实际动态性质可能反映了许多因素,而非调整成本。且这种强加的约束(例如,过去和预期未来进入这些方程的方式)没有一点理论上或者经验上的正当理由。 那么,我们还能做什么呢? Blanchard 的建议是这种类型模型应该分别按照它们的方向推进。 DSGE 的建模者应该接受这样一种事实:理论模型不能,也应该不会紧密拟合实际。理论模型应该刻画那些我们所认为的必要的企业与人们行为特征,而不是尝试刻画所有相关的动态性质。那么,这类模型就仅仅只用作它们自身的目的,且保留简单的结构,为理论探讨提供一个平台。 政策分析建模者应该接受这样一种事实:真正能拟合数据的方程则有宽松的理论框架。在这类模型中,早期的宏观也有其合理之处:恒久性收入理论,生命周期理论,投资 Q 理论都为消费和投资行为的结构提供指导,然后数据决定最终的结构形式。 两种类型的模型发生相互作用,并彼此相互促进。借用 R. Reis 的话,它们之间应该进行科学的整合。但是, Blanchard 认为完全的整合已经被证明是反生产性的。没有模型是万能的,放之四海而皆准。 启示: (以下启示纯属个人观点和理解,与很多师友交流过。如不同意,敬请谅解,也非常欢迎大家相互交流对理论模型的理解与建模经验) 一、任何理论模型都只是现实经济现象和机制的一种简化,其建立在一系列的假设之上; 二、从目前的主流经济研究文献来看,在论文中使用理论模型(数理模型)主要有两个目的: 1 、利用数学语言阐述现有经济理论或者经济机制,正如 1906 年马歇尔写给鲍利的信中所言,数学只是一种语言,其它什么都不是。而阐述机制和待验证假设的另一种形式是利用语言逻辑(系统阐述各种理论观点和不同的机制,从而得到所要验证的经济机制或传导路径。类似于文献回顾); 2 、构建理论(数理)模型来拟合现实数据,进而用于反事实研究或预测,例如 Chari , Kehoe et al. ( 2007 , Econometrica ; 2016 , NBER )所提出的 BCA ( Bussiness Cycle Accounting ),以及 Aghion et al. ( 2016 , JPE )、 Acemoglu etal. ( 2016 , JPE ; 2017 , AER )所做的研究,等等。 三、由于上述两个相异的目的,评价(选择或构建)理论模型时也会存在不同的标准或者原则,但两个共同的原则是: 1 、假设是否具有现实基础,或者是否能解释现实,这里所讲的是假设与(微观或宏观)现实匹配的程度(或能力)。正如上文所述,任何模型(理论或者计量)均是现实的简化,不可能完全与现实经济运行相符,因此,争取使模型具有某种现实基础或在某种程度上匹配现实( Blanchard , 2016 , 2017 ; Prescott , 2016 ); 2 、奥卡姆剃刀 ( Occam’sRazor )原则,即在达到同样效果(或目的)的情况下,模型应该尽可能简化( Korinek , 2016 )。那么,大部分人(或者大部分做回归分析的研究者)使用理论模型所要达到的效果是什么呢?无非就是得到 待验证的假设或者机制 。这个假设和机制可能是成熟理论,也可能是新的发现和机制,那么这就不必然要求新的、复杂的模型结构。反而成熟的、简洁的核心框架更能令人信服。这正如麦克斯韦方程组一样,麦克斯韦最初提出的电磁理论后来经过赫兹等人的整理,提炼出一个就极其优美的核心——麦克斯韦方程组,它在数学上完美得难以置信。它刚问世,就被世人惊为天物,其表现出的简洁、深刻、对称使得每一个科学家都陶醉其中,后来被玻尔兹曼情不自禁的引用歌德的诗句说:“难道是上帝写的这些吗?”(转引自曹天元:《上帝掷骰子吗?:量子物理史话》( 2011 年简体中文版)。也可参见公众号“ 算法与数学之美 ”的相关内容) 在第二篇短文中(香樟推文 0586 ), Blanchard 教授讨论了另一些宏观模型,包括局部均衡模型、教学与交流使用的小型 toy 模型、用于预测的缩减形式模型,等。这些模型都发挥着重要的作用。 法国有一句恰当的谚语来描述这种情形:“ The marriage of a carp and a rabbit ”。 现存的 DSGEs 还有许多问题,且这些问题都在之前的文章中讨论过。 讽刺地是, Blanchard 觉得自己非常接近 Prescott 对于这一问题的观点。 Prescott 不喜欢将计量经济学用于理论研究的目的。 正如 R. C. Fair ( 2015 )指出,政策分析与允许前看、理性预期之间没有出现不相容现象。(可参见公众号“宏观经济学研学会”最近的新书推荐)
-
个人分类: 宏观经济学学习材料汇总|42 次阅读|0 个评论
-
-
分享
对DSGE模型的进一步思考:共识与改进方向(转)
-
Yiqing_Lv 2017-2-12 15:43
-
最近,许多经济学家都写了关于动态随机一般均衡模型(DSGEs)的优缺点。除了我自己前段时间的那篇文章(DSGE模型会有未来吗? 香樟推文0530 )之外,还有Narayana Kocherlakota, Simon Wren-Lewis, Paul Romer, Steve Keen, Anton Korinek, Paul Krugman, Noah Smith, Roger Farmer, and Brad Delong。 共识 在学术界,以下三个命题具有广泛的共识:1、宏观经济学是关于一般均衡的学科。 2、不同的一般均衡模型用于不同的目的。对于研究和教学的目的,评价模型的标准应该简明。就此目的,玩具模型(编者注:toy model与serious model对应)是种不错的工具。而对于预测目的来说,评价模型的标准应该是预测精度。就眼下而言,纯统计模型可能是最好的工具。对于条件预测来说,例如,评估政策变化的效应时,则需要更多的结构模型,而这些结构模型需要更好地拟合数据,而不需要坚实的微观基础。 3、局部均衡建模和估计对于理解宏观经济学相关的特定机制十分必要。只有很好理解了这些机制的时候,才能理解它们的一般均衡效应。然而,并不是每一个宏观经济学家都应该运用一般均衡进行研究(这正如劳动分工一样)。 分歧 以下两个命题存在更多的争论: 1、在一般均衡模型的华丽外衣之下,DSGEs的作用就是提供一个基准的宏观经济麦卡诺集(编者注:Meccano,一个模具制造系统,此处指代的是宏观经济的整合平台)。例如,一个正式的分析平台,该平台可以用于新元素的讨论与整合:举例来说,这些元素作为基础单元,它们都来自于对下列问题的讨论,劳动市场中讨价还价的作用,产品市场中价格设定的作用,金融中介中银行的作用,流动性约束对消费的作用,多重均衡的范围等等。有一些人似乎认为这是一个很危险,且事与愿违的梦想。而且这些事都很浪费时间,或者至少会有很高的机会成本。但是我并不这么认为。我认为追求这样的一种结构模型是合意的,并且可以实现的。 2、DSGEs发挥作用的唯一途径就是它们是否构建在明晰的微观基础上。这并不是因为具有微观基础的模型比其他模型更神圣,而是因为任何其他的方法在整合新的因素,然后形成一个正式的相互作用等方面显得非常困难。对于那些相信没有扭曲(即是说,那些信奉原始RBC世界观)的人来说,这是一种简单明了的方法。而对于像我们这种信奉有许多与宏观经济波动相关的扭曲存在的人来说,这将是一条漫长而艰辛的旅程,在这一过程中要引入许多扭曲,而且最终也会有造就一个不完美模型的风险。人们希望能找到一条捷径和另一个起点。但是我并不认为捷径或者另一个起点会存在。 前进的方向 如果人们不接受以上两个命题,那么,DSGEs就没有一条清晰的前进道路来结束这些争论。但是在我们一生中,仍然有许多可做之事。然而,如果人们接受上述观点(即使不情愿),那么,大规模放弃DSGEs就不是一个选项了。因此,我们就必须要讨论微观基础的本质和目前这些模型所包含扭曲的本质,以及我们如何才能做得更好。 目前的DSGEs代表了一个基准的整合平台吗(编者注:原文用的Meccano set)?在这一平台中,大部分宏观经济学家都愿意将其作为一个开始工具来使用?(对于那些Meccano狂热者来说,Meccano set的数量为10。且Meccano公司确实已经经受住了主要的危机,并重新进行投资——这给了DSGE建模者以启示)但我认为这个问题的答案是否定的。(在我的上一篇文章中,并没有表达对这个问题的反对态度。)因此,对于我来说,研究的先后顺序十分清晰: 首先,我们能写出一个基准模型来使得我们中的大部分人愿意用它来作为出发点吗?在早期,类似于IS-LM模型那样的方式就是一个被广泛接受的起点。假定技术取得了进步,并且模拟程序易于使用,那么,这样的一种模型肯定会比IS-LM模型更复杂,但却要易于理解。对我而言,这意味着要从新凯恩斯模型开始,但是模型中要带有更现实的消费和价格设定方程,要带有资本增量和投资决策。 其次,我们能在不同维度探讨一些严肃的改进吗?我们能建立一个更现实的消费者行为模型吗?当保留人们和企业关心未来的概念时,我们如何脱离理性预期?引入金融中介的最好方式是什么?我们如何处理加总问题(大部分已经被扫除了)?我们如何推进估计(这一点存在严重缺陷)?在不同情形下,如果我们不喜欢目前做事的方式,我们提出的备择方式又是什么呢?这些都是必须要进行讨论的内容,而不是群情激昂地宣称我们是否要运用DSGEs,或者更一般的说,宏观经济学是否有用。
-
个人分类: 宏观经济学学习材料汇总|43 次阅读|0 个评论
-
-
分享
房价预测
-
accumulation 2017-1-5 18:40
-
自变量 Index 的参数等于 5.53 ,其 p-value 等于 0.00 。一元回归模型的 R-squared=96% 。 从结果上看,利用北京市房价指数 Index 计算北京市房价 Price 的方法具有一定的稳健性。用 Index 计算出 1994 年 11 月至 2007 年 5 月的北京市房价 Price ,其房价的变化趋势如下图: 从图像上看,北京市房价在 2001 年后呈现快速上升的趋势。特别地, 2006 年 1 月后,北京市房价的上涨速度加快,平均月房价上涨速度达到 1.99% 。因此,北京市房价存在泡沫,偏离其基本面价值的假设是合理的。 首先,需要对影响北京市房价的基本面因素进行选择与分析。对于基本面因素的选择,可以从需求因素、供给因素两个方面考虑。
-
个人分类: 金融学|0 个评论
-
-
分享
sas流失模型学习_20160808
-
xulimei1986 2016-8-8 16:05
-
/*******************************梦幻流失模型(logistics)*********************/ /***********************系统按比例随机抽样******************/ /********************************************************************** * PRODUCT: SAS * VERSION: 9.3 * CREATOR: External File Interface * DATE: 28SEP12 * DESC: Generated SAS Datastep Code * TEMPLATE SOURCE: (None Specified.) ***********************************************************************/ data WORK.BASE ; %let _EFIERR_ = 0; /* set the ERROR detection macro variable */ infile 'E:\梦幻\logout.txt' delimiter='09'x MISSOVER DSD ; informat VAR1 yymmdd10. ; informat VAR2 $40. ; informat VAR3 best32. ; informat VAR4 best32. ; informat VAR5 best32. ; informat VAR6 best32. ; informat VAR7 best32. ; informat VAR8 best32. ; informat VAR9 best32. ; informat VAR10 best32. ; informat VAR11 best32. ; format VAR1 yymmdd10. ; format VAR2 $40. ; format VAR3 best12. ; format VAR4 best12. ; format VAR5 best12. ; format VAR6 best12. ; format VAR7 best12. ; format VAR8 best12. ; format VAR9 best12. ; format VAR10 best12. ; format VAR11 best12. ; input VAR1 VAR2 $ VAR3 VAR4 VAR5 VAR6 VAR7 VAR8 VAR9 VAR10 VAR11 ; if _ERROR_ then call symputx('_EFIERR_',1); /* set ERROR detection macro variable */ run; proc surveyselect data=m1 out=M1_xunlian method = sys samprate=0.75 seed =335 /*seed用来指定 proc surveyselect data=m1 out=M1_ceshi method = sys samprate=0.25 seed =214 ; run; /*****************数据预处理************/ %macro deal_data(in_dataset,/*输入数据集*/ datatype,/*建模/预测*/ ); data Base_Churn_datatype; set in_dataset; /*观察窗口前2月每两周的登入次数及时长************************/ P1W_TIMES = times1+times2; P2W_TIMES = times3+times4; P3W_TIMES = times5+times6; P4W_TIMES = times7+times8; P1W_DUR = dur1+dur2; P2W_DUR = dur3+dur4; P3W_DUR = dur5+dur6; P4W_DUR = dur7+dur8; /*最大、最小、平均登入时长************************/ max_dur=max(of dur1-dur8); min_dur=min(of dur1-dur8); mean_dur=mean( of dur1-dur8); /*观察窗口前2月每两周的登入次数占比,以及变化情况************************/ P1W_TIMES_ration=P1W_TIMES/sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES); IF sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES)=0 THEN P1W_TIMES_ration=0; P2W_TIMES_ration=P2W_TIMES/sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES); IF sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES)=0 THEN P2W_TIMES_ration=0; P3W_TIMES_ration=P3W_TIMES/sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES); IF sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES)=0 THEN P3W_TIMES_ration=0; P4W_TIMES_ration =P4W_TIMES /sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES); IF sum(P1W_TIMES,P2W_TIMES,P3W_TIMES,P4W_TIMES)=0 THEN P4W_TIMES_ration=0; BHUA_TRATION1=(P2W_TIMES-P1W_TIMES)/P1W_TIMES; IF P2W_TIMES-P1W_TIMES=0 AND P1W_TIMES=0 THEN BHUA_TRATION1=0; IF P2W_TIMES-P1W_TIMES NE 0 AND P1W_TIMES=0 THEN BHUA_TRATION1=1; BHUA_TRATION2=(P3W_TIMES-P2W_TIMES)/P2W_TIMES; IF P3W_TIMES-P2W_TIMES=0 AND P2W_TIMES=0 THEN BHUA_TRATION2=0; IF P3W_TIMES-P2W_TIMES NE 0 AND P2W_TIMES=0 THEN BHUA_TRATION2=1; BHUA_TRATION3=(P4W_TIMES-P3W_TIMES)/P3W_TIMES; IF P4W_TIMES-P3W_TIMES=0 AND P3W_TIMES=0 THEN BHUA_TRATION3=0; IF P4W_TIMES-P3W_TIMES NE 0 AND P3W_TIMES=0 THEN BHUA_TRATION3=1; /*观察窗口前2月每两周的登入次数占比,以及变化情况************************/ P1W_DUR_ration=P1W_DUR/sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR); IF sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR)=0 THEN P1W_DUR_ration=0; P2W_DUR_ration=P2W_DUR/sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR); IF sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR)=0 THEN P2W_DUR_ration=0; P3W_DUR_ration=P3W_DUR/sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR); IF sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR)=0 THEN P3W_DUR_ration=0; P4W_DUR_ration =P4W_DUR /sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR); IF sum(P1W_DUR,P2W_DUR,P3W_DUR,P4W_DUR)=0 THEN P4W_DUR_ration=0; BHUA_DRATION1=(P2W_DUR-P1W_DUR)/P1W_DUR; IF P2W_DUR-P1W_DUR=0 AND P1W_DUR=0 THEN BHUA_DRATION1=0; IF P2W_DUR-P1W_DUR NE 0 AND P1W_TIMES=0 THEN BHUA_DRATION1=1; BHUA_DRATION2=(P3W_DUR-P2W_DUR)/P2W_DUR; IF P3W_DUR-P2W_DUR=0 AND P2W_DUR=0 THEN BHUA_DRATION2=0; IF P3W_DUR-P2W_DUR NE 0 AND P2W_DUR=0 THEN BHUA_DRATION2=1; BHUA_DRATION3=(P4W_DUR-P3W_DUR)/P3W_DUR; IF P4W_DUR-P3W_DUR=0 AND P3W_DUR=0 THEN BHUA_DRATION3=0; IF P4W_DUR-P3W_DUR NE 0 AND P3W_DUR=0 THEN BHUA_DRATION3=1; churn_time=8-logintimes; /*流失次数的转化*/ /*数据的再次变换*/ sqrt_max_dur=sqrt(max_dur); sqrt_min_dur=sqrt(min_dur); sqrt_mean_dur=sqrt(mean_dur); /*sqrt_bhua_dration1=sqrt(bhua_dration1);*/ /*sqrt_bhua_dration2=sqrt(bhua_dration2);*/ /*sqrt_bhua_dration3=sqrt(bhua_dration3);*/ run; PROC MEANS DATA=Base_Churn_datatype ;RUN; %mend deal_data; %deal_data(M1_xunlian,model);/*建模数据处理*/ %deal_data(M1_ceshi,predict);/*预测数据处理*/ %macro standard(data,datatype); proc standard data =data out =dataset_datatype mean= 0 std = 1; var P1W_TIMES P2W_TIMES P3W_TIMES P4W_TIMES P1W_DUR P2W_DUR P3W_DUR P4W_DUR /*max_dur*/ /*min_dur*/ /*mean_dur*/ P1W_TIMES_RATION P2W_TIMES_RATION P3W_TIMES_RATION P4W_TIMES_RATION BHUA_TRATION1 BHUA_TRATION2 BHUA_TRATION3 P1W_DUR_RATION P2W_DUR_RATION P3W_DUR_RATION P4W_DUR_RATION BHUA_DRATION1 BHUA_DRATION2 BHUA_DRATION3 churn_time sqrt_max_dur sqrt_min_dur sqrt_mean_dur ; proc corr data = dataset_datatype; var P1W_TIMES P2W_TIMES P3W_TIMES P4W_TIMES P1W_DUR P2W_DUR P3W_DUR P4W_DUR /*max_dur*/ /*min_dur*/ /*mean_dur*/ P1W_TIMES_RATION P2W_TIMES_RATION P3W_TIMES_RATION P4W_TIMES_RATION BHUA_TRATION1 BHUA_TRATION2 BHUA_TRATION3 P1W_DUR_RATION P2W_DUR_RATION P3W_DUR_RATION P4W_DUR_RATION BHUA_DRATION1 BHUA_DRATION2 BHUA_DRATION3 churn_time sqrt_max_dur sqrt_min_dur sqrt_mean_dur ; run; %mend standard; %standard(Base_churn_model,model);/*建模数据标准化处理、及数据相关性检验*/ %standard(Base_churn_predict,predict);/*预测数据标准化处理、及数据相关性检验*/ /*建模预测*/ proc logistic data=dataset_model outest=Logistic_Params_value outmodel=Model_value covout noprint; model type = /* P1W_TIMES*/ /*P2W_TIMES*/ /*P3W_TIMES*/ P4W_TIMES /*P1W_DUR*/ /*P2W_DUR*/ /*P3W_DUR*/ P4W_DUR /*max_dur*/ /*min_dur*/ mean_dur /*P1W_TIMES_RATION*/ /*P2W_TIMES_RATION*/ /*P3W_TIMES_RATION*/ /*P4W_TIMES_RATION*/ /*BHUA_TRATION1*/ /*BHUA_TRATION2*/ /*BHUA_TRATION3*/ /**/ /*P1W_DUR_RATION*/ /*P2W_DUR_RATION*/ /*P3W_DUR_RATION*/ /*P4W_DUR_RATION*/ /*BHUA_DRATION1*/ /*BHUA_DRATION2*/ /*BHUA_DRATION3*/ churn_time /*sqrt_max_dur*/ /*sqrt_min_dur*/ /*sqrt_mean_dur */ / Link = LOGIT selection = stepwise slentry =0.05 slstay =0.05 details Scale=NONE Aggregate /*Scale,Aggregate结合产生卡方与偏差统计值,卡方值越小,表示预测值与观测值之间没有显著差别,拟合越好。偏差值解释同理。*/ LackFit /*HL检验量,显著否?显著,拟合不好,不显著拟合好。*/ Rsquare Stb MAXITER = 100 clparm=wald clodds=pl ; output out = model_result_value PROB=prob; score data=dataset_predict out=predict_result; run; proc sort data = predict_result; by descending P_miss; run; data predict_result; set predict_result; n = _n_; call symput('num_of_obs', _n_); run; data predict_result_score; set predict_result; location = int(n/(num_of_obs + 1)*100)+1; run; proc sql; create table predict_result_all as select a.var2 as var2, a.type as type, a.P4W_TIMES as P4W_TIMES, a.P4W_TIMES_RATION as P4W_TIMES_RATION, a.P4W_DUR_RATION as P4W_DUR_RATION, a.P4W_DUR as P4W_DUR, b.p_miss as CHURN_PROBABILITY, b.location as location from Base_churn_predict a left join predict_result_score b on a.var2 = b.var2; quit; proc means data=predict_result_score noprint nway; class location type ; var location type; output out=tempa2 (keep=location _freq_ type _freq_) max(location)=xx; run; proc freq data=predict_result_score; tables location*type / out=aa; run;
-
0 个评论
-
-
分享
线性回归ABC
-
xiaocai_82 2016-5-25 21:52
-
第一步,线形图观察变量之间关系,确定模型 第二步,OLS估计,观察t统计量,,拟合优度等是否显著 第三步,相关图观察是否存在多重共线性,存在则用逐步回归法消除 第四步,用怀特检验法判断是否存在异方差,加权最小二乘法消除 第五步,用DW检验确定是否存在自相关,广义差分法消除
-
90 次阅读|0 个评论
-
-
分享
iv
-
ajlisa 2016-5-14 18:51
-
V(2SLS)估计应用STATA实现 例子:学校教育的收益,始于Mincer(1958)的具有开创性的有关工资与学校教育相互联系的研究,已成为重要的理论和实证研究课题(学术界往往将工资的对数对受教育年限及其他控制变量进行的这类回归称之为Mincerian regression)。 你可能对此感到不解,因为两者之间的实证性解释是学历提高个人的生产率。但是也有其他解释。例如,根据Spence工作市场的信号模型,教育是能力的信号,高学历的人挣高薪。虽然学历并没有提高个人的挣钱能力,但学历与工资之间是存在联系,原因是工资与教育等两个变量均受到第三个变量“能力”的影响。Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。本例子来源于Griliches, Z., 1976, "Wages of Very Young Men", Journal of Plitical Economy,84,pp.69-85. 数据:grilic.dta 变量:lw(工资对数),s(受教育年限),age(年龄),exper(工作经验),tenure(在单位的工作年数)、IQ(智商),mrt(母亲的受教育年限),kww(在"knowledge of the World of Work"测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1) IV估计的步骤: (一)做普通最小二乘法OLS估计,看看是否存在回归结果的不可靠性,然后初始怀疑存在内生性问题。具体细分两步: 打开数据文件 use grilic.dta,clear 简单描述性统计分析 sum 简单双变量相关分析,Pearson相关分析,怀疑遗漏变量iq,考察智商与受教育年限的相关关系 corr iq s 1、做一个参照系方程,即不含所怀疑的内生变量的方程进行OLS回归。 作为一个参照系,先进行OLS回归,并使用稳健标准误,其中参数r是稳健推断(Robust Inference, 文献中也用HC,Heterogeneity Consistency),用于解决异方差问题(White, 1982) reg lw s expr tenure rns smsa,r 回归结果显示,教育投资的年回报率为10.26%,而且在1%的水平上显著的不为零。这意味着,多受一年教育,则未来的工资将高出10.26%,这个教育投资回报率似乎太高了。可能的原因,由于遗漏变量“能力”与受教育年限正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。 2、引入所怀疑的内生变量在进行OLS回归。 引入智商IQ作为“能力”的代理变量,再进行OLS回归。 reg lw s iq expr tenure rns smsa,r 加入“能力”的代理变量IQ后,教育投资的回报率下降为9.28%,变得更为合理些,但仍然显得过高。 (二)选择工具变量,一般源于以往文献中相应与内生变量有关、但未引入研究的方程里的变量。具体细分为两步: 1、初始工具变量的检测 由于IQ来度量能力存在“测量误差”,故IQ是内生变量,考虑使用变量(med,kww,mrt,age)作为IQ的工具变量,进行2SLS回归,并使用稳健标准误差。 ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),r 在此2SLS回归中,教育回报率反而上升到13.73%,而IQ对工资的贡献居然为负,似乎并不可信。使用工具变量法的前提是工具变量的外生性。为此,进行过度识别检验,考察是否所有工具变量均外生,即与扰动项不相关。过度识别检验:Hansen-Sargan J检验,自身为一种卡方检验,原假设:所有工具变量均为外生,备选假设:至少有一个内生(存在不合格工具变量)。应接受原假设,拒绝备选假设。 estat overid 结果强烈拒绝“所有变量均为外生”的原假设,即认为某些(或某个)工具变量不合格(invalid)。 2、对工具变量进一步选取检测 考虑仅使用变量(med,kww)作为IQ的工具变量,再进行2SLS回归,同时显示第一阶段回归结果。 ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first 结果显示,教育投资回报率降为6.08%,比较合理;而且IQ的贡献也重新变为正。继续做过度识别检验。 estat overid 接受原假设,认为(med,kww)外生。 (三)考察工具的相关性,即弱工具变量判断(Stock and Yogo, 2005),使用拇指法则(Rule of Thumb,又叫“经验法则”,是一种可用于许多情况的简单的,经验性的,探索性的但不是很准确的原则。),检验内生变量和工具变量的相关性,也即检验研究模型的回归系数bIV极限分布是否是正态分布,是否会扭曲相应统计量的一致性,构造F统计量,如果F值10,不是弱工具变量。 estat firststage, all forcenonrobust F统计量为13.40(超过10)。 (四)外生性检验——Durbin-Wu Hausman检验,原假设:OLS和IV无系统差异,备选假设:有差异(存在内生性,意味着用2sls是有效的),应拒绝原假设。用以检测IV是否优于OLS。 reg lw iq s expr tenure rns smsa estimates store ols ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store iv hausman iv ols, constant sigmamore
-
0 个评论
-
-
分享
面板空间计量步骤
-
ajlisa 2016-3-14 12:11
-
1. 利用STATA测算全局MORAN指数和GEARY系数。 2. 利用STATA绘制Moran散点图。 3. 利用Matlab进行SAR和SEM静态空间面板数据的计量回归,每个方法包括四类模型。 4. 利用stata进行动态空间面板数据计量回归。目前stata可以做的有空间广义最小二乘法回归、空间Tobit面板数据回归、空间广义矩估计面板数据回归。
-
0 个评论
-
-
分享
DEA和SFA
-
热度 2 hildegardvon 2016-2-16 08:48
-
DEA的matlab程序编写,DEA-u,SBM-u,SBM-C,SBM-I(O)-C(V),malmquist指数和malmquist-L指数。 super-DEA,普通DEA程序,metafrontier,Tone(2001)的模型。 SFA:BC1992,1995模型。SFA的横截面数据的matlab估计。
-
66 次阅读|2 个评论
-
-
分享
Neyman-Holland—Rubin模型
-
西门高 2015-11-15 20:00
-
用于分析自然实验的一个常用模型
-
8 次阅读|0 个评论
-
-
分享
供求模型
-
西门高 2015-10-9 20:06
-
经济学中最简单的一个模型也是最有效的一个模型,正是因为其简单,其解释力财如此之强
-
9 次阅读|0 个评论
-
-
分享
金融计量学GARCH模型
-
accumulation 2015-9-19 15:01
-
请问金融计量学中的ARMA模型具体有哪些应用?能对哪些经济金融指数进行建模?如:ARMA模型能够对上证综合指数、上证综合指数收益率、CPI等数据进行ARMA建模吗?其预测性又如何? 比如,应用ARMA模型对股票指数进行建模,是对有效性强的金融市场进行股票指数ARMA建模的预测性好,还是对有效性弱的金融市场进行股票指数ARMA建模的预测性好? 本文来自: 人大经济论坛 金融学(理论版) 版,详细出处参考: https://bbs.pinggu.org/forum.php?mod=viewthreadtid=3806869page=1fromuid=5761216 我正在学习金融计量学,好奇GARCH模型既然是研究股票市场波动率的,那么应用GARCH模型对金融市场做的实证分析在实证和应用上有什么用途?GARCH模型对金融市场的实证分析能指导量化投资吗? 对金融计量学与量化投资模型的关系尚不太清楚,请大神指教! 本文来自: 人大经济论坛 金融学(理论版) 版,详细出处参考: https://bbs.pinggu.org/forum.php?mod=viewthreadtid=3808769page=1fromuid=5761216 最近想研究用50ETF期权对冲现货风险,一种方案是想通过期权合成现货空头对冲,另一种方案是保留部分现货收益,即使用put options。不知道各位有啥相关文献参考一下。 本文来自: 人大经济论坛 金融工程(数量金融)与金融衍生品 版,详细出处参考: https://bbs.pinggu.org/forum.php?mod=viewthreadtid=3611222page=1fromuid=5761216
-
个人分类: 金融工程|0 个评论
-
-
分享
金融计量学ARMA模型的应用
-
accumulation 2015-7-20 01:50
-
请问金融计量学中的ARMA模型具体有哪些应用?能对哪些经济金融指数进行建模?如:ARMA模型能够对上证综合指数、上证综合指数收益率、CPI等数据进行ARMA建模吗?其预测性又如何? 比如,应用ARMA模型对股票指数进行建模,是对有效性强的金融市场进行股票指数ARMA建模的预测性好,还是对有效性弱的金融市场进行股票指数ARMA建模的预测性好?
-
个人分类: 计量经济学|0 个评论
-
-
分享
市场微观结构模型
-
accumulation 2015-7-13 12:14
-
金融相关著作: 1. (with Jim Gatheral) Implied Volatility from Local Volatility: A Path Integral Approach. To appear in Springer Proceedings in Mathematics Statistics, Vol. 110, Large Deviations and Asymptotic Methods in Finance 2. Book Review on Nonlinear Option Pricing by J. Guyon and P. Henry-Labordère, Quantitative Finance, 15(1), 19-21, (2015) 3. (with Jim Gatheral) The Heat-Kernel Most-Likely-Path Approximation. International Journal of Theoretical and Applied Finance, 15(1), 1250001 (2012) 4. (with Jim Gatheral, Elton Hsu, Peter Laurence, and Cheng Ouyang) Asymptotics of Implied Volatility in Local Volatility Models. Mathematical Finance, 22(4), 591~620 (2012) 5. (with Peter Laurence and Sheng-Li Wang) Generalized Uncorrelated SABR Models with a High Degree of Symmetry. Quantitative Finance, 10(6), 663-679 (2010) 6. (with Peter Laurence) Sharp Distribution Free Lower Bounds for Spread Options and the Corresponding Optimal Subreplicating Portfolios. Insurance: Mathematics and Economics, 34(1), 35-47 (2009) 7. (with Peter Laurence) Distribution Free Upper Bounds for Spread Options and Market Implied Comonotonicity Gap. The European Journal of Finance, 11(8), 717-734 (2008) 8. (with Peter Carr and Peter Laurence) Generating Integrable One Dimensional Driftless Diffusions. Comptes Rendus Mathematique Academie des Sciences, Paris., 343(6), 393-398 (2006) 9. (with Peter Laurence) Close Form Solutions for Quadratic and Inverse Quadratic Term Structure Models. International Journal of Theoretical and Applied Finance, 8(8), 1059-1083 (2005) 10. (with David Hobson and Peter Laurence) Static-arbitrage Optimal Sub-replicating Strategies for Basket Options. Insurance: Mathematics and Economics, 37, 553-572 (2005) 11. (with David Hobson and Peter Laurence) Static-arbitrage Upper Bounds for the Prices of Basket Options. Quantitative Finance, 5(4), 329-342 (2005) 12. (with Peter Laurence) Sharp Upper and Lower Bounds for Basket Options. Applied Mathematical Finance, 12(3), 253-282 (2005) 13. (with Peter Laurence) What’s a basket worth? Risk Magazine, February, 73-74 (2004)
-
个人分类: 金融工程|0 个评论
-
-
分享
市场微观结构模型
-
accumulation 2015-7-13 12:14
-
Syllabus • Background materials 1. Crash course on Itô’s calculus for diffusion processes and processes with jumps 2. Feynman-Kac’s formula 3. Stochastic control theory 4. Bellman’s principle and the Hamilton-Jacobi-Bellman equation • Economics models 1. Inventory models 2. Information based models 3. Strategic trader models • Market models 1. Limit order book modeling 2. Market vs limit order decision 3. Order routing algorithm • Price impact models and their related optimal execution schemes 1. Permanent and transient impact models 2. Optimal execution strategies 3. Price manipulation
-
个人分类: 金融工程|0 个评论
-
-
分享
Fama-French三因子模型
-
accumulation 2015-7-12 23:19
-
Fama-French三因子模型的假设条件 1、理论假设 在探讨Fama—French三因子模型的应用时,是以“有限理性”理论假设为基础。并在此基础上得出若干基本假定: (1)存在着大量投资者; (2)所有投资者都在同一证券持有期计划自己的投资资产组合; (3)投资者投资范围仅限于公开金融市场上交易的资产; (4)不存在证券交易费用(佣金和服务费用等)及税赋; (5)投资者们对于证券回报率的均值、方差及协方差具有相同的期望值; (6)所有投资者对证券的评价和经济局势的看法都一致。 2、统计假设 从模型的表达式可以看出,FF模型属于多元回归模型。其基本假设为: (1)(Rm − Rf)、SMB、HML与随机误差项u不相关; (2)零均值假定:E(ξi) = 0; (3)同方差假定,即ξ的方差为一常量:Var(ξi) = S2; (4)无自相关假定: (5)解释变量之间不存在线性相关关系。即两个解释变量之间无确切的线性关系; (6)假定随机误差项U服从均值为零,方差为S2正态分布,即ξi˜N(1,S2)。
-
个人分类: 金融工程|0 个评论
-
-
分享
利率期限结构建模
-
accumulation 2015-7-9 00:37
-
现有理论分析所构建的利率期限结构模型是以利率本身做标的的,借鉴股票遵循几何布朗运动的假设,把利率过程假设为具有均值回复性的布朗运动;而实际上,理论模型所假设的利率运动遵循的过程不一定是布朗运动,抑或是几何布朗运动;理论模型中假设的利率运动所遵循的过程可以是其它形式的伊藤过程; 股票是可交易资产,债券是相关于利率的可交易资产;利率与股票收益率是相对应的量;在研究股票价格运动规律的过程中,假设股票价格收益率遵循布朗运动,即股票价格遵循几何布朗运动;而在描述可交易资产的债券的价值过程中,现有的理论模型一般直接通过研究利率运动的规律,即假设利率运动的规模遵循某个伊藤过程,进而进行建模研究利率变化规律;如果对债券价格的运动过程进行建模,也可以用于描述利率的变化,因为债券价格的运动规律与利率的运动规律是相互关联的,在一定的前提假设下可以相互推导;在理论研究中,可能是出于简单方便的缘故,学者们直接通过对利率运动过程进行伊藤过程的建模而研究利率变化,而很少通过对债券价格的运动过程建模来研究利率变化;通过债券价格运动规律与利率运动规律的关系式,结合伊藤引理,将利率运动过程的研究转化为债券价格运动过程的研究也是很简单的,重要的是如何通过对利率运动过程作出合理的假设,构造出有意义的伊藤过程。 以上是个人观点,对思考中存在问题的地方希望得到指正与讨论。
-
个人分类: 金融工程|0 个评论
-
-
分享
关于利率期限结构建模的思考及困惑
-
accumulation 2015-7-9 00:22
-
【引子】看到几个著名的利率期限结构模型都是直接以利率本身做标的,并借鉴股票遵循几何布朗运动的假设,把利率过程假设为具有均值回复性的布朗运动。 我们知道,股票是可交易资产,而利率对应的可交易资产是债券而非利率本身。换言之,利率其实是与股票收益率相对应的量。 那么问题来了 【问题】为什么学者们不是通过对同样作为可交易资产的债券的价值过程进行建模来描述利率变化呢?
-
个人分类: 金融工程|0 个评论
-
-
分享
GARCH模型
-
accumulation 2015-7-7 00:11
-
GARCH模型是对波动率建模,相当于对方差建模,而方差不是残差,残差是遵循以方差为均值的正态分布;这个你翻一翻金融计量学的教材,看看GARCH模型的定义就可以了;第一个方程是均值方程,对均值方程做回归得到的残差是ut,而GARCH模型是对sigmat,即方差进行建模;例如,GARCH(1,1)模型是对sigmat建模,对sigmat的平方作sigma(t-1)的平方、ut的平方以及常数项的回归;因此,残差指的是ut,而GARCH模型中的GARCH是sigmat的平方,设vt遵循正态分布N(0,1),则ut=vt*sigmat=vt*根号下GARCH。
-
个人分类: 金融工程|0 个评论
-
-
分享
基于EVIEWS的金融计量学
-
accumulation 2015-7-6 23:12
-
【目录】第1章 金融数据分析初步 1.1 金融计量研究的步骤与任务 1.2 金融时间序列 1.3 金融计量软件Eviews介绍 1.4 案例介绍 第2章 平稳时序模型 2.1 自回归模型AR 2.2 移动平均模型MA 2.3 自回归移动平均模型ARMA 2.4 自回归单整移动平均模型ARIMA 2.5 Eviews案例 第3章 非平稳时序模型 3.1 时间趋势模型及去除趋势法 3.2 随机趋势模型及差分法 3.3 单位根检验 3.4 Eviews案例 第4章 ARlMA模型应用案例——通货膨胀预测分析 4.1 利用Evews进行预测的理论背景 4.2 在Eviews中如何进行预测分析 4.3 利用Evews进行中国CPl通胀预测的示例 第5章 多维动态模型VAR 5.1 VAR模型介绍 5.2 VAR模型的属性 5.3 VAR模型的估计与相关检验 5.4 格兰杰因果关系 5.5 VAR模型的脉冲响应分析 5.6 VAR模型与方差分解 5.7 Eviews案例 第6章 协整分析 6.1 协整的基本定义 6.2 Engle-Granger协整分析方法 6.3 VECMJohansen协整分析方法 6.4 Eviews案例 第7章 GARCH族模型 7.1 ARCH模型 7.2 GARCH模型 7.3 GARCH模型的其他形式 7.4 案例分析 第8章 资产定价模型与估计 8.1 CAPM理论回顾 8.2 CAPM实证检验方法 …… 第9章 事件研究法 第10章 面板数据回归模型 第11章 三因素资产模型与Eviews:综合案例 附录1 统计学与矩阵代数回顾 附录2 回归分析
-
个人分类: 金融工程|0 个评论
GMT+8, 2026-2-13 12:52