tag 标签: 学习方法经管大学堂:名校名师名课

相关帖子

版块 作者 回复/查看 最后发表
复习cpa考试的学习方法总结 CPA注册会计师及其他财会考证 mylewen 2013-3-23 1145 64787 gongqiu 2016-3-28 15:19:14
【CFA二级学习方法谈第一部分】(视频)分享续——【金多多教育】 经管考证 wanghaidong918 2013-7-18 116 13985 wingchie 2015-4-1 14:35:40
【CFA二级学习方法谈第三部分】(视频)分享续——【金多多教育】 attachment 经管考证 wanghaidong918 2013-7-22 105 8429 1275 2014-12-19 10:41:54
注会审计学习方法 财会类 67768186 2013-6-25 3 2920 bluesmoon 2014-1-15 16:24:28
怎么学习计量经济 情感交友 黑椒123 2013-6-18 7 1311 Jessymannheim 2013-10-17 01:35:51
求经济学学习方法 新手入门区 kellner 2013-9-3 8 1610 kellner 2013-9-4 11:49:52
初级会计考试资料分享+学习方法交流 attachment 会计与财务管理 优会计网 2013-8-24 3 1350 优会计网 2013-8-24 23:34:11
天苍苍路茫茫,我被经济学弄的受了伤~~求转弯 新手入门区 QueenCi.Shine 2013-8-2 2 1387 QueenCi.Shine 2013-8-2 14:26:14
OpenTuition_ACCA_Paper_F1_June_2013 attachment 财会类 twlirx 2013-7-25 0 1291 twlirx 2013-7-25 20:14:56
财务管理学习方法 会计与财务管理 67768186 2013-6-25 0 1028 67768186 2013-6-25 16:03:43
2014考研资料大放送!!西财行政管理~~ attach_img 情感交友 leepon 2013-6-18 1 1199 leepon 2013-6-18 18:02:58
新人报告,哥哥姐姐请教学习方法 新手入门区 442683950 2013-5-6 2 930 442683950 2013-5-7 12:28:10
关于《政治经济学》学习方法的问题 经管在职研 红领巾vampire 2013-4-7 0 1264 红领巾vampire 2013-4-7 08:59:24
零基础英语学习方法 attachment 外语学习 姚国红 2013-3-5 3 1488 chouccy 2013-3-15 18:33:17

相关日志

分享 行为金融学学习方法
accumulation 2015-5-27 23:46
一、课程铺垫 微观经济学、宏观经济学、货币银行学、金融经济学、公司财务等 二、课程重点、难点 1 、绪论 ( 1 )学习内容: 对金融学理论发展历史有一个总体认识,同时对心理偏差、行为偏差形成初步概念,并对市场异象及行为金融学解释有总体的了解。 ( 2 )重点难点: 经典金融学发展逻辑及主要框架;行为金融学的心理学基础 ( 3 )本章参考资料 ①王江,《金融经济学》 ②史树中,《金融经济学十讲》第一讲 ③李心丹,《行为金融学——理论及中国证据》,第 2 章 ④Barberis, Nicholas, and Rechard Thaler, 2003, A Survey of Behavioral Finance 2 、 经典资产定价理论与市场有效性 ( 1 )学习内容: 对经典金融学核心内容,即资产定价理论有系统认识,掌握金融决策核心思想,掌握 C-CAPM 、 CAPM 推导过程。 ( 2 )重点难点: 消费资产定价模型 C-CAPM 推导及经济学意义;资产定价模型 CAPM 推导及经济学意义; CAPM 和 C-CAPM 关系 ( 3 )本章参考资料 ①王江,《金融经济学》第 8 章、第 9 章、第 10 章,第 12 章、第 13 章、 ②史树中,《金融经济学十讲》第四讲,第七讲 ③李心丹,《行为金融学——理论及中国证据》,第 2 章 3 、行为金融学的崛起:市场异象 ( 1 )学习内容:了解金融市场异象产生背景,充分掌握市场总体异象及股票市场截面异象,能够运用中国数据分析中国市场异象问题。 ( 2 )重点难点:股权溢价之谜;动量效应;反转效应;盈余宣告后价格漂移及事件研究方法 ( 3 )本章参考资料 ①李心丹,《行为金融学——理论及中国证据》,第 4 章 ②Andrei Shleifer, Inefficient Market-an Introduction to Behavioral Finance, Part 1 ③Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part III 4 、行为金融学的心理学基础及有限套利 ( 1 )学习内容: 通过课堂讲授及心理学实验,使学生系统掌握前景理论及框架理论,以及启发式心理理论,充分理解这两个心理偏差在行为金融学发展中的根基性地位,同时掌握有限套利理论。 ( 2 )重点难点: Prospect Theory; Cumulative Prospect Theory; Narrow Framing and Mental Account; Heuristic Bias; Limited Arbitrage ( 3 )本章参考资料 ①李心丹,《行为金融学——理论及中国证据》,第 3 章、第 4 章 ②Andrei Shleifer, Inefficient Market-an Introduction to Behavioral Finance, Part 2, Part 4 ③Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part I 5 、有限理性与市场总体异象 ( 1 )学习内容:系统掌握有限理性对股票市场总体异象的解释,以及不同市场总体异象之间的逻辑关系。 ( 2 )重点难点:有限理性对股权溢价之谜的解释;股权溢价之谜与无风险利率之谜的内在关系 ( 3 )本章参考资料 ①李心丹,《行为金融学——理论及中国证据》,第 4 章 ②Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part II 6 、有限理性与市场截面异象 ( 1 )学习内容:系统掌握有限理性对股票市场截面异象的分析和解释 ( 2 )重点与难点:有限理性与动量效应;有限理性与反转效应。 ( 3 )本章参考资料 ①李心丹,《行为金融学——理论及中国证据》,第 6 章 ②Andrei Shleifer, Inefficient Market-an Introduction to Behavioral Finance, Part 6 ③Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part IV 7 、有限理性与投资者行为偏差 ( 1 )学习内容:系统掌握有限理性对个体及群体投资者交易行为的影响,能够运用相关数据对投资者交易动机及行为偏差进行分析,并基于行为偏差设计行为投资策略。 ( 2 )重点与难点:处置效应;投资者关注;过度自信;行为投资策略 ( 3 )本章参考资料 ①李心丹,《行为金融学——理论及中国证据》,第 4 章、第 5 章、第 10 章、第 12 章 ②Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part V 8 、有限理性与行为公司金融 ( 1 )学习内容:系统掌握投资者非理性下的公司管理层行为,以及公司管理层有限理性引起的公司投融资决策偏差。 ( 2 )重点难点:管理层迎合 (Catering) ; IPO 时机选择;管理层过度自信 ( 3 )本章参考资料 ① 李心丹,《行为金融学——理论及中国证据》,第 7 章 ②Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Part VI 9 、有限理性与家庭金融 ( 1 )学习内容:系统掌握有限理性对家庭金融决策的影响,包括对投资决策与跨期消费决策的影响,能够通过调查访谈方式收集相关数据并进行相关研究。 ( 2 )重点与难点:家庭参与决策;消费信贷决策 ( 3 )本章参考资料 ①Campbell, John Y., 2006, Household Finance, Journal of Finance 61, 1553-1604. ② 李心丹等, 2011 ,家庭金融研究述评与展望,《管理科学学报》 10 、行为金融学最新发展 ( 1 )学习内容:了解行为金融学发展过程中的问题与不足,把握行为金融学最新发展。 ( 2 )重点与难点:投资者博彩偏好与博彩交易;参考点理论与决策;计算实验方法 ( 3 )本章参考资料 ① 李心丹,《行为金融学——理论及中国证据》,第 8 章 ②Andrei Shleifer, Inefficient Market-an Introduction to Behavioral Finance, Part 7 三、参考书目 1 、主要参考书目: ⑴李心丹, 2004 ,《行为金融学——理论及中国证据》,上海三联书店; ⑵Andrei Shleifer, 2004, Inefficient Market-an Introduction to Behavioral Finance, Oxford Press ; ⑶Barberis, Nicholas, and Richard Thaler, 2003, A Survey of Behavioral Finance ; ⑷Malcolm, Baker, and Jeffrey Wurgler, 2012, Behavioral Corporate Finance: An Updated Survey. 2 、其他参考书目: ⑴Richard Thaler(editor), 2005, Advances in Behaviroal Finance, Oxford Press ; ⑵罗伯特·希勒 (Robert Shiller) , 2008 ,《非理性繁荣》(李心丹等译),中国人民大学出版社; ⑶阿克洛夫和希勒 (George Akerlof and Robert Shiller) , 2009 ,《动物精神》(黄志强等译), 中信出版社; ⑷理查德·塞勒 (Richard Thaler) , 2007 ,《赢者的诅咒——经济生活中的悖论与反常现象》(陈宇峰等译),中国人民大学出版社; ⑸赫什·舍夫林 (Hersh Shefrin) , 2005 ,《超越恐惧和贪婪:行为金融学与投资心理诠释》(贺学会译),上海财经大学出版社; ⑹塞勒和桑斯坦 (Richard Thaler and Cass Sanstein) , 2008 ,《助推:事关健康、财富与快乐 的最佳选择》(刘宁译),中信出版社; ⑺王江, 2006 ,《金融经济学》,中国人民大学出版社; ⑻史树中, 2004 ,《金融经济学十讲》,上海人民出版社。 四、行为金融学教授个人主页 1. Richard Thaler, http://faculty.chicagobooth.edu/richard.thaler/research/ 2. Robert Shiller, http://www.econ.yale.edu/~shiller/ 3. Hersh Shefrin, 4. Meir Statman, 5. David Hirshleifer, 6. Andrei Shleifer, http://www.economics.harvard.edu/faculty/shleifer 7. Nicholas Barberis, http://mba.yale.edu/faculty/profiles/barberis.shtml 8. Ming Huang, http://www.johnson.cornell.edu/faculty/profiles/Huang/ 9. Jeffrey Wurlger, http://pages.stern.nyu.edu/~jwurgler/ 10. Malcolm Baker,
个人分类: 金融学|0 个评论
分享 【转】计量经济学学习心得
shinelynne 2014-12-12 11:14
当初一个舍友来自西部地区,从没学过计量(OLS都没学过)。但毕业论文老板要求用数据说话,发愁。我于心不忍,告诉她:我每天晚上自习回来,睡觉前花10分钟给你讲解一下STATA的操作和出来的各项结果意义。第一天,我讲了OLS。画了一张散点图和一根直线,用了1分钟就让她完全理解了OLS的精髓,这是用来干啥的。后面9分钟讲解了STATA的操作和OLS的各种变种。结果只一个星期,讲完五种方法(下面会介绍),她信心大增。后来一下子发了好几篇CSSCI,计量做的天花乱坠,让人误以为是一个大师。毕业论文也顺利通过。她说我的方法是当今世界上最快的计量速成法。她说,以后有时间要好好看看计量书,打打基础。我推荐她读伍德里奇的那本现代观点。但她论文发表了好多篇,至今还没看那本书。问其原因:“看了一下OLS,跟你讲的没啥区别,就是多了些推导。那些推导看不看都不影响我用软件。现在没空看,先发论文再说。” 我笑其太浮躁。但后来想想,这种学习方法不一定适合所有人,但或许适合一部分人群。因此有必要写出来让这部分人群都有所收获,不会因为发不了CSSCI而担忧,不会因为毕业论文不会做计量而担忧。因此有了本文。你是不是属于这样的人群?请看下面: 本文的目标人群: 1、不懂计量的人; 2、想学计量却苦于缺乏时间的人; 3、想学计量却看不懂、推导不了那些恐怖矩阵的人,也就是不想看推导过程,也想发论文的人。 4、不想看计量书,却想写计量论文,发几篇CSSCI,尽快毕业的人。 5、所有想速成的人。 但是目标人群一定要能看懂STATA软件操作手册的人(或者其他软件操作手册)。如果你不认得手册上的字,不要来告诉我。我也不认得。如果你能找到一个懂STATA、EVIEWS的人给你讲解一下,那么你看不懂手册也无所谓。 本文的目标:不看计量推导、不看计量书籍就能发计量论文,而且是大规模批量生产计量论文,甚至是发经济研究和管理世界。 目标能否实现:取决于你能否掌握本黑客教程的内容,能否阅读软件手册。 申明:不是教你如何抄袭作弊,而是教你写计量论文的方法和捷径。 目录 一、计量论文的两大要点是什么? 二、如何判断计量论文的水平高低? 三、做计量的“大杀器”有哪些? 四、瞎倒腾计量的秘诀 五、大规模发CSSCI的建议 一、计量论文的两大要点是什么? 1、计量模型的建立(就是那个方程,表达什么经济含义要知道); 2、模型中的系数如何估计出来(关键在于估计方法的选择)。 第1个要点涉及你论文主题。你一般要想用数据检验某种经济关系,根据这种经济关系来建立计量模型。如果你不知道要检验什么经济关系,那我劝你就此打住。你发不了经济研究了。 第2个要点。千万种方法的出现,目的都是要把那个系数给估计出来。不同估计方法的估计效果好坏,就是根据各种统计量来判断。如果能选择一种最合适你数据的估计方法,那么这论文基本就成了。 二、如何判断计量论文的水平高低? 掌握了上面两个要点,只是说你能写出一篇计量论文,并不是说能写出一篇高水平的论文。水平的高低在于你处理这两个要点时水平的高低。下面仔细讲解。 如果只是为了写计量论文,只需要“知其然”即可。没有人会因为不会推导OLS估计量而对软件里面出来的结果不知所措。这条途径,最快捷的走法是找一个懂的人,把结果里面的各种东西所表示的意思给你讲一遍,每个东西要注意什么。基本就可以了。在一般的CSSCI上发表论文没有什么问题。如果找不到人,就看STATA的手册,里面的例子会讲解每个指标参数统计量的含义。这样慢一点,但效果很好,而且也能成为STATA专家。STATA手册比高级计量教材看起来轻松多了,就是告诉你怎么操作软件,然后得到什么结果的。 计量论文中的估计问题,最关键的事情,不是能推导估计量,而是在STATA里面选择一个“合适”的方法估计出来。然后解释结果的经济意义。而计量水平的高低,不在于方法的复杂性,而在于方法的合适程度。因此高水平的计量论文,不必要求作者掌握高深的计量推导,而在于“选择”的技巧。每种计量方法,都有优劣。所谓用人之长,容人之短。水平高的人,能够选择以其之长,攻它之短。同时又能隐藏计量方法内在的拙劣。 其实,计量论文的水平主要决定于论文的主题的重要性。这个话题大家都很关心,就很重要,发表就很容易。所以,你会发现国际顶级期刊上一些计量论文所用的方法很简单。这些论文能发表,主要是他讨论的问题很重要(这涉及第一个要点),采用的方法即使有缺陷,也无伤大雅。如果问题不是非常重要,只是有新意,但是估计方法比较合适,也能发一个中上等期刊。如果问题属于鸡毛蒜皮之类,那就只能诉诸于超级复杂的计量方法,祈求审稿人看论文时,方法还没看完就已经累得半死,再也没有心情来思考你的问题的重要性,然后也能通过了。 三、做计量的“大杀器”有哪些? 所谓的大杀器,不是指超级复杂的计量方法,而是指这种东西一旦用起来,一般不会有人来攻击。所谓的一招毙命,毙了审稿人的命。计量方法很多,可以说满天飞。但是,真正有价值的方法,被人公认为具有一定可信度的方法(就是所谓的“大杀器”),只有5种。并不是你所看到的所有的方法都有人信。这点大部分初学计量的人都不会意识到。看到书上介绍一个方法,就认为这是一个好方法。其实不是。书上很多方法的介绍,仅仅是出于理论推演的需要,并不是实际研究中都能用的。你如果查阅一下国际上关于经验研究类的论文,会发现大部分论文所用方法无非是: 1、简单回归; 2、工具变量回归; 3、面板固定效应回归; 4、差分再差分回归(difference in differnece); 5、狂忒二回归(Quantile)。 大杀器就这几种,破绽最少,公认度最高,使用最广泛。真是所谓的老少皆宜、童叟无欺。其他的方法都不会更好,只会招致更多的破绽。你在STATA里面还可以看到无数的其他方法,例如GMM、多层次分析法等。这个GMM实在是一个没有用的忽悠,他还分为diffGMM和系统GMM。其关键思想是当你找不到工具变量时,用滞后项来做工具变量。结果你会发现令人崩溃的情况:不同滞后变量的阶数,严重影响你的结果,更令人崩溃的是,一些判断估计结果优劣的指标会失灵。这完全是胡搞!这GMM的唯一价值在于理论价值,而不在于实践价值。你如果要玩计量,你就可以在GMM的基础上进行修改(玩计量的方法后面讲)。 有人会问:简单回归会不会太简单?我只能说你真逗。STATA里面那么多选项,你加就是了。什么异方差、什么序列相关,一大堆尽管加。如果你实在无法确定是否有异方差和序列相关,那就把选项都加上。反正如果没有异方差,结果是一样的。有异方差,软件就自动给你纠正了。这不很爽嘛。如果样本太少,你还能加一个选项:bootstrap来估计方差。你看爽不爽!bootstrap就是自己提靴子的方法。自己把脚抬起来扛在肩上走路,就这么牛。这个bootstrap就是用30个样本能做到30万样本那样的效果。有吸引力吧。你说这个简单回归简单还是不简单!很简单,就是加选项。可是,要理论推导,就不简单了。我估计国内能推导的没几个人。经济研究上论文作者,最多只有5%的人能推导,而且大部分是海龟。所以,你不需要会推导,也能把计量做的天花乱坠。 工具变量(IV)回归,这不用说了,有内生性变量,就用这个吧。一旦有内生性变量,你的估计就有问题了。国际审稿人会拼了老命整死你。国内审稿人大部分不懂这东西(除了经济研究这类刊物的部分审稿人以外)。工具变量的选择只要掌握一个关键点就行:找一个和内生性变量有数据相关的,但是没有因果关系的东西,这就是你的IV了。例如贸易量如果是内生的,那么你找地理距离作为IV。北京到纽约的距离,那是自然形成的,没人认为是由贸易量导致的,这就是没有因果关系。但是你会发现两者在数据上具有相关性。这就很好。这种数据相关性越强,IV的效果就越好。就这么一段话,IV变量回归就讲完了。在STATA里面,你直接把原回归方程写出来,然后把IV填进去就可以了,回车就得到你的结果。关键是你不一定能找到这样的工具变量。你能找到,这个工具也不大能用。不过要注意,IV不灵不代表你不能发表。经济研究上还不是发了一大堆这样的论文。所以,你只要找到一个IV,效果不是差的太离谱,一般都能发。当然不能发国际一流了。国内是没问题。国内审稿人没人会重复你的结果看看是否有问题,因此你说这个IV效果已经是最好的了,世界上还找不到第二个比这个更好的了,审稿人也没的话说。就发表呗!如果审稿人说,另外一个IV效果可能要比你的好。那你就采纳他的建议用他的IV(尽管他的建议会更差),然后感谢他一下。第二次审稿,难道他还会说自己上次是胡说八道???所以就发表了,哈哈哈哈! 有人又会问:面板不是还有个随机效应嘛?我只能说,你是看过书的人,所以才知道随机效应。其实随机效应压根就没什么用处。有人信誓旦旦说可以用hausman来检验。我只能告诉你,这检验压根就不可靠。可靠也是理论上可靠,实践上根本没人信。当然中国人都信,不信的都是美国欧洲这样的计量经济学家。你难道不知道hausman还会出现负值!做过这个检验的人都很头疼这个负值,不知道该怎么做。你如果看看一些高手的建议,或者一些书籍,你就会发现,最权威的建议就是:当你无法判断该用固定效应还是随机效应的时候,选择固定效应更可靠。随机效应不是任何时候都可以做,但是固定效应是任何时候都可以做。所以你知道该怎么做了吧。 差分再差分,是固定效应的一个变种,在估计某个事件发生带来的效应时最有用的方法,特简单,看看STATA手册就明白了。狂忒二回归(Quantile)是一般均值回归的一个推广。看名字挺吓人,其实很简单。如果你知道OLS是一个均值回归,那类推就可以知道1/2分位数回归。你知道的,正态分布下,均值就是1/2分位数的地方。均值回归就是1/2分位数回归。知道了1/2回归,你自然知道1/4和3/4分位数回归了。如果还不懂,翻开伍德里奇的书,讲到简单OLS回归时,我记得有一个图,上面对不同位置的x位置画了不同的正态分布密度函数(第2版是figure 2.1,pp26,见下面)。如果是异方差问题,那么不同x位置的正太分布图的方差就有变化。这个图上注明了预测值是E(Y|X),就是Y的条件期望,就是那根回归预测直线啦。在正态分布下就是Y的密度函数的中心点的连线,就是1/2分位数点的连线。如果那条预测线画在密度函数的1/4和3/4分位数点上,那么预测结果就不是Y的均值(在非正态下可能是均值),而是1/4和3/4分位数点的预测值。这下明白狂忒二回归了吧。分位数回归就是看看那根预测直线在不同的分位数点上有什么结果,得到什么样的回归系数。通常的OLS预测直线,仅仅是一个特例而已。进一步推广,可以推广到任意分位数点回归的情况。道理一样。 伍德里奇《计量经济学导论——现代观点》的图2.1(解释Quantile回归的意义) 不过要注意,大杀器要用对。有内生性变量,你就不要用简单回归了,你得用IV回归。这几种大杀器的精髓一领会,基本上其他东西就难不倒你了。就是STATA里面的选项多选几个或者少选几个的问题。你所要做的就是在STATA里面打钩、设置参数。对付一般的CSSCI论文,已经是绰绰有余了。如果你提了一个大家很感兴趣的问题,就是一个重要问题,那么用用IV,或者固定面板,发个经济研究基本没问题。如果你的问题不是很重要,还想发经济研究,那你就要简单问题复杂化。上面大杀器能解决的问题,你就用更不可靠的方法但更复杂的方法去解决吧。大家用开源软件就会知道,一般开源软件会有一个稳定版本,功能比较少,效果很稳定,能满足你日常几乎所有的需求。还有一个开发版本,专门给那些吃饱了撑着没事干的人倒腾的版本,因为是开发版本,所以很不稳定,经常会出错、崩溃。不过能倒腾的人不怕崩溃,崩溃了能自己修。你要是想倒腾,接着往下看吧。 四、瞎倒腾计量的秘诀 瞎倒腾有两种水平,第一种是低水平,第二种,那你也猜到了,就是高水平瞎倒腾。 低水平瞎倒腾,就是大杀器不够过瘾,要用摄人魂魄、但容易走火入魔的计量方法达到发表经济研究的目的。例如,没事弄弄协整,搞一把单位根检验之类的。听起来头头是道,其实都是杞人忧天。你想想,要是有协整,时间序列你根本不用着急。要是没有协整,你着急也没用。那你还协整个啥!面板来说,你有协整,也没有一个较好的估计方法,期刊上不是还有很多人在用固定效应OLS,或者是加点滞后滞前项变成一个固定效应动态OLS来估计非平稳面板嘛。面板到现在为止也没有一个公认的可靠的协整向量估计方法,否则STATA这样的软件早就提供按钮了(STATA和EVIEW现在只有协整的检验方法,不是协整向量的估计)。既然没有公认可靠的方法,你急啥! 其实,协整这玩意,最大的价值也在于理论价值,实践价值几乎没有。当年格兰杰发表协整思想,说如果变量不平稳,在没有协整关系的情况下,前人回归都不可靠。这话把大家吓个半死。惊魂未定时格兰杰又说,在协整情况下没问题,大部分论文中的经济变量都有协整关系。大家一听,松了口气,原来没有问题。有问题的那些少数自然自讨没趣。从格兰杰当年这搞笑天分,你就知道期刊上那些协整玩意都是忽悠。当然,又是单位根检验,又是协整检验,然后各种估计方法,这就好几页篇幅过去了,经济研究编辑一看,至少进入匿名审稿了。兵法曰:唱空城计,以静制动。意思你知道的。 上面是低水平瞎倒腾。虽然摄人魂魄,但是一旦走火入魔,论文就被毙。风险和收益,你自己把握吧。下面简单谈谈高水平瞎倒腾。这不属于本文的目标范围,但是既然提到瞎倒腾,不提一下这个有点缺陷。能干这事的人,一般都要看过高级计量。不看是不会的。如果你没看过,下面可以直接跳过。 这高水平瞎倒腾,基本上是一招毙命,当然是毙审稿人和主编的命。要毙了自己的命,还不如不瞎倒腾呢。我只讲一下操作步骤。能如此瞎倒腾的人,基本一看就能心领神会。找一篇顶级期刊的名人写的经验研究论文。这类论文通常是问题很重要,方法很傻瓜。然后你去拓展方法。这里改改残差假设,那里修修变量平稳性强度,重新推导一下估计量(这就是为什么走这条路,你就得会推导),得到一个新的分布,然后按照这个新分布来做显著性检验,得到你想要的结果。看看有什么结果变化。啥变化也没有那几乎是不可能的。即使没大的变化,也会有系数程度大小的变化,或者显著性有所轻微变化。只要有变化,就大做文章,巴拉巴拉一大堆讨论,晕死他再说。这论文写出来,投经济研究自然没什么问题。说实话国内能这么玩的人毕竟少数。你玩把戏,审稿人都不一定看得出来。自然就通过了。如果投国际上一流刊物,那么多人在玩这个把戏,都是火眼金睛,就看你玩的转否。如同马戏团的杂技,有人玩得溜,有人会出破绽。 再补充一个中等水平的瞎倒腾方法。你也不需要会推导公式,但是你得会用一些傻×程序,例如GAUSS,MATLAB、R等。你平时紧紧盯着那些出新方法的期刊,我指的是国际期刊哦。一旦有一个新方法出来,作者都会附一个程序,例如R程序。你就下载下来。看明白这篇对应论文的摘要、introduction和结论,基本搞清楚这方法是针对什么样的问题的,在什么情况下能用。这就行了。你拿过来把中国数据往里面灌,然后出来一篇论文。因为这方法很新,国内基本没人见过,即使见过也是极少数人。没人见过就好办事。你说自己的结果怎么样可靠,怎么样比别人的结果要好,那就是好。编辑肯定没见过这方法,审稿人只是小概率见过。所以这论文一投就中。 五、大规模发CSSCI的建议 以揭示经济变量之间关系为目的的人,掌握大杀器的用法就够了。发CSSCI没有问题。你把一个数据集用一个方法做一遍,每个方法都做一遍。然后挑最差的一个结果写一篇论文,然后发表。然后次佳的结果写第二篇,推进你第一篇的结论,说你用了新方法有了新发现。准能发。这年头的CSSCI,大部分都是没有什么新结果的,花钱就能发。你要弄出一些新结果来推进一下,那就是上层之作了。然后,你知道的,第三篇文章杀出来了,第四篇文章又杀出来了。别忘了,还有第五种狂忒二方法,CSSCI编辑基本不知道啥东西,你基本上是一招杀敌。这样至少5篇CSSCI。一般研究生博士生都能毕业了。碰到**的学校,你也**一点,再找一个数据集,再整5篇CSSCI。10篇总能让人毕业了吧!!!如果你的学校非要发经济研究管理世界中国社科,那你就再把我上面的五种方法看一遍,融会贯通,让自己能做到对症下药,发经济研究基本没问题。对症下药就是计量方法要选择合适的,那几种大杀器不要用错了地方。 结论 你那学校发经济研究也不能毕业???难道你在哈佛念书?那你看错帖子了。哈佛写经验类论文是不能毕业的!!!对于大部分国内学生来说,没人教授计量经济学,很痛苦。有人教授计量,更痛苦。计量经济学的教材、那些漫天飞舞的矩阵,有时间看看,没时间不看也行,不影响写论文。关键是看看软件的手册,有条件找个懂软件的人,一周就能成为计量写作的高手。我猜想看这帖子的大部分人都是属于写经验论文的吧,按照上面的方法,发个10篇CSSCI基本没问题。难道毕业还有问题? 特别申明:以上方法,只是用于应急、被迫发表才能毕业等情况。如果有时间,还需要认真阅读高级计量,不但做到知其然,还要做到知其所以然。
个人分类: 学习经验|40 次阅读|0 个评论
分享 Random Forest using Python
Nicolle 2014-8-4 06:09
随机森林 是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做 市场营销模拟的建模 ,统计客户来源,保留和流失。也可用来 预测疾病的风险 和病患者的易感性。 随机森林是一个可做能够回归和分类。 它具备处理大数据的特性,而且它有助于估计或变量是非常重要的基础数据建模。这是一篇关于使用Python来实现随机森林文章。 什么是随机森林? 随机 森林 是 几乎 任何 预测 问题 (甚至 非直线 部分) 的固有 选择 。 它是 一个 相对较 新 的 机器 学习 的 策略 ( 在 90 年代产生于 贝尔 实验室 ) 和 它 可以 几乎用于 任何方面 。 它 属于 机器 学习 算法 一大类----- 集成学习 方法 。 集成学习 集成学习通过建立几个模型组合的来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成单 预测,因此优于任何一个单分类的做出预测。 随机森林是集成学习的一个子类,由于它依靠于策率树的合并。你可以在这找到用python实现集成学习的文档: Scikit 学习文档 。 随机决策树 我们 知道 随机 森林 是 其他 的模型 聚合, 但 它 聚合 了什么 类型 模型 ? 你 可能 已经 从 其 名称 、 随机 森林 聚合 分类(或 回归) 的 树 中猜到。 决策 树 是 由 一 系列 的 决策的组合, 可 用于 分类 观察 数据集 。 随机森林 算法引入了一个随机森林来 自动 创建 随机 决策 树 群 。 由于 树 随机 生成 的树, 大部分的树(或许 99.9%树) 不 会 对 学习 的 分类/回归 问题 都 有意义 。 如果 观察到 长度 为 45 ,蓝 眼睛 , 和 2 条腿 , 就 被 归类 为 红色 。 树的投票 所以10000个(概率上)糟糕的模型有*****什么好的?好吧,这样确实没什么特别的好处。但是随着很多糟糕的决策树被生成,其中也会有很少确实很优秀的决策树。 当你要做预测的时候,新的观察到的特征随着决策树自上而下走下来,这样一组观察到的特征将会被贴上一个预测值/标签。一旦森林中的每棵树都给出了预测值/标签,所有的预测结果将被归总到一起,所有树的模式投票被返回做为最终的预测结果。 简单来说,99.9%不相关的树做出的预测结果涵盖所有的情况,这些预测结果将会彼此抵消。少数优秀的树的预测结果将会超脱于芸芸“噪音”,做出一个好的预测。 为什么你让我用它? 随机森林就是学习方法中的 Leatherman 呀。你几乎可以把任何东西扔进去,它基本上都是可供使用的。在估计推断映射方面特别好用,以致都不需要像SVM那样做很多调试(也就是说对于那些最后期限很紧的家伙们真是太棒了)。 一个映射的例子 随机森林在没有精心准备的数据映射的情况下也能学习。以方程f(x) = log(x)为例。 制造一些假数据,并且加上一点儿噪音。 import numpy as npx = np.random.uniform(1, 100, 1000)y = np.log(x) + np.random.normal(0, .3, 1000) full gist here 如果 我们 建立了 一个 基本 的 线性 模型 通过使用 x 来预测y, 我们需要 作 一 条 直线 , 算是 平分 log (x) 函数。 而 如果 我们 使用 一个 随机 的 森林 , 它 不会 更 好 的 逼近 log (x) 曲线 并能够使得它更像实际函数。 你 也许会说 随机 森林 有点 扰乱了 log(x) 函数 。 不管怎样 , 我 都认为 这 做了一个 很 好 的 说明 如何 随机 森林 并 未绑定于 线性 约束 。 使用 变量选择 随机森林最好的用例之一是特征选择。尝试很多决策树变种的一个副产品就是你可以检测每棵树中哪个变量最合适/最糟糕。 当一棵树使用一个变量,而另一棵不使用这个变量,你就可以从是否包含这个变量来比较价值的减少或增加。优秀的随机森林实现将为你做这些事情,所以你需要做的仅仅是知道去看那个方法或参数。 在下述的例子中,我们尝试去指出对于将酒分为红酒或者白酒哪个变量是最重要的。 分类 随机森林也很善于分类。它可以被用于为多个可能目标类别做预测,它也可以被校正输出概率。你需要注意的一件事情是 过拟合 。随机森林容易产生过拟合,特别是在数据集相对小的时候。当你的模型对于测试集合做出“太好”的预测的时候就应该怀疑一下了。 产生过拟合的一个原因是在模型中只使用相关特征。然而只使用相关特征并不总是事先准备好的,使用特征选择(就像前面提到的)可以使其更简单。 回归 是的,它也可以做回归。 我们已经发现随机森林——不像其它算法——对分类变量或者分类变量和真实变量混合学习的非常好。具有高基数(可能值的#)的分类变量是很棘手的,所以在你的口袋中放点儿这样的东西将会是非常有用的。 from sklearn.datasets import load_irisfrom sklearn.ensemble import RandomForestClassifierimport pandas as pdimport numpy as npiris = load_iris()df = pd.DataFrame(iris.data, columns=iris.feature_names)df = np.random.uniform(0, 1, len(df)) = .75df = pd.Factor(iris.target, iris.target_names)df.head()train, test = df ==True], df ==False]features = df.columns clf = RandomForestClassifier(n_jobs=2)y, _ = pd.factorize(train )clf.fit(train , y) preds = iris.target_names )]pd.crosstab(test , preds, rownames= , colnames= ) 看起来很不错! 结语 随机森林相当容易使用,而且很强大。对于任何建模,都要注意过拟合
个人分类: Python|17 次阅读|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 11:22