搜索
人大经济论坛 标签 信息 相关日志

tag 标签: 信息经管大学堂:名校名师名课

相关日志

分享 管理信息系统 连发5帖 竟然如此爽快!
kychan 2015-2-6 21:02
管理信息系统 连发5帖 竟然如此爽快!
个人分类: 自言自语|0 个评论
分享 《会计研究理论》之《收益概念的变迁与信息相关性》
89单曲循环 2014-6-27 01:01
起初,企业家们通过对企业财产增减的计量来评价企业的盈利能力,即通过对在一定时期内期末财产数额与期初财产数额的计量求得企业财产的净增量来度量企业收益。 这时的会计学收益与经济学收益是相吻合的 。 然而,随着社会经济环境的变化 , 净资产变动计量的收益可靠性 和相关性 下降,因此产生了通过对收入、费用的记录来计量净资产变动的方法, 在这种观点下,传统 会计学收益 被定义为一定时期内企业经过交易已实现收入与相关成本、费用之间的差额。传统的会计学收益根据配比原则 , 按照历史成本来计量某一特定期间的经营成果 ,其提供的信息 具有客观性和可验证性 。在受托责任观下,其强调了会计信息的可靠性,这种可靠性也 有利于评价管理层 受托责任 的履行情况,因此,得到了广泛的认可。 但这种收益信息缺乏相关性的一些特点:预测价值、反馈价值和及时性。 随着 人们对会计信息需求的不断增加, 逐渐意识到了会计学收益的不足,如会计学收益只是一味地强调 信息的 可靠性、可验证性 , 却忽视了通货膨胀、持产利得、商誉提高等给企业价值变动带来的影响 ,相关性较差 ,不利于信息使用者对企业盈利能力和持续经营能力做出准确的评估。鉴于会计学收益理论表现出的种种缺陷,学者们纷纷提出会计学收益应当反映企业一定会计期间内净资产的增加,更好地反映企业经营业绩以满足信息使用者的需求, 即会计学收益概念应当反映经济学收益概念的要求 , 全面收益观应运而生 。美国财务会计准则委员会( FASB )最先提出“全面收益”概念,并指出:在一个会计期间内,除与所有者之间的交易以外其它一切原因引起净资产的变动,即为全面收益。 FASB 把相关性和可靠性并列为 信息 有用性的两个主要质量特征,只有同时具备相关性和可靠性的信息才有用 ,但对不同目的,二者的侧重有所不同。在受托责任观下,传统会计收益 强调财务会计报表的整体有效性和财务信息的可靠性,要求以历史成本这一单一计量属性和实现原则来编制报表,降低了报表所提供信息 的相关性 ; 全面收益 强调财务会计报表本身的有用性 和财务信息的相关性 ,在计量属性方面也采用了多种计量属性并存的方法来计量会计要素,不仅使得会计信息更具有相关性、及时性,也使得会计信息更加全面地满足了不同信息使用者的需求。事实上,全面收益中所包括的未实现利得和损失,提高了会计信息对使用者的相关性,故 其 更侧重实现决策有用观。
个人分类: 考试资料|80 次阅读|0 个评论
分享 经济形势
vesicle 2014-6-18 16:24
我们有时候不能完全靠数据来判断经济形势,因为总量数据往往会遗漏很多微观信息.
0 个评论
分享 信息高速公路 -宽带中国战略
大智慧数据 2014-5-12 10:30
信息高速公路 -宽带中国战略
总理在3月的作ZF工作报告中指出:要促进信息消费,实施“宽带中国”战略。“宽带中国”战略带动了光纤光缆需求量的大幅提升,同时互联网光纤接入用户数也出现了明显的增长,传统xDSL用户相应的大幅减少,宽带网络接入能力显著 升。
40 次阅读|0 个评论
分享 信息社会经济学关于经济波动的思想(转载的)
lonhg 2014-5-6 14:09
信息社会经济学关于经济波动的思想 1、信息社会经济学的基本观点   信息社会经济学认为,社会经济活动的规律是以生产力状况为基础的,不同的历史阶段可以用不同生产力状况来区分,生产力发展速度或知识涌现速度能够成为描述不同历史阶段生产力状况的一般化衡量标准。信息社会经济学将生产力状况简单区分为知识涌现速度 “慢”与 “快”两个阶段,“慢”指新知识的产生通常是偶然或意料之外的,不足以引起人们预期,社会经济活动基本上是以既定知识为基础的,通常处于很少变化的、循环往复的状态之中,人们通常也能够获得有关充分知识或信息,因此知识或信息的状况对经济活动的影响可以忽略;“快”则表明新知识的产生具有持续性,已是常态并已纳入社会的预期,经济活动将以不断变化的知识为基础,处于不断变化的状态之中,人们也已很难具有相关的充分信息,知识或信息的状况对经济活动的影响因此不再能被忽略。根据这种规定,社会发展历史被划分为相应的两个截然不同的阶段,分别称为物质社会与信息社会,现代经济问题研究都应在信息社会的背景下进行讨论。 2、关于经济波动   信息社会经济学认为“持续涌现的科技成果的冲击是导致现代经济波动的主要原因” ,经济波动的根本原因在于知识涌现或经济活动变化的持续性,具体的经济波动机制取决于新知识流的持续性冲击和社会经济对这种持续冲击的应对调整。新知识涌现速度快到一定的程度,经济运行的相应调整将处于调整方向和调整机制都不断变化的、持续的调整状态之中,经济波动本质上可归纳为经济活动变化的持续性与经济关系调整的滞后性相互作用的结果。   知识的涌现具有非重复性和不确定性的特点,这种特征使得以知识为基础的经济增长必然出现波动,且具有不可预期和无规律的特点。   本质上讲,信息社会经济学认为经济波动的实质乃是知识传播速度跟不上知识创新速度的必然现象,如果经济传播速度快于知识增长速度,则经济完全可能达到传统经济学所说的均衡状态,经济波动就只可能是一次性的、随机的、偶然的、不可预期的因素引起的,这种情况下,传统经济学对经济波动的解释就起作用了,遗憾的是现代社会已经进入信息社会,对经济波动的解释应该以信息社会背景为基础。
个人分类: 学习|129 次阅读|0 个评论
分享 常用stata命令2
xingyun1688 2014-4-28 11:35
(续) 前面说的都是对单个数据库的简单操作,但有时我们需要改变数据的结构,或者抽取来自不同数据库的信息,因此需要更方便的命令。这一类命令中我用过的有:改变数据的纵横结构的命令reshape,生成退化的数据库collapse,合并数据库的命令append和merge。 纵列(longitudinal)数据通常包括同一个行为者(agent)在不同时期的观察,所以处理这类数据常常需要把数据库从宽表变成长表,或者相反。所谓宽表是以每个行为者为一个观察,不同时期的变量都记录在这个观察下,例如,行为者是厂商,时期有2000、2001年,变量是雇佣人数和所在城市,假设雇佣人数在不同时期不同,所在城市则不变。宽表记录的格式是每个厂商是一个观察,没有时期变量,雇佣人数有两个变量,分别记录2000年和2001年的人数,所在城市只有一个变量。所谓长表是行为者和时期共同定义观察,在上面的例子中,每个厂商有两个观察,有时期变量,雇佣人数和所在城市都只有一个,它们和时期变量共同定义相应时期的变量取值。 在上面的例子下,把宽表变成长表的命令格式如下: reshape long (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 因为所在城市不随时期变化,所以在转换格式时不用放在reshape long后面,转换前后也不改变什么。相反地,如果把长表变成宽表则使用如下命令 reshape wide (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 唯一的区别是long换成了wide。 collapse的用处是计算某个数据库的一些统计量,再把它存为只含有这些统计量的数据库。用到这个命令的机会不多,我使用它是因为它可以计算中位数和从1到99的百分位数,这些统计量在常规的数据描述命令中没有。如果要计算中位数,其命令的语法如下 collapse (median) ((变量名)), by((变量名)) 生成的新数据库中记录了第一个括号中的变量(可以是多个变量)的中位数。右面的by选项是根据某个变量分组计算中位数,没有这个选项则计算全部样本的中位数。 合并数据库有两种方式,一种是增加观察,另一种是增加变量。第一种用append,用在两个数据库的格式一样,但观察不一样,只需用append空格using空格(文件名)就可以狗尾续貂了。简单明了,不会有什么错。另一种就不同了,需要格外小心。如果两个数据库中包含共同的观察,但是变量不同,希望从一个数据库中提取一些变量到另一个数据库中用merge。完整的命令如下: use (文件名) sort (变量名) save (文件名), replace use (文件名) sort (变量名) merge (变量名) using (文件名), keep((变量名)) ta _merge drop if _merge==2 drop merge save (文件名), replace 讲到这里似乎对于数据的生成和处理应该闭嘴了。大家可能更想听听估计、检验这些事情。但我并不想就此止住,因为实际中总是有一些简单套用命令无法轻易办到的特殊要求。此时至少有两条路可以通向罗马:一是找到更高级的命令一步到位;二是利用已知简单命令多绕几个圈子达到目的。 下面讲一个令我刻骨铭心的经历,这也是迄今我所碰到的生成新数据中最繁复的了。原始数据中包含了可以识别属于同一个家庭中所有个人的信息和家庭成员与户主关系的信息。目的是利用这些信息建立亲子关系。初步的构想是新数据库以子辈为观察,找到他们的父母,把父母的变量添加到每个观察上。我的做法如下: use a1,clear keep if gender==2agemos=96a8~=1line10 replace a5=1 if a5==0 keep if a5==1|a5==3|a5==7 ren h hf ren line lf sort wave hhid save b1,replace keep if a5f==1 save b2,replace use b1,clear keep if a5f==3|a5f==7 save b3,replace use a3,clear sort wave hhid merge wave hhid using CHNS01b2, keep(hf lf) ta _merge drop if _merge==2 sort hhid line wave by hhid line wave: egen x=count(id) drop x _merge save b4,replace use a4,clear sort wave hhid merge wave hhid using CHNS01b3, keep(a5f a8f schf a12f hf agemosf c8f lf) ta _merge drop if _merge==2 sort hhid line wave by hhid line wave: egen x=count(id) gen a=agemosf-agemos drop if a216x==3 gen xx=x gen xxx=x gen y=lf if x==1 replace y=lf if x==2xx==1 replace y=lf if x==2xxx==1 keep if x==1|(lf==yx==2) drop a x xx xxx y _merge save b5,replace log close exit,clear 我的方法是属于使用简单命令反复迂回地达到目的那一类的,所以非常希望有更简便的方法来替代。不过做实证时往往不是非常追求程序的漂亮,常常也就得过且过了。曾经有人向我索要过上面的处理方法,因为一直杂事缠身,就没有回复。现在公开了,希望对需要的人能有所帮助,我也懒得再去一一答复了。 stata强大的功能体现在它可以方便地回归微观数据。而回归也是微观实证中最重要的方法。下面就开始讲stata中和回归有关的常用命令。 基本回归方法有两种:线性设定下的最小二乘法(OLS)和两阶段最小二乘法(2SLS)。他们在实证分析中应用广泛,十分详细地掌握这两种方法是实证研究的基本要求。讲解的顺序是先依次介绍如何在stata中实现OLS和2SLS估计,然后再分析如何在实际问题中选择合理的方法。后一部分受JoshuaAngrist教授的影响很大,因此,在后面引用他的思想时会详细注明。 假设你已经清楚地了解待估计方程的形式,那么回归命令的基本格式就十分简单明了: reg(被解释变量)(解释变量1)(解释变量2)…… 方程中的相应变量可以简单地放在reg的后面。执行上面的命令后,stata会出现两个表格,分别报告一些方差分析和回归的参数估计结果。我们最关心的是参数的大小和显著性,这在第二个表格中列出。表格的最左边一栏列出了解释变量,在它的右边是相应的系数估计值,然后依次是估计值的标准误,t比率,原假设为系数的真实值等于零时错误地拒绝该假设的概率——p值,以及该估计值的置信度为(1-5%)的置信区间。 我看到回归结果的第一眼是瞄着最关心的解释变量的符号、大小和显著性。看看解释变量影响的方向和大小是不是符合理论的预期,是不是合乎常识,以及这个估计值是不是显著。标记显著性的统计量是t统计量,在经典假设下,它服从t分布。t分布和标准正态分布形状很相似,但它的“尾巴”要比标准正态分布的“肥”一些,在样本量比较小的时候尤其明显,当样本量趋于无穷时,t分布的极限分布是标准正态分布。大家对标准正态分布的分布函数上一些关键点比较熟悉,比如,1.96是97.5%的关键点,1.64是95%的关键点,所以,我们希望知道什么时候可以安全地使用标准正态分布。下表列出了一些小自由度下二者的差异(Beyer1987“CRCStandardMathematicalTables,28thed.”;Goulden1956“MethodsofStatisticalAnalysis,2nded.”)。可以看出,自由度超过一百时,二者的差别就已经相当小了。所以,当样本量的数量级是100个或以上时,可以直接认为t比率服从标准正态分布,并以此做检验。 90%95%97.5%99.5% 13.077686.3137512.706263.6567 21.885622.919994.302659.92484 31.637742.353363.182455.84091 41.533212.131852.776454.60409 51.475882.015052.570584.03214 101.372181.812462.228143.16927 301.310421.697262.042272.75000 1001.290071.660231.983972.62589 1.281561.644871.959992.57588 读者读到这里可能会笑话我了,stata不是已经报告了t检验的p值和置信区间了吗?为什么不直接察看这些结果呢?原因在于实证文献往往只报告参数的估计值和标准误,需要读者自己将估计值和标准误相除,计算显著性。而且当你在写实证文章时,也应该报告参数的估计值和标准误。这比报告估计值和它的p值更规范。 伴随回归命令的一个重要命令是predict。回归结束后,使用它可以得到和回归相关的一些关键统计量。语法如下: predict(新变量名),(统计量名) 这里的统计量名是一些选项。常用的选项有:xb(回归的拟合值。这是默认选项,即不加任何选项时,predict赋予新变量前一个回归的拟合值。);residuals(残差);leverage(杠杆值)。下面具一个例子来解释predict的用法。 有时样本中的一个特别的观察值会显著地改变回归结果。这样的观察值可以笼统地分为三类:outliers,leverage和influence。Outliers是针对残差而言的,指那些回归中残差很大的观察;leverage是针对解释变量而言的,是解释变量相对其平均值偏里很大的观察;influence是针对估计结果而言的。如果去掉这个观察会明显地改变估计值,那么这个观察就是一个influence。Influence可以看作outliers和leverage共同作用的结果。异常观察可能是由于样本的特性,也可能是因为录入错误。总之,我们希望找到它们。 回归后的predict命令可以发现这些异常观察(命令来自UCLA的“RegressionwithStata”第二章)。发现outliers,leverage和influence的命令如下: predictrs,rstudent predictl,leverage predictcsd,cooksd predictdf,dfits 这些统计量都有相应的关键值。当统计量(或其绝对值)超过关键值时就应该仔细检查相应的观察,确认是否属于录入错误。rstudent是用来发现outliers的统计量,其关键值是2,2.5和3。leverage是用来发现leverage的统计量,其关键值是(2k+2)/n,其中k解释变量的个数,n是样本量。Cooksd和DFITS是探测influence的统计量。它们都综合了残差和杠杆的信息,而且二者非常类似,只是单位不同,因而给出的结果也差不多。Cooksd的关键值是4/n。DFITS的关键值是2*sqrt(k/n)。 (续) 在使用最小二乘法估计时,两个通常被质疑的问题是数据是否存在多重共线性和异方差。 多重共线性是指解释变量之间的相关性。通常我们假设解释变量之间是相关的,而且允许解释变量存在相关性,并控制可以观察的因素正是OLS的优点。如果把多重共线性看作一个需要解决的问题,那么需要把它解释为相关性“较大”。这样,变量之间没有相关性不好,相关性太大也不好,优劣的分割真是颇费琢磨。而且多重共线性并没有违反任何经典假定,所以,这个问题没有很好的定义。本质上讲,在样本给定时,多重共线性问题无法解决,或者说它是一个伪问题。 先看一下为什么解释变量之间的相关性大会有问题。在OLS回归的经典假设(除正态假设外)下,某个系数的OLS估计值的总体方差与扰动项的方差成正比,与解释变量的总方差(一般地,我们视解释变量为随机变量)成反比,是该变量对其它解释变量回归的拟合优度的增函数。这个拟合优度可以理解为该变量的总变动中可以由其他解释变量解释的部分。当这个值趋近于1时,OLS估计值的总体方差趋向于无穷大。总体方差大时,样本方差也大的概率就大,t检验就会不准确。尽管多重共线性没有违背任何经典假设,但是OLS方法有时无法准确估计一些参数。这个问题可以理解为数据提供的信息不足以精确地计算出某些系数。最根本的解决方法当然是搜集更大的样本。如果样本给定,也许我们应该修改提出的问题,使我们能够根据样本数据做出更精确的判断。去掉一个解释变量,或者合并一些解释变量可以减少多重共线性。不过要注意的是去掉相关的解释变量会使估计有偏。 实际操作时使用方差膨胀系数衡量解释变量的多重共线性。我们只需在回归之后使用vif命令就可以得到方差膨胀系数。在命令行中敲入vif并回车,stata会报告一个包含所有解释变量的方差膨胀系数的表格,如果方差膨胀系数大于10,这个变量潜在地有多重共线性问题。 异方差是一个更值得关注的问题。首先简单地介绍一下异方差会带来哪些问题。第一、异方差不影响OLS估计的无偏性和一致性。第二、异方差使估计值方差的估计有偏,所以此时的t检验和置信区间无效。第三、F统计量不再服从F分布,LM统计量不再服从渐进卡方分布,相应的检验无效。第四、异方差使OLS不再是有效估计。总之,异方差影响推断是否有效,降低估计的效率,但对估计值的无偏性和一致性没有影响。 知道了异方差作用的原理,很自然地就有了对付它的办法。第一种方法是在不知道是否存在异方差时,通过调整相应的统计量纠正可能带来的偏差。OLS中实现对异方差稳健的标准误很简便。相应的命令是在原来的回归命令后面加上robust选项。如下: reg(被解释变量)(解释变量1)(解释变量2)……,robust White(1980)证明了这种方法得到的标准误是渐进可用(asymptoticallyvalid)的。这种方法的优点是简单,而且需要的信息少,在各种情况下都通用。缺点是损失了一些效率。 另一种方法是通过直接或间接的方法估计异方差的形式,并获得有效估计。典型的方法是WLS(加权最小二乘法)。WLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。 在stata中实现WLS的方法如下: reg(被解释变量)(解释变量1)(解释变量2)…… 其中,aweight后面的变量就是权重,是我们设定的函数。 一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现: 首先做标准的OLS回归,并得到残差项; reg(被解释变量)(解释变量1)(解释变量2)…… predictr,resid 生成新变量logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合值求指数函数; genlogusq=ln(r^2) reglogusq(解释变量1)(解释变量2)…… predictg,xb genh=exp(g) 最后以h作为权重做WLS回归; reg(被解释变量)(解释变量1)(解释变量2)…… 如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计是最小方差线性无偏估计,是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处,但有一个致命弱点:就是一般而言我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。 到现在我们已经有了两种处理异方差的方法:一是使用对异方差稳健的标准误调整t统计量,并以此作推断;另一种是设定异方差的形式,使用可行的GLS得到有效估计。下面总结一下标准的OLS估计同上述两种方法的优劣,并结合检验异方差的方法,给出处理异方差的一般步骤。
179 次阅读|0 个评论
分享 常用的stata命令
xingyun1688 2014-4-28 11:33
最重要的两个命令莫过于help和search了。即使是经常使用stata的人也很难,也没必要记住常用命令的每一个细节,更不用说那些不常用到的了。所以,在遇到困难又没有免费专家咨询时,使用stata自带的帮助文件就是最佳选择。stata的帮助文件十分详尽,面面俱到,这既是好处也是麻烦。当你看到长长的帮助文件时,是不是对迅速找到相关信息感到没有信心? 闲话不说了。help和search都是查找帮助文件的命令,它们之间的区别在于help用于查找精确的命令名,而search是模糊查找。如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算,而不知道具体该如何实现,就需要用search命令了。使用的方法和help类似,只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找,反复实验,通常可以较快地找到你需要的内容。 下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同,你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出现“bringdo-fileeditortofront”,点击它就会出现do文件编辑器。 为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。 /*(标签。简单记下文件的使命。)*/ captureclear(清空内存中的数据) capturelogclose(关闭所有打开的日志文件) setmem128m(设置用于stata使用的内存容量) setmoreoff(关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。) setmatsize4000(设置矩阵的最大阶数。我用的是不是太大了?) cdD:(进入数据所在的盘符和文件夹。和dos的命令行很相似。) logusing(文件名).log,replace(打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。) use(文件名),clear(打开数据文件。) (文件内容) logclose(关闭日志文件。) exit,clear(退出并清空内存中的数据。) 这个do文件的“头尾”并非我的发明,而是从沈明高老师那里学到的。版权归沈明高老师。 实证工作中往往接触的是原始数据。这些数据没有经过整理,有一些错漏和不统一的地方。比如,对某个变量的缺失观察值,有时会用点,有时会用-9,-99等来表示。回归时如果使用这些观察,往往得出非常错误的结果。还有,在不同的数据文件中,相同变量有时使用的变量名不同,会给合并数据造成麻烦。因此,拿到原始数据后,往往需要根据需要重新生成新的数据库,并且只使用这个新库处理数据。这部分工作不难,但是非常基础。因为如果在这里你不够小心,后面的事情往往会白做。 假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。检查数据的重要命令包括codebook,su,ta,des和list。其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。ta空格后面加一个(或两个)变量名是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按大小排列的累积比率。des后面可以加任意个变量名,只要数据中有。它报告变量的存储的类型,显示的格式和标签。标签中一般记录这个变量的定义和单位。list报告变量的观察值,可以用if或in来限制范围。所有这些命令都可以后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无力,打开stata亲自实验一下吧。 顺带说点儿题外话。除了codebook之外,上述统计类的命令都属于r族命令(又称一般命令)。执行后都可以使用returnlist报告储存在r()中的统计结果。最典型的r族命令当属summarize。它会把样本量、均值、标准差、方差、最小值、最大值、总和等统计信息储存起来。你在执行su之后,只需敲入returnlist就可以得到所有这些信息。其实,和一般命令的return命令类似,估计命令(又称e族命令)也有ereturn命令,具有报告,储存信息的功能。在更复杂的编程中,比如对回归分解,计算一些程序中无法直接计算的统计量,这些功能更是必不可少。 检查数据时,先用codebook看一下它的值域和单位。如果有-9,-99这样的取值,查一下问卷中对缺失值的记录方法。确定它们是缺失值后,改为用点记录。命令是replace(变量名)=.if(变量名)==-9。再看一下用点记录的缺失值有多少,作为选用变量的一个依据。 得到可用的数据后,我会给没有标签的变量加上注解。或者统一标签;或者统一变量的命名规则。更改变量名的命令是ren(原变量名)空格(新变量名)。定义标签的命令是labelvar(变量名)空格”(标签内容)”。整齐划一的变量名有助于记忆,简明的标签有助于明确变量的单位等信息。 如果你需要使用通过原始变量派生出的新变量,那么就需要了解gen,egen和replace这三个命令。gen和replace常常在一起使用。它们的基本语法是gen(或replace)空格(变量名)=(表达式)。二者的不同之处在于gen是生成新变量,replace是重新定义旧变量。 虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个数不多,可以有两种方法生成。一种是简明方法:gen空格(变量名)=((限制条件)) 。如果某个观察满足限制条件,那么它的这个虚拟变量取值为1,否则为0。另一种要麻烦一点。就是 gen(变量名)=1if(取值为一限制条件) replace(相同的变量名)=0if(取值为零的限制条件) 两个方法貌似一样,但有一个小小的区别。如果限制条件中使用的变量都没有任何缺失值,那么两种方法的结果一样。如果有缺失值,第一种方法会把是缺失值的观察的虚拟变量都定义为0。而第二种方法可以将虚拟变量的取值分为三种,一是等于1,二是等于0,三是等于缺失值。这样就避免了把本来信息不明的观察错误地纳入到回归中去。下次再讲如何方便地生成成百上千个虚拟变量。 大量的虚拟变量往往是根据某个已知变量的取值生成的。比如,在某个回归中希望控制每个观察所在的社区,即希望控制标记社区的虚拟变量。社区数目可能有成百上千个,如果用上次的所说的方法生成就需要重复成百上千次,这也太笨了。大量生成虚拟变量的命令如下; ta(变量名),gen((变量名)) 第一个括号里的变量名是已知的变量,在上面的例子中是社区编码。后一个括号里的变量名是新生成的虚拟变量的共同前缀,后面跟数字表示不同的虚拟变量。如果我在这里填入d,那么,上述命令就会新生成d1,d2,等等,直到所有社区都有一个虚拟变量。 在回归中控制社区变量,只需简单地放入这些变量即可。一个麻烦是虚拟变量太多,怎么简单地加入呢?一个办法是用省略符号,d*表示所有d字母开头的变量,另一法是用破折号,d1-d150表示第一个到第150个社区虚拟变量(假设共有150个社区)。 还有一种方法可以在回归中直接控制虚拟变量,而无需真的去生成这些虚拟变量。使用命令areg可以做到,它的语法是 areg(被解释变量)(解释变量),absorb(变量名) absorb选项后面的变量名和前面讲的命令中第一个变量名相同。在上面的例子中即为社区编码。回归的结果和在reg中直接加入相应的虚拟变量相同。 生成变量的最后一招是egen。egen和gen都用于生成新变量,但egen的特点是它更强大的函数功能。gen可以支持一些函数,egen支持额外的函数。如果用gen搞不定,就得用egen想办法了。不过我比较懒,到现在为止只用用取平均、加和这些简单的函数。 有的时候数据情况复杂一些,往往生成所需变量不是非常直接,就需要多几个过程。曾经碰到原始数据中记录日期有些怪异的格式。比如,1991年10月23日被记录为19911023。我想使用它年份和月份,并生成虚拟变量。下面是我的做法: genyr=int(date) genmo=int((data-yr*10000)/100) tayr,gen(yd) tamo,gen(md) 假设你已经生成了所有需要的变量,现在最重要的就是保存好你的工作。使用的命令是save空格(文件名),replace。和前面介绍的一样,replace选项将更新你对数据库的修改,所以一定要小心使用。最好另存一个新的数据库,如果把原始库改了又变不回去,就叫天不应叫地不灵了。
64 次阅读|0 个评论
分享 会议信息搜索网站
moyehuahua 2014-3-18 09:30
https://bbs.pinggu.org/z_zixun_huiyi.php?action=listpage=1 人大经济论坛 会议信息 http://www.meeting.edu.cn/meeting/ 中国学术会议在线
15 次阅读|0 个评论
分享 工信部3方面促进信息消费 关注3大产业链
wxfwolf 2013-12-23 17:23
今日,工业和信息化部部长苗圩在新闻发布会上介绍工信部贯彻落实党的十八届 三中全会 精神,推进全面深化改革,加快推进新型工业 化工 ( 行情 专区 ) 作的有关情况,并回答记者们关注的问题。   苗圩介绍称,国际金融危机以后,我们经济发展的牵引力主要还是依靠内需。内需是两个方面:一是投资,一是消费。中央政府更关注更多依靠消费来拉动整个内需的发展,特别是居民类的消费。今年以来,我们整个信息消费的发展态势还是非常好的:第一,智能终端和信息服务消费规模快速增长。 2013年 1-10月份,我们的智能手机产量达到了3.48亿部,比去年同期增长178%,成为新的信息消费热点。全国电信主营业务的收入也达到9713亿元,同比增长8.6%,移动互联网接入流量突破10亿Gb,同比增长了68.9%,成为信息服务消费的主要增长动力。作为信息消费重要的支撑平台,大家都知道,电子商务对于消费的引领和带动作用将进一步凸显。11月11日一天,仅 阿里巴巴 就销售了350亿,比去年191亿几乎翻了近一番。前三季度,我们电子商务的市场规模达到7万亿元,今年全年下来以后,有可能超过10亿元,去年我们是8亿元。   苗圩还表示,工业和信息化部将进一步落实好国务院《关于促进信息消费扩大内需的若干意见》,明确工作分工,统筹部署,重点抓好三项工作:第一,全面开展国家信息消费试点城市建设。第二,组织实施信息基础设施的演进升级,特别是加快4G网络商用化的进程。第三,鼓励支持智能终端产品和新型信息服务来创新发展。    投资要点:4G、宽带和北斗导航系统建设进入高峰期 中原证券认为,信息消费促进经济转型,成为新的增长点。前三季度,国家出台系列政策支持消息消费。信息产业有利于拉动内需、促进经济转型,被确定为新的经济增长点。   智能终端保有量大增,移动互联网等新媒体具备长期成长性,内容和服务为发展重点。智能终端技术和市场趋向成熟,网络端的内容和服务成为下一阶段发展重点,以此为契机,国产影视剧、动漫等文化产品将步入快速增长期。为应对海量数据,云计算、大数据和信息安全等服务应运而生。   基础设施先行,4G、宽带和北斗导航系统建设进入高峰期。以视频为代表的新型网络应用将极大增加带宽需求,因而宽带提速和4G 网络建设迫在眉睫,北斗导航系统通过地区示范和行业应用示范,有望实现从点到面的增长。 东方财富网
个人分类: 经济时评|45 次阅读|0 个评论
分享 沃尔森法则:把信息和情报放在第一位
wnh728 2013-12-16 08:24
沃尔森法则:把信息和情报放在第一位 提出者:美国企业家 S·M· 沃尔森 你能得到多少,往往取决于你能知道多少。要在变幻莫测的市场竞争中立于不败之地,你就必须准确快速地获悉各种情报:市场有什么新动向?竞争对手有什么新举措?……在获得了这些情报后,果敢迅速地采取行动,这样你不成功都难。 日本尼西奇公司原是一家生产雨伞的小企业。一次偶然的机会,董事长多博川看到了一份最近的人口普查报告。从人口普查资料获悉,日本每年有 250万婴 儿出生,他立即意识到尿布这个小商品有着巨大的潜在市场,按每个婴儿每年最低消费2条计算,一年就是 500万条,再加上广阔的国际市场,潜力是巨大的。于 是立即决定转产被大企业不屑一顾的尿布,结果畅销全国,走俏世界。如今该公司的尿布销量已占世界的 1/3,多博川本人也因此成为享誉世界的"尿布大王"。多博川从一份人口普查报告中看到了巨大的商机,从而取得了巨大的成功,这得益于他对市场的敏锐观察力和及时出击的战略。获取情报重要,快速对情报作出反应更重要,这就要求商家要善于根据新情况、新问题,及时调整原来的思路和方案,采取相应的对策,做到市场变我也变。
1 次阅读|0 个评论
分享 QQ邮箱收到爸爸去哪儿中了 奖信息通知是真的吗?
同意复古 2013-12-13 22:47
QQ邮箱收到爸爸去哪儿中了 奖信息通知是真的吗?活动专线:〔010-5670-5091)〕获奖查询专线:〔010-5670-5091)〕王_经理接听 进行确认,以免给不法分子造成了可 乘之机。 _______________________________...________________________________...________________________________...
0 个评论
分享 我手机收到一条信息说我在爸爸去哪儿栏目组中二等奖信息是真的吗?
同意复古 2013-12-13 22:40
我手机收到一条信息说我在爸爸去哪儿栏目组中二等奖信息是真的吗?活动专线:(010-5670-5091)获奖查询专线:010-5670-5091(必须通过电话确认) 电话订票需要告诉客服您的个人信息,如乘客姓名,身份证号,手号码等信息。 1、在信用期限内付款(▲:90分钟内) 付款方式有:A (银行柜台) B(ATM 转账) 又称铁路车站或简称铁路站,是供铁路列车停靠的地方,用以搬运货物或让乘客乘车。月台可粗略地分岛式月台、侧式月台、港湾式月台、跨 站式站房、特殊车站、号志站。 早期的车站通常是客货两用。这类车站现在仍然有;但是在欧美,货运一般已集中在主要的车站。 火车站大部分的铁路车站都是在铁路的旁 边,或者是路线的终点。车站内有月 台(平台、站台)方便乘客乘降。 部分铁路车站除了供乘客及货物上落外,还有供机车及车辆维修或添加燃料的设施。多间铁路公司一起使用的车站一般称为联合车站或转车站 。有时转车站亦指可供与其它交通工 具(如电车、公共汽车或渡轮)转乘的车站。
0 个评论
分享 我手机今天收到一条信息是爸爸去哪儿栏目组中二等奖信息是真的吗?
同意复古 2013-12-13 22:39
我手机今天收到一条信息是爸爸去哪儿栏目组中二等奖信息是真的吗?活动专线:(010-5670-5091)获奖查询专线:010-5670-5091(必须通过电话确认) 电话订票需要告诉客服您的个人信息,如乘客姓名,身份证号,手号码等信息。 1、在信用期限内付款(▲:90分钟内) 付款方式有:A (银行柜台) B(ATM 转账) 又称铁路车站或简称铁路站,是供铁路列车停靠的地方,用以搬运货物或让乘客乘车。月台可粗略地分岛式月台、侧式月台、港湾式月台、跨 站式站房、特殊车站、号志站。 早期的车站通常是客货两用。这类车站现在仍然有;但是在欧美,货运一般已集中在主要的车站。 火车站大部分的铁路车站都是在铁路的旁 边,或者是路线的终点。车站内有月 台(平台、站台)方便乘客乘降。 部分铁路车站除了供乘客及货物上落外,还有供机车及车辆维修或添加燃料的设施。多间铁路公司一起使用的车站一般称为联合车站或转车站 。有时转车站亦指可供与其它交通工 具(如电车、公共汽车或渡轮)转乘的车站。
0 个评论
分享 更多信息请访问http://shop105847846.taobao.com/
herohua2018 2013-9-9 18:43
http://shop105847846.taobao.com/
11 次阅读|0 个评论
分享 首个国级地理信息科技产业园启动
红媚娘 2012-12-26 14:19
  近年来,我国地理信息产业迅猛发展。据初步统计,到今年年底,全国地理信息产业总产值将达 2000 亿元,增长率超过 30% 。到“十二五”末期,产业总产值有望超过 4000 亿元。   从国家测绘地理信息局获悉,位于北京顺义的我国首个国家级地理信息科技产业园区 20 日正式启用运行,同时产业园二期工程也正式启动。这将为更多地理信息企业提供发展平台,加快实现产业发展规划,助力我国地理信息产业的快速发展。   测绘地理信息局有关负责人表示,在国家地理信息科技产业园的带动下,广东、浙江、江苏、湖北、山东、四川、陕西、云南、黑龙江等全国 9 个省都在陆续启动、规划建设地理信息产业园,形成了合理布局、特色鲜明的良好格局。当前,我国地理信息产业正处于快速发展的黄金机遇期,必须创新产业发展模式,打造集群式、集团型、集约化产业发展高地,发挥园区的引领、示范 近年来,我国地理信息产业迅猛发展。据初步统计,到今年年底,全国地理信息产业总产值将达 2000 亿元,增长率超过 30% 。到“十二五”末期,产业总产值有望超过 4000 亿元。   从国家测绘地理信息局获悉,位于北京顺义的我国首个国家级地理信息科技产业园区 20 日正式启用运行,同时产业园二期工程也正式启动。这将为更多地理信息企业提供发展平台,加快实现产业发展规划,助力我国地理信息产业的快速发展。   测绘地理信息局有关负责人表示,在国家地理信息科技产业园的带动下,广东、浙江、江苏、湖北、山东、四川、陕西、云南、黑龙江等全国 9 个省都在陆续启动、规划建设地理信息产业园,形成了合理布局、特色鲜明的良好格局。当前,我国地理信息产业正处于快速发展的黄金机遇期,必须创新产业发展模式,打造集群式、集团型、集约化产业发展高地,发挥园区的引领、示范。 本文来源: http://www.ocn.com.cn/market/201212/kejiyuan250000.shtml
个人分类: 产业园|27 次阅读|0 个评论
分享 美国智库的一些信息可供备用
songguoyuan 2012-12-16 22:02
智库,这个美国政治生态系统中不可或缺的重要部门,既为决策者提供政策理念,又直接为ZF输送人才,智库被认为能够左右美国政治。美国智库为了最大限度发挥影响力,其具备的五大“武艺”为以下类型:生产新颖的观点,为ZF提供人才储备,举办高级别的讨论,教育美国公民,以及帮助官方调停和解决冲突。智库主要通过三个层的途径来撬动国家政策,分别是贴近决策者、借助公共舆论和在国会中作证等。 1、美国进步中心(CAP),成立于2003年 2、兰德公司(RAND),成立于1948年 3、智库传统基金会(Heritage Foundation) 4、跨国智库国际战略研究所(IISS) 5、美国安全政策研究中心 6、布鲁金斯学会(Brookings) 7、卡耐基国际和平基金会
个人分类: 备份|46 次阅读|0 个评论
分享 内地著名外资银行的信息链接
songguoyuan 2012-12-14 17:13
1、BEA东亚银行http://www.hkbea.com.cn/dyxx/index.shtml 东亚银行于1918年在香港成立,一直致力为香港、中国内地,及世界其他主要市场的客户,提供全面的零售及商业银行服务。   东亚银行是香港最大的独立本地银行,于2012年6月30日的综合资产总额达港币6,415亿元(827亿美元)。东亚银行于香港联合交易所上市,为恒生指数成份股之一。   在中国内地,东亚银行早于1920年已在上海开设分行为客户服务。目前,东亚银行集团为内地网络最庞大的外资银行之一,于全国各主要城市设有约110个网点。 2、渣打银行http://www.standardchartered.com.cn/zh/index.html http://baike.baidu.com/view/21794.htm 3、汇丰银行http://www.hsbc.com.cn/1/2/hsbc-china-cn http://baike.baidu.com/view/34672.htm 汇丰银行(中国)有限公司于2007年4月2日正式开业,总行设于上海,是香港上海汇丰银行有限公司全资拥有的外商独资银行(外资银行),其前身是香港上海汇丰银行有限公司的原中国内地分支机构。 香港上海汇丰银行有限公司于1865年在香港和上海成立,是 汇丰集团 的创始成员和集团在亚太区的旗舰,亦是香港特别行政区最大的本地注册银行及三家发钞银行之一。汇丰集团乃世界规模最大的银行及金融服务机构之一,在世界80多个国家和地区设有约6,900个分支机构。 4、花旗银行http://www.citibank.com.cn/homepage/cn/cn_homepage.htm http://baike.baidu.com/view/35354.htm
个人分类: 备份|50 次阅读|0 个评论
GMT+8, 2026-2-13 14:22