你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

您的位置:

人大经济论坛

> 清华大学
  • 清华大学运筹学第三版课后习题答案上

    需要币呀

  • 清华大学刘军:大数据时代,传统统计学依然是数据分析的灵魂!

    在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。让大数据区别于数据的,是其海量积累、高增长率和多样性什么是数据?数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据。古人“结绳记事”,打了结的绳子就是数据。步入现代社会,信息的种类和数量越来越丰富,载体也越来越多。数字是数据,文字是数据,图像、音频、视频等都是数据。什么是大数据呢?量的增多,是人们对大数据的第一个认识。随着科技发展,各个领域的数据量都在迅猛增长。有研究发现,近年来,数字数据的数量每3年多就会翻一番。大数据区别于数据,还在于数据的多样性。正如高德纳咨询公司研究报告指出的,数据的爆炸是三维的、立体的。所谓的三维,除了指数据量快速增大外,还指数据增长速度的加快,以及数据的多样性,即数据的来源、种类不断增加。从数据到大数据,不仅是量的积累,更是质的飞跃。海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。这使得人们通过数据分析,能发现小数据时代很难发现的新知识,创造新的价值。通过数据来研究规律、发现规律,贯穿了人类社会发展的始终。人类科学发展史上的不少进步都和数据采集分析直接相关,例如现代医学流行病学的开端。伦敦1854年发生了大规模的霍乱,很长时间没有办法控制。一位医师用标点地图的方法研究了当地水井分布和霍乱患者分布之间的关系,发现有一口水井周围,霍乱患病率明显较高,借此找到了霍乱暴发的原因:一口被污染的水井。关闭这口水井之后,霍乱的发病率明显下降。这种方法,充分展示了数据的力量。本质上说,许多科学活动都是数据挖掘,不是从预先设定好的理论或者原理出发,通过演绎来研究问题,而是从数据本身出发通过归纳来总结规律。近现代以来,随着我们面临的问题变得越来越复杂,通过演绎的方式来研究问题常常变得很困难。这就使得数据归纳的方法变得越来越重要,数据的重要性也越发凸显出来。大数据是非竞争性资源,有助于ZF科学决策、商家精准营销大数据时代,数据的重要作用更加凸显,许多国家都把大数据提升到国家战略的高度。ZF合理利用大数据,引导决策的将是基于实证的事实,ZF会更有预见性、更加负责、更加开放。中国古代治国就已经有重数据的思想,如商鞅提出,“强国知十三数……欲强国,不知国十三数,地虽利,民虽众,国愈弱至削”。大数据时代,循“数”治国将更加有效。小数据时代,ZF做决策更多依凭经验和局部数据,难免头痛医头、脚痛医脚。比如,交通堵塞就多修路。大数据时代,ZF做决策能够从粗放型转向集约型。路堵了,利用大数据分析,可以得知哪一时间、哪一地段最容易堵,或在这一地段附近多修路,或提前预警引导居民合理安排出行,实现对交通流的最佳配置和控制,改善交通。对于商家来说,大数据使精准营销成为可能。一个有趣的故事,是沃尔玛超市的“啤酒、尿布”现象。沃尔玛超市分析销售数据时发现,顾客消费单上和尿布一起出现次数最多的商品,竟然是啤酒。跟踪调查后发现,有不少年轻爸爸会在买尿布时,顺便买些啤酒喝。沃尔玛发现这一规律后,搭配促销啤酒、尿布,销量大幅增加。大数据时代,每个人都会“自发地”提供数据。我们的各种行为,如点击网页、使用手机、刷卡消费、观看电视、坐地铁出行、驾驶汽车,都会生成数据并被记录下来,我们的性别、职业、喜好、消费能力等信息,都会被商家从中挖掘出来,以分析商机。大数据也将使个人受益。从生物学、医学上讲,以前生物学家只是通过对单个或几个基因的操控来观察其对生物体的影响,很难发现整体的关联。现在由于技术的发展,可以分析很多,如遗传信息、全体基因的表达量信息、蛋白质族谱信息、全基因组甲基化信息、表观遗传信息等。同时还有个人健康指标、病历、药物反应等数据。如果真能达成生物学上多维多向数据的有机融合,就能够把个人完整地描述出来,从而实现精准医疗的目的。大数据时代,审核数据的真实性也有了更有效的手段。大数据的特征之一是多样性,不同来源、不同维度的数据之间存在一定的关联度,可以交叉验证。例如,某地的工业产值虚报了一倍,但用电量和能耗却没有达到相应的规模。这就是数据异常,很容易被系统识别出来。发现异常后,相关部门再进行复核,就能更有针对性地防止、打击数据造假。数据是一种资源,但数据又跟煤、石油等物质性资源不一样。物质性资源不可再生,你用多了,别人就用少了,因而很难共享。数据可以重复使用、不断产生新的价值。大数据资源的使用是非恶性竞争的,共享的前提下,更能够制造双赢。从另一个角度来说,数据如果不被融合、联系在一起,也不能称之为大数据。大数据不能被直接拿来使用,统计学依然是数据分析的灵魂现在社会上有一种流行的说法,认为在大数据时代,“样本=全体”,人们得到的不是抽样数据而是全数据,因而只需要简单地数一数就可以下结论了,复杂的统计学方法可以不再需要了。在我看来,这种观点非常错误。首先,大数据告知信息但不解释信息。打个比方说,大数据是“原油”而不是“汽油”,不能被直接拿来使用。就像股票市场,即使把所有的数据都公布出来,不懂的人依然不知道数据代表的信息。大数据时代,统计学依然是数据分析的灵魂。正如加州大学伯克利分校迈克尔?乔丹教授指出的,“没有系统的数据科学作为指导的大数据研究,就如同不利用工程科学的知识来建造桥梁,很多桥梁可能会坍塌,并带来严重的后果。”其次,全数据的概念本身很难经得起推敲。全数据,顾名思义就是全部数据。这在某些特定的场合对于某些特定的问题确实可能实现。比如,要比较清华、北大两校同学数学能力整体上哪个更强,可以收集到两校同学高考时的数学成绩作为研究的数据对象。从某种意义上说,这是全数据。但是,并不是说我们有了这个全数据就能很好地回答问题。一方面,这个数据虽然是全数据,但仍然具有不确定性。入校时的数学成绩并不一定完全代表学生的数学能力。假如让所有同学重新参加一次高考,几乎每个同学都会有一个新的成绩。分别用这两组全数据去做分析,结论就可能发生变化。另一方面,事物在不断地发展和变化,同学入校时的成绩并不能够代表现在的能力。全体同学的高考成绩数据,仅对于那次考试而言是全数据。“全”是有边界的,超出了边界就不再是全知全能了。事物的发展充满了不确定性,而统计学,既研究如何从数据中把信息和规律提取出来,找出最优化的方案;也研究如何把数据当中的不确定性量化出来。所以说,在大数据时代,数据分析的很多根本性问题和小数据时代并没有本质区别。当然,大数据的特点,确实对数据分析提出了全新挑战。例如,许多传统统计方法应用到大数据上,巨大计算量和存储量往往使其难以承受;对结构复杂、来源多样的数据,如何建立有效的统计学模型也需要新的探索和尝试。对于新时代的数据科学而言,这些挑战也同时意味着巨大的机遇,有可能会产生新的思想、方法和技术。来源:人民日报

  • 西方经济学清华大学课件

  • 清华大学招聘研究助理(要博士),是否正规招聘?

    清华大学公共管理学院于永达教授课题组拟招聘全职合同制研究助理,要求如下:岗位1:领导力与集聚优势项目研究;岗位2:资源能源与可持续发展项目研究1.拟招聘人数:1-2人;1-2人2.工作内容:承担相关主题的课题研究,撰写研究报告和书稿的相关章节。3.应聘条件:·年龄35岁以下;·具有博士学位(含应届生);·有理工科专业背景优先;经济学、管理学等相关专业背景也可;·英语听、说、读、写流利;·在相关领域的国内外重点期刊发表过论文的申请人优先;薪酬待遇:享受清华大学非事业编制人员待遇,比照清华大学同等职位的薪酬执行。请教大咖,这类招聘是否正规呢?是与公共管理学院签合同,还是与课题组签合同呢?是否有职称的认定和区分?感谢啦~!

  • 台湾清华大学经济学教授赖建诚:为什么《共产党宣言》对英国的影响不大?

    很多人听说过《共产党宣言》(ManifestderKommunistischenPartei,译为ManifestooftheCommunistParty,或TheCommunistManifesto,马克思与恩格斯合著,1848年2月21日出版,以下简称《宣言》),但很少人知道这本100页不到的名著,有哪些主要诉求。它有十项主要目标,以下列举前五项:(1)废止土地财产权,把所有地租用在公共目的上。(2)采累进所得税。(3)废止继承权。(4)没收移居外国者和反叛者的财产。(5)把金融信用集中在国家手中,以国家资本创办国家银行,行使金融独占权。  如果我是生活在19世纪西欧的良心公民,怎么不会被《共产党宣言》吸引?  很多人看过马克思的相片,一副革命家的样子,皮肤黝黑,眼睛深陷,硕大结实,蓄着威仪逼人的大胡子。在实际生活里,他衣着散乱、举止迟钝、拘泥细节、迹近于病态的完美主义者。相对地,恩格斯是个资产阶级,高瘦貌美文雅,喜欢赛马、比剑、狩猎,曾经在威悉河(Weser)两岸间游了4趟。他风趣机敏,心智灵巧敏锐,结结巴巴地可以说20种语言。为了贯彻革命热情,他特地在无产阶级中找爱人。恩格斯只被阿拉伯语的4000种动词字根难倒,GeorgeBoyer而马克思学了20年英文,还改不掉生硬的条顿口音。恩格斯犀利而具广度,马克思睿智而具深度。  康乃尔大学的GeorgeBoyer教授,1998年发表一篇让人耳目一新的论文。(1)探讨马恩合写《宣言》时英国的经济状况,也就是说,他要重构《宣言》的经济史背景。(2)阐明马克思写作此书时,未必了解当时的产业界实况,他过度接受恩格斯对外界看法的“二手传播”;也把恩格斯在1845年出版的《英国劳工阶级的状况》,摘录到《宣言》的第一部分内。(3)重新检讨19世纪三四十年代,棉纺织业重镇曼彻斯特的经济、社会、政治情势,重估19世纪三四十年代的劳工生活状况。(4)回顾《宣言》出版后,英国经济状况的变化,说明为何《宣言》在英国没有得到劳工界的注意与支持,反而是到了20世纪10年代,才在俄国得到热烈回响。  马恩合写《宣言》时,两个人都还不到30岁。马克思因为政府关闭他所编辑的报纸,1843年从普鲁士搬到巴黎,1845年被法国驱逐出境。恩格斯当时住在巴黎,他父亲经营棉纺业,在德国与英国的曼彻斯特有分公司。1842年他们在巴黎结识,合写过两本书:TheHolyFamily(1845)和TheGermanIdeology(1846)。1847年11月,他们去伦敦参加“共产党联盟”(CommunistLeague)大会,马克思在会中大放异彩。会议结束时,有人邀约他们写一项“宣言”来陈述“联盟”的主张。马克思在1847年12月至1848年1月间写出《宣言》,2月在伦敦出版,正好赶上欧洲各地的革命热潮,但《宣言》对革命似乎没有影响。  《宣言》最广为人知的,是书内第一部分:“资产阶级与无产阶级”。两位作者描述产业资本主义的发展,预测它日后不可避免的命运。他们一开始就宣称:“所有社会的历史,就是一部阶级斗争史。”他们把资产阶级形容为“无怜悯心、赤裸裸的自私自利、无耻、直接、粗暴的剥削”。资产阶级制造了无产阶级(现代工业的劳动阶层),这些可怜的劳工,把自己一块块地卖给资本家,只有在找到工作时才能生存,而且只有在能用劳工来增加资本时,才找得到工作。  工人成为机械的附属品,像士兵一样地被组织起来。随着工人阶级生活条件的恶化,资产阶级愈来愈不适合治理社会;社会内部会产生动乱,爆发为公开的革命,推翻资产阶级,摧毁私人财产。资产阶级的所作所为,其实都是在自掘坟墓,因此:“无产阶级除了手铐和脚镣之外,没什么好损失的,他们可以赢得整个世界。世界各国的劳动者,联合起来吧!”以上是众所熟知的“思想”,现在来看当时英国产业界的“实况”。1840年时,英国成年男性劳动力中,有47.3%在产业界工作;1900年之前,西欧没有任何国家的工人比例这么高过。这47.3%的工人,并非全都在与机械、技术相关的部门工作。1861年之前,整个英国还称不上是“一座工厂”,大型的工厂很少(大都是棉纺厂);这些棉纺厂位于英国中西部兰开夏地区,集中在此区东南方的曼彻斯特。  我们从《宣言》得到的印象是:只要是劳工,就被资产阶级剥削得很悲惨。其实是《宣言》过度渲染了,大部分的工人还是在传统的小型工厂就业,真正被系统地剥削的大型棉纺厂很少,而且集中在曼彻斯特。以撰写《美国的民主》闻名的法国政治思想家托克维尔(AlexisdeTocqueville,1805~1859),1835年参观曼彻斯特与伯明翰(19世纪40年代英国的第二大工业城)。他说曼彻斯特“有一些大资本家,几千个穷苦的工人,和少数中产阶级。工厂内的工人数以千计,每个工厂有两三千人”。而伯明翰“有少数大产业,有许多小工业。工人在自己家里工作,或在小型工厂内和老板一起工作。工人看起来较健康,生活较好,较有秩序,也比较有道德”。  问题出在哪里?因为恩格斯的家族在曼彻斯特有棉纺工厂,他没在伯明翰住过,他把曼彻斯特的状况,过度一般化为全英国的普遍情形。贫困的马克思,家庭的负担那么重,根本没钱去伦敦之外的地方旅行,他对劳工阶级的知识,泰半靠恩格斯转述,或从报章杂志断章取义。革命的热情加上共产党“联盟”的委托,这两个人在30岁不到的年纪,在见闻有限的认知里,渲染了劳工阶级被剥削的惨状。外国和后世的读者,缺少第一手的实况理解,很容易就被《宣言》里的动人言辞,激起无限的情怀。  为什么恩格斯在曼彻斯特时,会观察到工人的悲惨生活?《宣言》的解释是:因为他们被资本家无情地剥削。现代的经济史学者有另一种解释:因为那时的英国正处于“19世纪40年代的饥荒”(hungry’40s)。恩格斯对曼彻斯特的悲惨印象,和托克维尔、狄更斯、查尔斯爵士、纳皮尔等人的观察类似。有人说:每个时代都有一座让人震惊的城市(theshockcity),而曼彻斯特就是19世纪40年代令人“震惊的城市”。它吸引世界各国人士来参观,把社会与政府束手无策的问题,以及富人与穷人之间的阶级问题,都浮在桌面上让大家看得一清二楚。  1841年普查128家曼彻斯特的工厂,数据显示有32%的棉花工人,在规模大于500个工人的工厂里就业。城里的街道狭窄,路面没铺设,到处是污泥、排泄物、恶心的臭味,肮脏的环境让传染病迅速散布。劳工、机械工的平均死亡年龄是17岁。相对地,在乡村地区的Ruthland,平均死亡年龄是38岁;曼彻斯特的孩童,57%在5岁之前死亡。为什么工人还要住在曼彻斯特?因为工资是Ruthland的两倍。恩格斯到曼彻斯特参观的时间,是1842年秋季,正是“饥饿的40年代”初期:英国的景气大幅下跌,棉纺业陷入困境,资本家破产。失业率在1841年时已经15%,1848年更高达186%。  虽然有社会救济,但那是杯水车薪。以1842年夏季为例,每天要供应3000人热汤(无食物),“有很多人已经到了绝对饥饿的状态”。在这种高度压力下,整个社会与工人阶级已经出现暴动的倾向。1842年8月7日,有10000名工人发动罢工,要求“合理的工作与合理的工资”。罢工者拔掉工厂的动力设备,破坏生产工具,军队介入逮捕带头者。罢工事件三个月后,也就是1842年的秋季,恩格斯才来到曼彻斯特,他所见到的是罢工后的残破景象。  现在要争辩的是:你认为这是社会性的事件,还是经济性的罢工?前面说过,工人要的是“合理的工作与合理的工资”,目的是养家糊口,属于“经济衰退型的民权运动”。恩格斯把他在曼彻斯特的见闻转告马克思,15个月后《宣言》出版时,罢工运动早已结束,气氛消失。如果《宣言》提早6年出版,说不定会有火上加油的效果。1842年大罢工时,有人预测会出现革命,但没发生,原因很明白:工人要生活,生活不下去才暴动。  《宣言》在1848年2月出版后,欧洲各地掀起了革命的浪潮:从巴黎开始,迅速传到奥地利、德国、意大利。为什么没传到英国?这是资产阶级和工人阶级明显对立的时期,是劳资斗争最好的战场,是马克思、恩格斯、共产党联盟最期盼发生革命的国家,为什么反而一片宁静?因为1848年之后不久,英国就进入19世纪五六十年代的“维多利亚繁荣期”(Victorianboom)。  1856~1873年间,英国工人每小时的生产力,每年成长13%,这项增长率直到1951~1973年间才被超越过。也就是说,《宣言》里所预测的(随着资本主义的发展,工资会下降),是错的。工人的生活水平,在这段繁荣时期大幅提高,实际工资在1851~1873年间,增加26%,在1851~1881年间增加了38%。经济好转后,工人组织全国性的工会,保障工人的福利,不必依靠国家来救助。  工人生活安定后,对斗争的兴趣就不大了;《宣言》里所预测的工人革命,也就无从发生。这项重要的历史经验告诉我们:“拼经济”是治国的首要目标,古今中外皆然。《宣言》里所传达的信息,以现代的眼光来看,显然是从一个较短的事件时间,对单一产业(棉纺)与单一城市(曼彻斯特)作了较狭隘的观察,提出过度悲观的结论(资本制度必亡),也过度高估无产阶级革命的可能性与可行性。英国经济好转后,《宣言》的两位作者仍未死心,期盼着下一波的经济危机,会再带来革命的热潮,历史显然让这两位30多岁的作者失望了。失望之余,他们转而批评劳工阶级在向资本家(压迫者)摇尾乞怜。恩格斯去世之前一年(1894)说:“我们对英国工人实在失望……他们的思想与观点,基本上是资本主义式的,他们只有实际倾向的狭隘心态。”恩格斯去世22年后,革命才在俄国发生(1917)。

AB
CD
ABCDEFGHIJKLMNOPQISTUVWXYZ