请利用gss2004.dta 完成题目,所用到的变量包括
l 婚姻状况(marital)
l 种族(race)
l 平均每周工作时间(hrs2)以下
l 性别(sex)
l 收入(rincom98)
l 教育程度(educ)
l 社会经济指标(sei)
一、提供以下变量的描述性统计信息: (每题各5分)
1)婚姻状况(marital)的分布
2)种族(race)的分布
3)平均每周工作时间(hrs2)的中位数
4)请计算 22-60 岁的白人女性占总调查人数的百分比
二、创建以下变量,并提供相关的描述性统计信息(每题各5分)
1)创建一个变量(male),该变量代表个体是否为男性
2)创建一个变量(married),该变量代表个体是否为已婚
3)创建一个变量(yincome) , 将年收入(rincom98)进行重新编码,使得新变量中的每一个
收入类别所对应的是原来收入变量中那个收入区间段的中间值。并且把高于 11 万美元组的
定义为 15 万美元。
4)创建一个变量,将教育程度(educ)分为六组:不足高中学历 (0-8 years of school), 一
些高中学历 (9-11),高中学历(12), 一些大学(13-15), 大学学历 (16),以及大学以上学历
(17 or more).
5)请计算各种族的平均年收入
6)请根据性别,是否结婚,以及种族计算不同人群的平均年收入
三、制表(每题各 10 分)
1)建立一个教育程度(请用第二题中第 4 小题的新创立的教育程度的变量)与性别的交互
表并测试其显著性
2)通过三维表从受教育程度、男性和种族三个变量考察个人年收入情况,并确定哪个群体
收入最高,哪个最低。
四、作图(每题各 10 分)
1)做一张年龄的直方图,并区分男性与女性
2)使用柱状图展现不同教育程度的平均年收入
3)使用散点图展现个人年收入与社会经济指标(sei)之间的关系。