楼主: 虎虎856
4143 0

成年人数据集,涵盖信息:年龄、工作类别、教育程度、职业、性别、种族等 [推广有奖]

已卖:44112份资源

院士

34%

还不是VIP/贵宾

-

TA的文库  其他...

细微整理

威望
1
论坛币
30242 个
通用积分
2227.0923
学术水平
212 点
热心指数
275 点
信用等级
174 点
经验
58013 点
帖子
1751
精华
4
在线时间
1286 小时
注册时间
2017-2-10
最后登录
2026-1-10

楼主
虎虎856 在职认证  发表于 2019-12-27 09:48:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要:根据人口普查数据预测收入是否超过$ 50K /年。也称为“普查收入”数据集。

Data Folder.zip (652.04 KB, 需要: 5 个论坛币) 本附件包括:
  • adult.data
  • adult.names
  • adult.test
  • Index
  • old.adult.names


Data Set Characteristics:  

Multivariate

Number of Instances:

48842

Area:

Social

Attribute Characteristics:

Categorical, Integer

Number of Attributes:

14

Date Donated

1996-05-01

Associated Tasks:

Classification

Missing Values?

Yes



来源:
Ronny Kohavi和Barry Becker

数据集信息:

提取是由Barry Becker从1994年人口普查数据库中进行的。使用以下条件提取了一组合理的干净记录:((AAGE> 16)&&(AGI> 100)&&(AFNLWGT> 1)&&(HRSWK> 0))

预测任务是确定一个人的年收入是否超过50K年。


属性信息:


属性列表:

> 50K,<= 50K。

年龄:连续。
工作类别:私人,自营非收入,自营收入,联邦政府,地方政府,州政府,无薪,从未工作过。
序号:连续。
教育程度:学士,部分大学,11年级,高中毕业生,教授学校,Assoc-acdm,Assoc-voc,9、7-8-8、12,硕士,1-4至10,博士学位,5-6至学前班。
教育人数:连续。
婚姻状况:已婚公民配偶,离婚,未婚,分居,丧偶,已婚配偶缺席,已婚AF配偶。
职业:技术支持,工艺修理,其他服务,销售,行政管理,专业教授,搬运清洁工,机器操作检查,行政助理,农家捕鱼,运输移动,私人住宅serv,保护serv,武装部队。
关系:妻子,独生子女,丈夫,亲戚,其他亲戚,未婚。
种族:白色,亚洲人-帕斯岛,亚洲印第安人-爱斯基摩人,其他,黑人。
性别:女,男。
资本收益:连续。
资本损失:连续。
每周小时:连续。
国籍:美国,柬埔寨,英国,波多黎各,加拿大,德国,美国外围地区(关岛-USVI等),印度,日本,希腊,南美,中国,古巴,伊朗,洪都拉斯,菲律宾,意大利,波兰,牙买加,越南,墨西哥,葡萄牙,爱尔兰,法国,多米尼加共和国,老挝,厄瓜多尔,台湾,海地,哥伦比亚,匈牙利,危地马拉,尼加拉瓜,苏格兰,泰国,南斯拉夫,萨尔瓦多,特立尼达和多巴哥,秘鲁,洪,荷兰霍兰。


相关论文:

Ron Kohavi, "Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid", Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, 1996



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


本帖被以下文库推荐

11

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 16:59