楼主: masaru
3318 18

[数据管理求助] 菜鸟求助,为什么回归时no observations [推广有奖]

  • 0关注
  • 0粉丝

高中生

27%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
92 点
帖子
16
精华
0
在线时间
37 小时
注册时间
2020-7-26
最后登录
2023-10-10

楼主
masaru 发表于 2021-6-25 21:52:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

课程论文,缺失值的原因吗?数据很大如果有缺失值应该怎么处理,试着删掉回归可还是会这样

因变量:幼儿园类型选择:(变量s2004:1为没有上过幼儿园;2为公办园;3为民办园;4为未注册幼儿园)


自变量:家庭社会经济背景:

1.家庭总收入(变量 total_income)

2.3.母亲受教育程度(变量a2032_1)

4.父亲受教育程度(变量a2032_2)

5.家庭成员文化程度(变量a2012)

其他控制变量:性别(变量a2003:1:男,2:女)、户口类型(变量a2022)

数据处理:

  因变量处理:关于概念界定上,因变量的幼儿园类型中,没有上过幼儿园的概念即儿童未接受学前教育,为注册幼儿园为儿童上的是未注册幼儿园,即不具备办园条件的非正式幼儿园。数据处理上,将1.没有上过幼儿园排除,4.未注册幼儿园样本数为22,同样排除。生成新的虚拟变量“选择上公办园”和“选择上民办园”。



do文件是这样:use ind2017_20191202_version131.dta //使用ind2017数据集
merge m:1 hhid_2017 using hh2017_20191120_version13.dta //将hh2017数据集横向合并
save ind2017_20191202_version132.dta //保存合并后文件
use "/Users/masaru/Desktop/ind2017_20191202_version132.dta" //使用合并后的数据集
summarize //观察数据情况
codebook //观察变量缺失值
gen intotal_income=log(total_income) //对自变量家庭总收入进行取对数处理
gen std_s2004=r(std) //对因变量幼儿园类型进行标准化处理
gen std_a2032_1=r(std)
gen std_a2032_2=r(std)
gen std_a2012=r(std)
xi i.s2004 //对因变量进行虚拟变量分组

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:observations observation observat tions ATION

沙发
wdlbcj 学生认证  发表于 2021-6-25 22:10:37
这个还是贴一下你核心变量的描述性统计 或者是原始数据的截图吧,和你的code没什么关系。

可能的原因可能还是在于数据中有大量缺失值,可能是设置的问题

藤椅
masaru 发表于 2021-6-25 22:22:10
reg 因变量的话,a20332_2就开始显示

板凳
masaru 发表于 2021-6-26 10:46:55
wdlbcj 发表于 2021-6-25 22:10
这个还是贴一下你核心变量的描述性统计 或者是原始数据的截图吧,和你的code没什么关系。

可能的原因可 ...
对,缺失值应该怎么处理呀,里面差不多几万个缺失

报纸
wdlbcj 学生认证  发表于 2021-6-26 13:48:15
masaru 发表于 2021-6-26 10:46
对,缺失值应该怎么处理呀,里面差不多几万个缺失
要明确缺失值的原因,根据具体情况来看。考虑是删除还是做其他的处理

地板
masaru 发表于 2021-6-26 15:14:49
wdlbcj 发表于 2021-6-26 13:48
要明确缺失值的原因,根据具体情况来看。考虑是删除还是做其他的处理
不好意思。。我水平有限谢谢您耐心回答,我发一下变量说明能否再耽误一些您时间帮我解答呢

7
masaru 发表于 2021-6-26 15:56:31
使用的数据是全样本数据,hhid是代表家庭部分数据,ind是个人部分
我知道了问题所在但不知道如何具体操作。问题是我筛选的变量是不同受访者类型,也就是ind是全样本,不止学生本人,还问了家庭其他成员。。
必须把家庭里的学生挑出来,一个家庭只问一人。。
问卷中变量说明:
a2012家庭成员文化程度 (仅询问16岁及以上家庭成员)
逐一询问受访户 0-6 岁家庭成员(0<age<=72)
[S2004]  CAPI 加载姓名】目前在上什么类型的幼儿园? 1.没有上幼儿园
  • 2.公办园【跳至 S2007a
    3.民办园【跳至 S2007a
    4.未注册幼儿园【跳至 S2007a
    CAPI:若 S2004=1,0-3 岁家庭成员结束教育问卷,3-6 岁家庭成员继
    续询问 S2005;
    S2004=234,跳至 S2007aS2004=dk/rf,跳至 S2020

    [A2001] CAPI 加载姓名】是您的什么人?


    1. 本人
    2. 配偶或伴侣
    3. 父母
    4. 岳父母/公婆
    5. 祖父母/外祖父母 6. 子女
    CAPI:
    #1

    7. 儿媳/女婿 8. 孙子/孙女 9. 孙媳/孙女婿
    10. 兄弟姐妹
    7777. 其他(请注明)_____


    每户家庭必有且只有一名家庭成员 A2001=1,若没有,提示访员:家庭成员中没有受访者本人, (老访户)请返回 A1106/(新访户)请返回 A2000a,重新确认家庭成员;若超过一名,提示访 员:前面已记录了受访者本人,请返回第一位家庭成员(老访户)A2001/(新访户)A2002,重 新确认受访者。 最多仅有一名家庭成员A2001=2,否则提示访员:前面已记录了受访者配偶,请返回第一位家 庭成员(老访户)A2001/(新访户)A2002,重新确认受访者。


    #2
    #3
    #4
    不设置“不知道”及“拒答”选项
    [A2003] CAPI 加载姓名】的性别?(仅询问 2017 年新增受访户) 1. 2.
    CAPI:

    • #1  [(A2001=1 and A2003=1)& (A2001=2 and A2003=1)] 或者 [(A2001=1 and A2003=2)&
      (A2001=2 and A2003=2)] 出现时,提示“受访者及其配偶为同性,请核查性别信息!”
    • #2  不设置“不知道”及“拒答”选项

      [A2022] 访员注意:若家庭成员没有户口,请选“其他”,并注明“无户口”。
      目前,【CAPI 加载姓名】的户口类型是?
      1. 农业【跳至 A2022ha3. 统一居民户口
      2. 非农业【跳至 A2022a7777. 其他【跳至 A2022ha
      名词解释: 统一居民户口:指的是有些地方实行户口制度改革后,不再区分农业与非农业户口,而是统一为 “居民户口”。

      CAPI:追踪受访户原家庭成员 2015 /2013 A2022=3,则直接加载答案为 3,不再询问此题。











CAPI:
#1 [A2032]-[A2035]仅询问新受访户
#2 仅在受访者A20051957且家庭成员中缺失父亲或母亲时询问,缺失父亲或母亲
时询问逻辑如下:
A2001 选项中没有选项 3,家庭成员中没有父母,则分别询问父亲和母亲
A2001 只有 1 个选项 3 且对应的 A2003=1,家庭成员中没有母亲,则询问受访者母亲 若 A2001 只有 1 个选项 3 且对应的 A2003=2,家庭成员中没有父亲,则询问受访者父亲
询问母亲时:访员读出:下面我们想了解一下您母亲的一些情况。 询问父亲时:访员读出:下面我们想了解一下您父亲的一些情况。
a2032_1 母亲受教育程度
[size=14.666666984558105px]a2032_2父亲受教育程度


[size=14.666666984558105px]由于我是来华留学生。。看着有点绕,请问有朋友可以热心解答一下吗?可能没有什么奖励,祝一天愉快




8
masaru 发表于 2021-6-28 13:05:39
求助呜呜呜呜

9
zdlspace 学生认证  发表于 2021-6-28 13:32:06
masaru 发表于 2021-6-28 13:05
求助呜呜呜呜
贴一下原始数据

10
masaru 发表于 2021-6-28 16:54:33
原始数据应该怎么筛选出学生层面呢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-21 13:50