楼主: 林葵安
568 1

[回归分析求助] 广义倾向匹配得分显示dependent variable T has negative values是咋回事啊? [推广有奖]

  • 0关注
  • 0粉丝

初中生

33%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0840
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
50 点
帖子
1
精华
0
在线时间
38 小时
注册时间
2023-12-10
最后登录
2025-2-8

楼主
林葵安 发表于 2024-1-13 20:13:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
自变量:trans_1
因变量:lnfeducation
协变量:gender married work education_f education_m lnfincome lne_mail fasset
代码:egen trans1_p25=pctile(trans1), p(25)
egen trans1_p50=pctile(trans1), p(50)
egen trans1_p75=pctile(trans1), p(75)
generate cut=trans1_p25 if trans1<=trans1_p25
replace cut=trans1_p50 if trans1>trans1_p25 & trans1<=trans1_p50
replace cut=trans1_p75 if trans1>trans1_p50 & trans1<=trans1_p75
replace cut=0.0770572 if trans1>trans1_p75
matrix tp=(10\20\30\40\50\60\70\80\90\100)
doseresponse2 gender married work education_f education_m lnfincome lne_mail fasset, outcome(lnfeducation) t(trans1) gpscore(gps) predict(t_hat) sigma(sd) cutpoints(cut) index(mean) nq_gps(4) t_transf(ln) family(bin) link(logit) dose_response(does) tpoints(tp) delta(1) reg_type_t(cubic) reg_type_gps(cubic) interaction(1) bootstrap(yes) boot_reps(200) analysis(yes) filename("gpsm1") graph("gpsm1") detail

结果:
********************************************
ESTIMATE OF THE GENERALIZED PROPENSITY SCORE
********************************************

Generalized Propensity Score

******************************************************
Algorithm to estimate the generalized propensity score
******************************************************



Estimation of the propensity score

The log transformation of the treatment variable trans1 is used

                              T
-------------------------------------------------------------
      Percentiles      Smallest
1%    -4.906392      -4.906392
5%    -4.897616      -4.906392
10%    -4.897616      -4.906392       Obs               9,297
25%    -4.490526      -4.906392       Sum of wgt.       9,297

50%    -3.668333                      Mean           -3.84712
                        Largest       Std. dev.      .6275509
75%    -3.386563      -2.563208
90%    -3.223094      -2.563208       Variance       .3938201
95%    -3.130241      -2.563208       Skewness      -.4166525
99%    -2.563208      -2.563208       Kurtosis       1.968049
dependent variable T has negative values
r(499);

end of do-file

r(499);




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Dependent Variable negative values depend

沙发
赵安豆 发表于 2024-12-24 13:08:17
广义倾向匹配得分(Generalized Propensity Score,简称GPS)是用于处理非二元处理变量的情境下评估因果效应的一种方法。当你在进行分析时,遇到 "dependent variable T has negative values" 的错误信息,这通常意味着你的因变量(在这个例子中是lnfeducation)包含了负值。

然而,在经济学或社会科学研究中,对数变换常用于处理数据的偏斜性问题或者为了使得效应解释为百分比变化。但是,取对数的前提是原始数值必须大于0,因为对数函数在零及以下是没有定义的(即ln(x) 在 x <= 0 的时候不存在)。

如果在你的因变量 lnfeducation 中出现了负值,这可能是因为原始数据中存在小于或等于1的数据点。当应用自然对数时,任何小于1的数值经过变换会得到一个负值结果。

为了解决这个问题,你有几种选择:

1. **检查数据**:首先确认你的数据是否正确编码和输入,因为可能存在数据录入错误。
2. **处理异常值**:如果发现数据中的确存在不合理的极端低值或0值,考虑这些值是由于测量误差还是真实存在的。如果是测量误差,可以进行修正;如果是真实的,则需要考虑如何处理这些情况而不歪曲结果。
3. **变换因变量**:在应用对数变换之前检查并处理小于1的数值。例如,你可以加一个较小的正偏移量(如0.1或更小)到所有的观测值上以避免负值和零问题。
4. **考虑替代分析方法**:如果数据中包含大量接近于零的观察值,可能需要重新考虑你的分析策略。有可能使用其他不涉及对数变换的方法来处理原始数据。

总之,在进行任何数据分析之前,彻底检查并理解你的数据是非常重要的,以确保所采用的统计技术适合于手头的数据和研究问题。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-17 03:21