楼主: liuqiang0704
5522 2

[问答] 请教分类变量的加权问题? [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

硕士生

64%

还不是VIP/贵宾

-

威望
0
论坛币
28 个
通用积分
34.3151
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3063 点
帖子
46
精华
0
在线时间
291 小时
注册时间
2015-8-18
最后登录
2025-6-23

楼主
liuqiang0704 发表于 2022-1-26 00:33:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大佬,有个问题困扰我好久了,假设有个数据我已经通过倾向评分逆概率加权得到了权重W,那么加权后的数据怎么转换得到?对于连续变量我直接乘以权重就可以了,但是分类变量有是0,有些是1,权重乘以0还是0.我看了一篇文献如下
没有加权前
极速截图202201260031.png
加权后
极速截图202201260032.png
加权后分类变量职业中:农民和人工其他的数据构成(就是人数)发生了改变,数据被配平了,最后还算出了不同OR值,但是文中作者没有说怎么处理分类变量的数据。
所以想请教下各位大佬,这是怎么做到的,万分感谢!!!
附件附有原文章
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分类变量 权问题 万分感谢 连续变量 怎么处理

沙发
owenqi 在职认证  学生认证  发表于 2022-1-27 04:23:31
根据我的理解,对数据本身并没有影响。无论是连续变量还是离散变量,数据本身该是多少还是多少。只是你有权重以后,使得单个样本代表的有效样本数量就不同了。
举例说,某些组,一个样本代表2个样本,某些组,一个样本代表1.2个样本。
根据你那片文章的表4,他用的是逻辑回归,那实际上就变成了加了权重的逻辑回归。从形式上来说,参数估计就从b = (X'X)^{-1}X'Y变成了b = (X'WX)^{-1}X'WY,其中W就是你的那个权重组成的矩阵。

藤椅
liuqiang0704 发表于 2022-1-27 11:10:21
owenqi 发表于 2022-1-27 04:23
根据我的理解,对数据本身并没有影响。无论是连续变量还是离散变量,数据本身该是多少还是多少。只是你有权 ...
深有启发,非常感谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-3-4 05:57