楼主: evelom
640 1

[问答] 在logistic建模里,该怎么选择样本? [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

已卖:2份资源

高中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
60 个
通用积分
0.2705
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
177 点
帖子
16
精华
0
在线时间
54 小时
注册时间
2016-8-27
最后登录
2025-10-2

楼主
evelom 发表于 2023-9-18 09:47:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有个疑问想请教大家,(我之前没接触过统计,所以描述的很外行,请见谅),
我想用几个自变量a,b,c,d去建立logistic模型,来推断桥墩会不会有影响安全的裂缝.

现在遇到问题是,
每次采样会有8组数据,在采样时,
有些桥对于自变量a,b,c,d可以采集到因变量等于1的情况

有些桥所有8组自变量都采集不到因变量等于1的情况

现在问题来了,

对于覆盖需求的桥,这八组数据中含有因变量=1的,是不是就可以直接参与建模.

对于没有覆盖需求的桥,是8组数据(不含因变量=1的组),
1.全部参与建模?
2.还是全部丢弃?
3.还是降低要求矮个子里拔将军,找到8组数据里面最接近覆盖的那个,把因变量设置为1然后加入计算.

我想知道一般情况下,采用哪种方式来采集样本?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic logisti ogistic logist logis

沙发
ereree 发表于 2023-9-27 02:08:26
涉及到样本数据中正负样本分布不均衡时,如何采集样本进行建模。我的建议是:

对于覆盖正样本(因变量=1)的桥,直接使用其数据进行建模是合理的。
对于没有覆盖正样本的桥,不要全部丢弃,可以适当留一部分作为负样本,以平衡正负样本比例。
不要将负样本人为设置为正样本,这会引入错误的样本噪声。
可以考虑过采样等方法,通过合成新样本来增加正样本数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-10 11:27