楼主: lzx6666
1317 2

[数据管理求助] duplicates 时出现问题 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

19%

还不是VIP/贵宾

-

威望
0
论坛币
469 个
通用积分
0.1013
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
122 点
帖子
10
精华
0
在线时间
276 小时
注册时间
2015-3-18
最后登录
2025-10-5

楼主
lzx6666 在职认证  发表于 2020-3-22 14:55:20 |AI写论文
20论坛币
不知道大家有没有出现这种情况,对于数据:首先duplicates drop X1 ,force
然后duplicates drop X2 ,force
和顺序倒过来,重新做一次,被删除的样本量总数不同。是不是因为我的数据样本量很大且小数位数太多了,顺序调整会引起duplicates识别偏差??









最佳答案

蓝色 查看完整内容

有可能 所以你的看看到底哪一种是正确的
关键词:duplicates duplicate ATE CAT ICA

沙发
蓝色 发表于 2020-3-22 14:55:21
有可能
所以你的看看到底哪一种是正确的

藤椅
lzx6666 在职认证  发表于 2020-3-22 17:45:30
蓝色 发表于 2020-3-22 15:10
有可能
所以你的看看到底哪一种是正确的
感谢您回复,没找到很好的方法看哪种是正确的,但是总的drop的数量差别不大,应该可以忽略这种差别

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 04:09