楼主: 晗小晗
7586 3

[其他] m:m merge的原理 [推广有奖]

  • 0关注
  • 2粉丝

本科生

33%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0.0133
学术水平
5 点
热心指数
5 点
信用等级
0 点
经验
276 点
帖子
25
精华
0
在线时间
120 小时
注册时间
2013-11-27
最后登录
2021-9-27

楼主
晗小晗 发表于 2017-6-19 10:21:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在使用m:m merge命令后,想要在合并过的数据库中keep if v1=v2(v1来自master库,v2来自using库),发现每次keep的样本数量都不等。

于是回到原来的库中想探究一下m:m merge的原理,是不是这样的:在保证master库中kervar个数不变的情况下,随机匹配上using库中相同keyvar的样本?

是个小问题,但想和了解的人确定一下。之前一直没太在意,这次才发现这个小现象。

非常感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge Master Aster Using keep

沙发
黃河泉 在职认证  发表于 2017-6-19 10:51:33
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。

藤椅
晗小晗 发表于 2017-6-19 10:57:55
黃河泉 发表于 2017-6-19 10:51
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。
是的,如果原理是像我说的有一定随机成分的话,那就不敢用了,造成误差的几率还是挺高的。

板凳
糖萌萌 学生认证  发表于 2022-2-24 01:00:04
黃河泉 发表于 2017-6-19 10:51
提醒一下:有 99% 以上之情况是不应该用 m:m 的(错的机会很高)。
请问老师为啥错的机会很高呢,感觉只是合并结果中有很多无法一一对应的样本,谢谢老师。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 21:02