求前辈指教!不胜感激。
选取dataset的一部分
mainID ID1 ID2 ID3 ID4
1000 1017 1027 1021 1010
1000 2109 2013 1001 1002
1000 1013 1021 1051 1799
1000 1280 1278 1369 1928
1000 7832 2178 1279 1276
1001 1928 1932 1652 3827
1001 1927 1587 8172 9172
1001 1979 9731 9179 7382
1001 1972 8723 7632 8372
1001 2981 9128 9217 3917
1002 1292 9132 7382 8328
1002 9170 9312 7398 9371
1002 9372 7483 8327 4928
1002 8362 9837 7436 8327
1002 3091 3028 3108 3208
大概 总共是9千个ID,从1000到9999。每一行表示mainID和 ID1 ID2 ID3 ID4合作过。要计算的是每一行中的mainID分别和 ID1 ID2 ID3 ID4在整个dataset中的合作次数tie1 tie2 tie3 tie4。
例如对第一行,要求的tie1就是mainID 1000和ID1 1017两者在整个dataset中出现于同一行的次数,记为tie1。



雷达卡




京公网安备 11010802022788号







