cheetahfly 发表于 2017-7-28 14:37
# 实践中,请自己编写一个人名和组名对应的dataframe
# 比如names_teams
# 该df只包含两列sales和team,一一对应,不要重复
这里我不太明白呢,team这个变量本身是没有的也是麻烦点所在,如果要自己创建一个人名和组名对应的dataframe,像这样?
dat$team[dat$sales=="A1"]=1
dat$team[dat$sales=="A2"]=1
dat$team[dat$sales=="A3"]=1
dat$team[dat$sales=="B1"]=2
dat$team[dat$sales=="B2"]=2
dat$team[dat$sales=="B3"]=2
dat$team[dat$sales=="B4"]=2
dat$team[dat$sales=="C1"]=3
dat$team[dat$sales=="C2"]=3
dat$team[dat$sales=="C3"]=3
dat$team[dat$sales=="D1"]=4
dat$team[dat$sales=="D2"]=4
dat$team[dat$sales=="D3"]=4
dat$team[dat$sales=="E1"]=5
dat$team[dat$sales=="E2"]=5
dat$team[dat$sales=="E3"]=5
dat$team[dat$sales=="F1"]=6
dat$team[dat$sales=="F2"]=6
dat$team[dat$sales=="F3"]=6
dat$team[dat$sales=="F4"]=6
dat$team=factor(dat$team)
names_teams=data.frame(sales=dat$sales,team=dat$team)
这是我精简过的数据:35条观测,6个team,每个team有3或4个sales。
试想一下如果有上万条的观测,20个team,每team有10个sales,按我的理解,创建自己创建一个人名和组名对应的dataframe就不现实了。