连老师: 新年好,给您拜个晚年啦!
关于数据合并,有个小问题想请教您。我的数据结构如下,我想把每个公司机构投资者的持股比例合并,以计算每家公司机构持股比例之后。不知道这个时候应该怎么调动命令,请您指教。
公司 机构投资者 持股比例
公司1 投资者a ……
公司1 投资者b ……
公司2 投资者c ……
公司2 投资者d ……
公司2 投资者e ……
公司2 投资者f ……
公司3 投资者b ……
另外,就是计算完持股比例之后,需要将这套数据(数据A)与公司财务数据(数据B)合并。可是由于有很多公司没有机构投资人,所以数据B中的样本点多于数据A。那么这个时候在合并两套数据的时候,就存在着样本点不太匹配的问题。这时我应该怎么调用命令,使得最后合并出来的数据,不丢失数据B中那些“没有机构投资者的公司”的样本点呢?
还有就是合并另外两套数据时,只有一个变量,但是样本点交叉,也就是有些样本点只在前一套数据中出现,另一些样本点只在后一套数据中出现,不知道合并的时候怎么处理能得到全部样本点,同时使得重复的样本点对应的变量数值为两套数据中较大的一个。


雷达卡





京公网安备 11010802022788号







