楼主: viking1111
1612 1

[Stata初级班] 数据合并 [推广有奖]

  • 2关注
  • 2粉丝

已卖:3086份资源

教授

98%

还不是VIP/贵宾

-

威望
0
论坛币
60957 个
通用积分
310.1432
学术水平
17 点
热心指数
30 点
信用等级
13 点
经验
3159 点
帖子
1272
精华
0
在线时间
1655 小时
注册时间
2006-12-22
最后登录
2025-12-21

楼主
viking1111 发表于 2011-2-13 15:33:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
连老师:       新年好,给您拜个晚年啦!
       关于数据合并,有个小问题想请教您。我的数据结构如下,我想把每个公司机构投资者的持股比例合并,以计算每家公司机构持股比例之后。不知道这个时候应该怎么调动命令,请您指教。


公司       机构投资者     持股比例
公司1      投资者a         ……
公司1      投资者b         ……
公司2      投资者c         ……
公司2      投资者d         ……
公司2      投资者e         ……
公司2      投资者f          ……
公司3      投资者b         ……



        另外,就是计算完持股比例之后,需要将这套数据(数据A)与公司财务数据(数据B)合并。可是由于有很多公司没有机构投资人,所以数据B中的样本点多于数据A。那么这个时候在合并两套数据的时候,就存在着样本点不太匹配的问题。这时我应该怎么调用命令,使得最后合并出来的数据,不丢失数据B中那些“没有机构投资者的公司”的样本点呢?

        还有就是合并另外两套数据时,只有一个变量,但是样本点交叉,也就是有些样本点只在前一套数据中出现,另一些样本点只在后一套数据中出现,不知道合并的时候怎么处理能得到全部样本点,同时使得重复的样本点对应的变量数值为两套数据中较大的一个。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据合并 机构投资者 机构投资 数据结构 怎么处理 数据合并

沙发
arlionn 在职认证  发表于 2011-2-16 11:08:44
假设保存机构投资者数据的文件为 jigou.dta,变量名称如下:
year  id  jigou  percent
其中,jigou表示你上述数据中的机构投资者a,b,c……,percent表示每个机构投资者的持股比例。

存储公司财务数据的文件为 data.dta。

为了达到你的目的,步骤如下:
1. 把 jigou 数据中同一家公司同一个年度的多个机构持股比例合并:
   bysort id year: egen percent_sum = sum(percent)
2. 去掉重复值
   duplicates drop id year, force
      drop jigou percent
3. 与财务数据合并
   merge id year 1:1 using data.dta, nogen

你先按照上述步骤执行一下,看看能否达到你的要求。如有问题,我们再行商讨。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-7 18:30