楼主: 芝士冷面
1094 1

[数据软件处理] 关于赫芬达尔指数分组01变量的stata代码怎么写? [推广有奖]

  • 0关注
  • 0粉丝

学前班

50%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
70 点
帖子
2
精华
0
在线时间
0 小时
注册时间
2023-9-2
最后登录
2023-9-2

楼主
芝士冷面 发表于 2023-9-2 19:15:56 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想将各行业、年度上市公司营业收入的赫芬达尔指数HHI 从大到小排列,排名前 50%定义为行业竞争不激烈组(取值为0),排名后50%定义为行业竞争激烈组(取值为1),请问代码怎么写呢?目前赫芬达尔指数已经匹配了自己的数据,想分竞争性企业和非竞争性企业,来分别做回归
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:赫芬达尔指数 Stata tata 赫芬达尔 行业竞争

沙发
吴小树 发表于 2023-9-2 22:28:13
假设你已经有一个名为`df`的数据框,其中包含了各行业、年度上市公司的营业收入和赫芬达尔指数(HHI)。你可以按照以下步骤来进行排名和分组:

1. 首先,对赫芬达尔指数(HHI)进行降序排列:

```python
df = df.sort_values(by='HHI', ascending=False)
```

2. 然后,计算总行数的一半,用于确定前50%和后50%的分界点:

```python
total_rows = df.shape[0]
half_rows = total_rows // 2
```

3. 根据分界点,为行业竞争不激烈组和行业竞争激烈组创建一个新的列,并赋予相应的值:

```python
df['Competition'] = 0  # 默认为0,表示行业竞争不激烈组
df.loc[df.index[:half_rows], 'Competition'] = 1  # 前50%为行业竞争激烈组,赋值为1
```

4. 最后,你可以根据需要,将数据框拆分为行业竞争不激烈组和行业竞争激烈组的子集:

```python
low_competition = df[df['Competition'] == 0]
high_competition = df[df['Competition'] == 1]
```

现在,你可以使用`low_competition`和`high_competition`进行不同组别的回归分析。请根据你的需求进一步调整代码和数据框的列名。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 13:31