[数据软件处理] 关于赫芬达尔指数分组01变量的stata代码怎么写？ [推广有奖]

0关注
0粉丝

学前班

50%

还不是VIP/贵宾

威望: 0 级
论坛币: 10 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 70 点
帖子: 2
精华: 0
在线时间: 0 小时
注册时间: 2023-9-2
最后登录: 2023-9-2

楼主

芝士冷面 发表于 2023-9-2 19:15:56 来自手机 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

我想将各行业、年度上市公司营业收入的赫芬达尔指数HHI 从大到小排列，排名前 50%定义为行业竞争不激烈组（取值为0），排名后50%定义为行业竞争激烈组（取值为1)，请问代码怎么写呢？目前赫芬达尔指数已经匹配了自己的数据，想分竞争性企业和非竞争性企业，来分别做回归

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：赫芬达尔指数 Stata tata 赫芬达尔行业竞争

相关内容：赫芬达尔指数stata代码

相关帖子

沙发

吴小树 发表于 2023-9-2 22:28:13

假设你已经有一个名为`df`的数据框，其中包含了各行业、年度上市公司的营业收入和赫芬达尔指数（HHI）。你可以按照以下步骤来进行排名和分组：

1. 首先，对赫芬达尔指数（HHI）进行降序排列：

```python
df = df.sort_values(by='HHI', ascending=False)
```

2. 然后，计算总行数的一半，用于确定前50%和后50%的分界点：

```python
total_rows = df.shape[0]
half_rows = total_rows // 2
```

3. 根据分界点，为行业竞争不激烈组和行业竞争激烈组创建一个新的列，并赋予相应的值：

```python
df['Competition'] = 0 # 默认为0，表示行业竞争不激烈组
df.loc[df.index[:half_rows], 'Competition'] = 1 # 前50%为行业竞争激烈组，赋值为1
```

4. 最后，你可以根据需要，将数据框拆分为行业竞争不激烈组和行业竞争激烈组的子集：

```python
low_competition = df[df['Competition'] == 0]
high_competition = df[df['Competition'] == 1]
```

现在，你可以使用`low_competition`和`high_competition`进行不同组别的回归分析。请根据你的需求进一步调整代码和数据框的列名。