10148 28

[经管数据集] python代码—wiod全球投入产出表原始数据清洗、整理 [推广有奖]

21
阿恺恺(未真实交易用户) 发表于 2023-4-24 15:49:57
你好请问这个有没有antras计算全球价值链上游度和下游度的指标代码呀?

22
Adrian的小天地(未真实交易用户) 学生认证  发表于 2023-4-26 13:17:56
阿恺恺 发表于 2023-4-24 15:49
你好请问这个有没有antras计算全球价值链上游度和下游度的指标代码呀?
那个是后续另算的,这个仅仅是第一步数据清洗

23
6217865768(真实交易用户) 发表于 2023-7-13 17:04:28
清洗完的数据直接能在R上运行吗,是R需要的格式吗?

24
Adrian的小天地(未真实交易用户) 学生认证  发表于 2023-7-13 19:53:41
6217865768 发表于 2023-7-13 17:04
清洗完的数据直接能在R上运行吗,是R需要的格式吗?
python

25
6217865768(真实交易用户) 发表于 2023-7-14 23:51:01
Adrian的小天地 发表于 2023-7-13 19:53
python
我是说清洗完的数据能在R上直接进行下一步操作吗

26
蜡笔小小熊(未真实交易用户) 发表于 2024-2-20 12:40:31
请问代码可以用来分析ADB MRIO么?

27
Adrian的小天地(未真实交易用户) 学生认证  发表于 2024-2-20 18:06:10
蜡笔小小熊 发表于 2024-2-20 12:40
请问代码可以用来分析ADB MRIO么?
可以 会改就行

28
妮筱的(未真实交易用户) 发表于 2024-8-6 15:44:25 来自手机
Adrian的小天地 发表于 2023-2-16 22:08
没有 这种有标签的表格用matlab要多难做有多难做
那该怎么处理呢

29
赵安豆(未真实交易用户) 发表于 2024-8-19 21:48:04
要清洗WIOD(World Input-Output Database)全球投入产出表的数据并使用Python进行数据处理与分析,主要步骤包括读取数据、预处理(如筛选、转化格式)、构建中间流量矩阵等。以下是一个简化版的示例代码流程,用于说明如何开始这个过程:

1. **导入必要的库**:
   ```python
   import pandas as pd
   import numpy as np
   ```

2. **读取数据**:假设原始数据以CSV格式存储。
   ```python
   # 读取一个示例文件,实际中应根据具体年份和路径调整
   def read_wiod_data(year, path):
       filename = f'{path}/WIOD_{year}_raw.csv'
       return pd.read_csv(filename)

   df_2000 = read_wiod_data(2000, 'process')  # 替换为实际的文件路径和年份
   ```

3. **数据预处理**:根据具体的数据结构,可能需要转换列名、索引或筛选出特定部分。
   ```python
   def preprocess_data(df):
       df = df.rename(columns={'Country': 'country', 'Sector': 'sector'})  # 假设原数据中有这些字段
       df.set_index(['country', 'sector'], inplace=True)
       return df

   df_2000_preprocessed = preprocess_data(df_2000)
   ```

4. **构建中间流量矩阵**:这通常涉及选择合适的区域和行业分类,以及将数据组织成矩阵形式。
   ```python
   def create_intermediate_flows_matrix(df):
       # 假设我们关注的是区域A的某行业对其他行业的流入流出情况
       intermediate_flows = df.filter(regex='x_ij')  # 这里的x_ij假设是中间流量相关列的前缀或名称
       return intermediate_flows.values

   matrix_2000 = create_intermediate_flows_matrix(df_2000_preprocessed)
   ```

5. **输出清洗后的数据**:
   ```python
   def save_processed_data(matrix, year):
       np.save(f'output/intermediate_flows_{year}.npy', matrix)

   save_processed_data(matrix_2000, 2000)
   ```

这个示例假设了特定的数据结构和处理步骤,实际上可能需要根据具体数据进行调整。例如,WIOD数据通常包括多个表(如生产、输入输出流量等),并以不同的格式提供(CSV或Excel)。你需要仔细检查原始数据的说明文档,确定哪些字段对应中间投入产出流量,并相应地修改代码。

**注:**
- 以上步骤中的函数名称和参数是示例性的,实际应用时需要根据具体的数据结构和需求进行调整。
- 确保正确处理文件路径、索引和列名等细节,以避免运行错误。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 15:41