楼主: 小寻3
481 0

[图行天下] ECMWF ERA5 相关数据详解 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2018-7-6
最后登录
2018-7-6

楼主
小寻3 发表于 2025-11-18 18:59:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

概述

ERA5 是由 ECMWF 为 Copernicus 气候变化服务(C3S)生产的最新型全球再分析数据集,结合了观测与模式同化技术,提供了近乎实时和历史气候与天气要素的统一、连续且物理一致的格点信息。

ERA5 的时间范围涵盖 1940 年至今(包括早期回溯扩展),主要产品为每小时更新的数据,空间分辨率为约 0.25°(大约 31 km),通常有大约 5 天的延迟;ERA5-Land 提供更高分辨率(0.1°,大约 9–10 km)的陆面要素数据。

这些数据可从 CDS(Copernicus 数据存储库)下载,常用格式为 NetCDF(

.nc
)和 GRIB(
.grib
/
.grib2
)。

数据产品与用途

reanalysis-era5-single-levels

:地面及近地面单层要素(如 2m 温度、10m 风速、海平面气压、降水、辐射和云等)。

reanalysis-era5-pressure-levels

:垂直压力层要素(如温度、风场、相对湿度和位势高度等),适用于中高空环流与动力分析。

reanalysis-era5-land

:高分辨率(0.1°)陆面要素(如土壤湿度、土壤温度、地表辐射和蒸散等),更适用于陆面水文与能量收支研究。

reanalysis-era5-single-levels-monthly-means

reanalysis-era5-pressure-levels-monthly-means
:月平均气候产品,适合进行气候态与趋势分析。

derived-era5-single-levels-daily-statistics

derived-era5-pressure-levels-daily-statistics
:日统计(如均值、最大/最小和累计等),便于气候统计和业务报表编制。

时间与空间分辨率

ERA5 单层/压力层(每小时):

  • 时间分辨率:1 小时,常用时间为
    00:00, 01:00, ..., 23:00
  • 空间分辨率:水平 0.25° × 0.25°,全球范围覆盖。

ERA5-Land(每小时):

  • 时间分辨率:1 小时。
  • 空间分辨率:水平 0.1° × 0.1°,全球陆地范围覆盖。

月平均与日统计:

  • 月平均:按月份聚合(无需
    day
    参数)。
  • 日统计:按日聚合,通常基于 UTC;支持
    daily_mean
    daily_min
    daily_max
    daily_sum
    等统计类型。

坐标系统与单位说明(常见要素)

经纬度坐标:

latitude
(°N),
longitude
(°E)。

时间轴:UTC 时间,遵循 CF-Conventions;NetCDF 文件中通常表示为

time
维度(单位为 hours since 1979-01-01 等)。

单位示例:

  • 2m 温度
    2m_temperature
    :开尔文(K)。
  • 10m 风分量
    10m_u_component_of_wind
    /
    10m_v_component_of_wind
    :米/秒(m s??)。
  • 海平面气压
    mean_sea_level_pressure
    :帕斯卡(Pa,可转换为百帕 hPa)。
  • 总降水量
    total_precipitation
    :米(累积量,可转换为毫米 mm)。
  • 位势
    geopotential
    :平方米/秒??(除以重力加速度
    g≈9.80665 m s??
    可得到位势高度,单位为 m)。

常用变量清单(不同数据集变量名有所差异)

单层(Single Levels):

  • 2m_temperature
    (2m 温度)、
    2m_dewpoint_temperature
    (2m 露点温度)
    10m_u_component_of_wind
    10m_v_component_of_wind
    (10m 风分量)、
    surface_pressure
    (地面气压)
    mean_sea_level_pressure
    (海平面气压)、
    total_precipitation
    (总降水量)、
    surface_sensible_heat_flux
    (感热通量)
    surface_net_solar_radiation
    surface_net_thermal_radiation
    (地表净短波/长波辐射)

压力层(Pressure Levels):

  • temperature
    (温度)、
    u_component_of_wind
    /
    v_component_of_wind
    (风分量)
    relative_humidity
    (相对湿度)、
    geopotential
    (位势)

常用压力层:

1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100, 70, 50, 30, 20, 10 hPa
等。

ERA5-Land(陆面):

  • volumetric_soil_water_layer_1/2/...
    (土壤体积含水量)、
    soil_temperature_level_1/2/...
    (土壤温度)
    surface_solar_radiation_downwards
    surface_thermal_radiation_downwards
    evaporation
    (蒸发/蒸散,单位 m)等。

文件格式与读取

GRIB(

.grib
/
.grib2
):紧凑高效,适合多变量和大体量数据;Python 推荐使用
cfgrib
+
xarray
进行读取。

NetCDF(

.nc
):遵循 CF-Conventions,元数据丰富,易于科学计算与互操作;Python 可直接使用
xarray
/
netCDF4

示例(
xarray
读取):

import xarray as xr

# 读取 NetCDF
ds_nc = xr.open_dataset('era5_single_levels.nc')

# 读取 GRIB(需安装 cfgrib)
ds_grib = xr.open_dataset('era5_pressure_levels.grib', engine='cfgrib')

# 使用变量与坐标
u10 = ds_nc['10m_u_component_of_wind']
v10 = ds_nc['10m_v_component_of_wind']
    

下载与参数配置(CDS API)

安装与配置:

  • 安装:
    pip install cdsapi
  • 配置:在用户目录创建
    .cdsapirc
    ,内容示例:

url: https://cds.climate.copernicus.eu/api/v2
key: <uid>:<api_key>
注意事项:
时间列表禁止使用,

24:00

,请选用
00:00


23:00

的时间范围;或者选取特定的时间间隔如
00:00, 06:00, 12:00, 18:00

area

参数格式为
[北纬, 西经, 南纬, 东经]

;不设置默认为全球。
月平均产品不需要提供额外的
day

参数;而日统计产品则需指定统计类型与时区/频率参数。

示例 1:ERA5 单层(逐时)
import cdsapi
?
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-single-levels',
? {
? ? ? ?'product_type': '再分析数据',
? ? ? ?'variable': [
? ? ? ? ? ?'2米温度',
? ? ? ? ? ?'10米风的U分量', '10米风的V分量',
? ? ? ? ? ?'海平面平均气压', '总降水量'
? ? ? ],
? ? ? ?'year': '2023',
? ? ? ?'month': ['01'],
? ? ? ?'day': ['15'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?# 可选区域示例:深圳及周边
? ? ? ?# 'area': [25, 110, 20, 120],
? ? ? ?'format': 'netcdf',
? }
).download('era5_single_levels_20230115.nc')

示例 2:ERA5 压力层(逐时)
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-pressure-levels',
? {
? ? ? ?'product_type': '再分析数据',
? ? ? ?'variable': ['温度', '风的U分量', '风的V分量', '地势'],
? ? ? ?'pressure_level': ['1000', '925', '850', '700', '500', '300', '200', '100'],
? ? ? ?'year': '2023',
? ? ? ?'month': ['07'],
? ? ? ?'day': ['01'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?'format': 'netcdf',
? }
).download('era5_pressure_20230701.nc')

示例 3:ERA5-Land(逐时)
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-land',
? {
? ? ? ?'variable': [
? ? ? ? ? ?'2米温度',
? ? ? ? ? ?'第一层体积土壤水分',
? ? ? ? ? ?'第一层地温',
? ? ? ? ? ?'表面净太阳辐射',
? ? ? ? ? ?'总降水量'
? ? ? ],
? ? ? ?'year': '2022',
? ? ? ?'month': ['04'],
? ? ? ?'day': ['26'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?'format': 'netcdf',
? }
).download('era5_land_20220426.nc')

示例 4:单层月平均
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-single-levels-monthly-means',
? {
? ? ? ?'product_type': '逐月平均再分析数据',
? ? ? ?'variable': ['2米温度', '总降水量', '海平面平均气压'],
? ? ? ?'year': '2020',

'month': ['07'],
'时间': '00:00',
'格式': 'netcdf',
}

.download('era5_single_levels_monthly_202007.nc')

示例 5:压力层日统计(平均值)

c = cdsapi.Client()
c.retrieve(
'衍生 ERA5 压力层每日统计数据',
{
'产品类型': '再分析',
'变量': ['地势位能'],
'压力层级': ['300', '500', '700', '850'],
'年份': '2021',
'月份': ['08'],
'日期': ['15'],
'每日统计': '日平均值',
'时区': 'utc+00:00',
'频率': '6 小时一次',
'格式': 'netcdf',
}
).download('era5_pressure_daily_mean_20210815.nc')

ERA5 再分析的特点与质量控制

数据来源:多源观测(卫星、雷达、地面站点、探空等)与同化系统整合,模式基础为 ECMWF 的 IFS。

同化一致性:ERA5 提供时间与空间上一致的分析;极端天气/观测稀少区域可能存在偏差,需结合独立观察验证。

质量控制:
使用前建议检查:时间轴、缺失值(NaN)、单位与坐标系、变量属性(

standard_name


long_name

)。

大体量文件建议分块下载与分区处理;读取 GRIB 时注意

cfgrib

的消息索引与筛选条件。

ERA5 与 ECMWF 预报(公开数据)的区别

ERA5:再分析产品,融合观察,代表“最佳估计”的历史/近实时大气状态;适用于回顾性分析、气候统计与再现研究。
ECMWF 预报(HRES/ENS 等):数值天气预报(未来),不整合后验观测;适合面向未来的业务与决策支持。

用途差异:ERA5 常用于训练与评估、气候再现;预报产品则用于未来风能、降水、极端天气预警等。

处理工具与最佳实践

Python:

xarray

(多维数据处理)、
cfgrib

(GRIB 读取)、
cartopy

/
matplotlib

(可视化)、
numpy/pandas

(数值与表格处理)。

性能建议:
使用

chunks

(dask)按时间或空间分块以提升并行输入输出与计算效率。
变量筛选下载(仅取所需变量和时间窗口),减少存储与带宽消耗。
区域裁剪(
area

)优先;避免全局数据下载造成不必要的资源浪费。

数据许可与引用

许可与使用:ERA5 数据由 Copernicus 气候变化服务(C3S)提供,遵循其使用与再分发条款;参考 CDS 页面相关许可证。
推荐引用格式:
Copernicus Climate Change Service (C3S) (年份): ERA5: 第五代 ECMWF 全球气候大气再分析。Copernicus 气候变化服务气候数据存储 (CDS).
https://cds.climate.copernicus.eu

常见问题(FAQ)

Q1:下载报错

HTTPError: 400


检查参数:时间列表不能包含
24:00


area

四元组顺序必须准确;月产品不含
day

;日统计要提供
daily_statistic


time_zone


frequency

网络/SSL:确认

.cdsapirc

正确、网络与证书(公司代理/防火墙)允许访问
https://cds.climate.copernicus.eu

Q2:单位不符合预期?
参阅变量的

units

属性;如位势需转换为位势高度(除以
g

)。降水单位为米(m),常换算为毫米(mm)。

Q3:如何选择 ERA5 与 ERA5-Land?
若需高分辨率陆面过程(土壤、水文、地表能量),优选 ERA5-Land;对于近地面风、降水等区域规模研究,ERA5 单层足矣。

Q4:压力层与单层如何选?
中高空动力与热力分析选择压力层;地面天气与业务预报评估选择单层。

附:多线程批量下载的参数迁移要点
将现有多线程下载的

dataset


request

模板替换为目标产品的参数集:
单层:移除
pressure_level


daily_statistic

;保持
time

合法(不含

24:00
)。 压力层:加入
pressure_level
列表;常见层参见上文。 日统计:添加
daily_statistic
time_zone
frequency
;依据逐日循环构建任务。 月平均:移除
day
,仅保留
year/month/time
;文件命名按
YYYYMM
进行。 区域裁剪:根据需要加入
area
减少数据量与加速下载。 文件校验:下载后使用
netCDF4
/
xarray
简单开启验证变量和维度,失败则重试并记录日志。 附:《ERA5再分析地面气温数据在中国区域的适用性分析》 数据来源: ERA5逐小时2m气温数据(0.25°×0.25°) 中国728个气象站点的日均温、日最高温和日最低温数据(1979–2019年) 中国气候区划图(8个一级气候区) 评估方法: 使用 平均绝对误差(MAE) 、 均方根误差(RMSE) 、 Pearson相关系数 对比分析不同月份、季节、气候区和海拔梯度 评价对 热浪 和 寒潮 的识别能力 1. 整体准确性 日均温 准确性最高, 日最高温 次之, 日最低温 最差。 日均温、日最高温和日最低温的MAE小于2℃的站点比例分别为: 76.37% 、 59.75% 、 41.35% 2. 空间时间差异 季节差异: 春秋季准确性高于冬夏季。 日均温在冬季误差较大,日最高温在春夏季误差较大。 气候区差异: 高原气候区 准确性最低(MAE最大,相关系数最低)。 北亚热带 准确性最高。 海拔差异: 低海拔(0–200m) 准确性最高,误差最小。 高海拔地区(>500m)误差大且变异性强。 3. 极端温度事件评估 ERA5 系统性低估 热浪和寒潮的发生频率: 热浪次数被低估 84.0% 寒潮次数被低估 31.0% 在2018年高温事件中,ERA5识别的热浪站点数比观测少 158个 。 ERA5对 日最高温偏低 、 日最低温偏高 ,导致极端事件识别能力不足。 ERA5在中国地区的 日均温数据可靠性高 ,适用于大多数气候分析;但在 日最高/最低温、高海拔地区、极端温度事件 方面存在显著偏差,使用时应格外谨慎,建议进行本地化校正或融合站点数据使用。 附:数据量与下载额度分析(全球/中国/常用参数) 表格:数据集大小汇总(典型范围) 产品 分辨率 变量配置 全球(GB/年) 中国(GB/年) 1979–2024全球(TB) 1979–2024中国 ERA5 单层 0.25° 常用5变量(u10,v10,t2m,d2m,tp) 40–80 1.4–2.8 1.8–3.7 64–129 GB ERA5 压力层 0.25° 5变量×37层(u,v,t,q,z) 150–450 6–16 6.9–20.3 0.28–0.65 TB ERA5-Land 0.1° 常用5变量 125–300 10–20 5.7–13.8 0.46–0.92 TB ERA5 单层(全部) 0.25° 60+变量 480–960 17–34 22–44 0.8–1.6 TB ERA5 压力层(扩展) 0.25° 15–20变量×37层 0.45–1.80 TB 16–63 20–82 0.7–2.9 TB 注:上述为GRIB压缩后的典型范围(依变量可压缩性、编码与元数据而变)。中国区域以示例
18–54°N, 73–135°E
、0.25°单层约占全球 ≈3.5%。 ps:下载实测 ERA5-Land-2024年12月全球可用地区逐小时7要素数据达到 18.16 GB,总耗时为01:09:01 ;ERA5-Land-2025年10月深圳地区(23° 113° 22° 114°)范围逐小时七要素数据大小为997.32 KB,总耗时00:11:08 以下为估算方法: 估算方法与关键参数 网格点数: ERA5 单层/压力层(0.25°):约
721 × 1440 ≈ 1,038,240
点(全球)。 中国区域示例(18–54°N, 73–135°E,0.25°):约
145 × 249 ≈ 36,105
点(≈全球的 3.5%)。 ERA5-Land(0.1°)全球:约
1801 × 3601 ≈ 6,485,401
点;中国区域约
361 × 621 ≈ 224,181
点。 时间步:小时级每年约
8760
(不含闰年简化估算),月级约
720–744
。 原始体量(不压缩):
size_raw_GiB ≈ lat × lon × time × levels × vars × 4 / 1024^3
。 GRIB压缩系数(经验范围): 单层:约
0.25–0.45
。 压力层:约
0.10–0.30
(更易压缩但层数多)。 ERA5-Land:约
0.20–0.40
。 常用参数量级(小时级,按年) 单层(0.25°):常用5变量示例(
u10, v10, t2m, d2m, tp
) 全球:单变量约
8–16 GB/年
(GRIB),5变量约
40–80 GB/年
。 中国区域:单变量约
0.28–0.56 GB/年
,5变量约
1.4–2.8 GB/年
。 压力层(0.25°):常用5变量(
u, v, t, q, z
)× 37层 全球:约
150–450 GB/年
(取每变量全层
30–90 GB/年
的经验范围累加)。 中国区域:约
6–16 GB/年
(≈全球的 3.5%)。 ERA5-Land(0.1°):常用5变量(如
t2m, d2m, u10, v10, tp
) 全球:单变量约
25–60 GB/年
,5变量约
125–300 GB/年

中国区域:单变量约

2–4 GB/年
,五个变量约
10–20 GB/年

历年来的累计量级(两种时间范围)

1979–2024(大约46年):

  • 单层全球5个变量:约
    1.8–3.7 TB
    ;中国区域约
    64–129 GB
  • 压力层全球5个变量×37层:约
    6.9–20.3 TB
    ;中国区域约
    0.28–0.65 TB
  • ERA5-Land全球5个变量:约
    5.7–13.8 TB
    ;中国区域约
    0.46–0.92 TB

1940–2024(大约85年):

  • 单层全球5个变量:约
    3.4–6.8 TB
    ;中国区域约
    120–240 GB
  • 压力层全球5个变量×37层:约
    12.8–38.3 TB
    ;中国区域约
    0.46–1.34 TB
  • ERA5-Land全球5个变量:约
    10.6–25.5 TB
    ;中国区域约
    0.85–1.70 TB

“所有参数”下载的量级提示(粗略)

  • 单层变量数约
    60+
    :全球按年约
    480–960 GB/年
    (60×单变量8–16 GB),46年约
    22–44 TB
    ;中国区域约
    17–34 GB/年
    ,46年约
    0.8–1.6 TB
  • 压力层常用变量可达
    15–20
    (随项目而异):全球按年约
    0.45–1.80 TB/年
    (15–20×每变量全层30–90 GB),46年约
    20–82 TB
    ;中国区域约
    16–63 GB/年
    ,46年约
    0.7–2.9 TB

以上为经验区间,实际取决于变量可压缩性、坐标编码与元数据;建议以“月/季”为单位做一次性估算与抽样下载。

ECMWF/CDS 一次性下载额度与实践限制(经验)

  • 官方机制:CDS 后端采用排队与分片调度,过大请求会被拒绝或执行时间极长;固定上限未公开。
  • 实践阈值(更稳妥):

单次请求目标文件大小:

≤ 8–12 GB
较为稳定,
12–20 GB
边界易超时,
> 20 GB
高概率失败/中断。

  • 字段规模(近似):
    fields ≈ 变量 × 压力层数 × 时间步 × 预报步(ERA5为0)
    ,建议单次
    ≤ 2–3 万
    ;超出易触发“请求过大”。
  • 并发与队列:账户并发通常受限(2–4 任务更稳妥),超限会排队或返回
    429
    ;不建议短时间提交大量大请求。
  • 时段选择:大体量建议“分月/分季”,避免“全年合并”导致排队与失败。

推荐切分策略:

  • 按时间(首选):月或季;闰月与长月(31天)优先单独处理。
  • 按变量/层分组:将压缩相近的变量打包,层数多的变量单独下载。
  • 按区域裁剪:先
    area
    裁剪再下载;全球视角仅在确需时使用。

文件格式:优先

format='grib'
(体量更小、下载更稳),如需分析再转换 NetCDF。

失败重试:实现指数退避与断点续传;下载后做“快速校验”(能否打开、维度一致)。

快速自检与估算公式

  • 原始体量:
    size_raw_GiB = 点数 × 时间步 × 层数 × 变量数 × 4 / 1024^3
  • 压缩体量:
    size_grib_GB ≈ size_raw_GiB × 压缩系数(见上)
  • 中国区域占比:0.25°约
    ≈ 3.5%
    (示例范围);0.1°(ERA5-Land)依区域尺寸另算。

实战建议:将“单次文件体量”控制在

≤ 8–12 GB
,并以“月/季+变量分组+区域裁剪”为基本策略。

以上量级与额度为工程实践经验总结,便于规划下载任务与存储资源。若需更精细的估算,可按项目具体

area/vars/levels/time
套用估算公式,并先做1–2个月抽样验证再批量运行。

项目 建议/限制 说明
单次文件体量 ≤ 8–12 GB(稳妥);12–20 GB(边界);>20 GB(高风险) 过大易超时或被拒绝
字段规模 ≤ 2–3 万 近似
变量×层数×时间步
并发任务 2–4 超限会排队/429
切分策略 分月/分季、变量/层分组、区域裁剪 降低单次请求规模
文件格式 GRIB优先 更易压缩与下载稳定
失败处理 指数退避+断点续传 完成后快速校验维度与可读性
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相关数据 ecm Era 关数据 Statistics

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 13:18