概述
ERA5 是由 ECMWF 为 Copernicus 气候变化服务(C3S)生产的最新型全球再分析数据集,结合了观测与模式同化技术,提供了近乎实时和历史气候与天气要素的统一、连续且物理一致的格点信息。
ERA5 的时间范围涵盖 1940 年至今(包括早期回溯扩展),主要产品为每小时更新的数据,空间分辨率为约 0.25°(大约 31 km),通常有大约 5 天的延迟;ERA5-Land 提供更高分辨率(0.1°,大约 9–10 km)的陆面要素数据。
这些数据可从 CDS(Copernicus 数据存储库)下载,常用格式为 NetCDF(
.nc
)和 GRIB(
.grib
/
.grib2
)。
数据产品与用途
reanalysis-era5-single-levels
:地面及近地面单层要素(如 2m 温度、10m 风速、海平面气压、降水、辐射和云等)。
reanalysis-era5-pressure-levels
:垂直压力层要素(如温度、风场、相对湿度和位势高度等),适用于中高空环流与动力分析。
reanalysis-era5-land
:高分辨率(0.1°)陆面要素(如土壤湿度、土壤温度、地表辐射和蒸散等),更适用于陆面水文与能量收支研究。
reanalysis-era5-single-levels-monthly-means
与
reanalysis-era5-pressure-levels-monthly-means
:月平均气候产品,适合进行气候态与趋势分析。
derived-era5-single-levels-daily-statistics
与
derived-era5-pressure-levels-daily-statistics
:日统计(如均值、最大/最小和累计等),便于气候统计和业务报表编制。
时间与空间分辨率
ERA5 单层/压力层(每小时):
- 时间分辨率:1 小时,常用时间为
。00:00, 01:00, ..., 23:00 - 空间分辨率:水平 0.25° × 0.25°,全球范围覆盖。
ERA5-Land(每小时):
- 时间分辨率:1 小时。
- 空间分辨率:水平 0.1° × 0.1°,全球陆地范围覆盖。
月平均与日统计:
- 月平均:按月份聚合(无需
参数)。day - 日统计:按日聚合,通常基于 UTC;支持
、daily_mean
、daily_min
、daily_max
等统计类型。daily_sum
坐标系统与单位说明(常见要素)
经纬度坐标:
latitude
(°N),
longitude
(°E)。
时间轴:UTC 时间,遵循 CF-Conventions;NetCDF 文件中通常表示为
time
维度(单位为 hours since 1979-01-01 等)。
单位示例:
- 2m 温度
:开尔文(K)。2m_temperature - 10m 风分量
/10m_u_component_of_wind
:米/秒(m s??)。10m_v_component_of_wind - 海平面气压
:帕斯卡(Pa,可转换为百帕 hPa)。mean_sea_level_pressure - 总降水量
:米(累积量,可转换为毫米 mm)。total_precipitation - 位势
:平方米/秒??(除以重力加速度geopotential
可得到位势高度,单位为 m)。g≈9.80665 m s??
常用变量清单(不同数据集变量名有所差异)
单层(Single Levels):
-
(2m 温度)、2m_temperature
(2m 露点温度)2m_dewpoint_temperature
、10m_u_component_of_wind
(10m 风分量)、10m_v_component_of_wind
(地面气压)surface_pressure
(海平面气压)、mean_sea_level_pressure
(总降水量)、total_precipitation
(感热通量)surface_sensible_heat_flux
、surface_net_solar_radiation
(地表净短波/长波辐射)surface_net_thermal_radiation
压力层(Pressure Levels):
-
(温度)、temperature
/u_component_of_wind
(风分量)v_component_of_wind
(相对湿度)、relative_humidity
(位势)geopotential
常用压力层:
1000, 925, 850, 700, 500, 400, 300, 250, 200, 150, 100, 70, 50, 30, 20, 10 hPa
等。
ERA5-Land(陆面):
-
(土壤体积含水量)、volumetric_soil_water_layer_1/2/...
(土壤温度)soil_temperature_level_1/2/...
、surface_solar_radiation_downwardssurface_thermal_radiation_downwards
(蒸发/蒸散,单位 m)等。evaporation
文件格式与读取
GRIB(
.grib
/
.grib2
):紧凑高效,适合多变量和大体量数据;Python 推荐使用
cfgrib
+
xarray
进行读取。
NetCDF(
.nc
):遵循 CF-Conventions,元数据丰富,易于科学计算与互操作;Python 可直接使用
xarray
/
netCDF4
。
示例(
xarray
读取):
xarray
import xarray as xr
# 读取 NetCDF
ds_nc = xr.open_dataset('era5_single_levels.nc')
# 读取 GRIB(需安装 cfgrib)
ds_grib = xr.open_dataset('era5_pressure_levels.grib', engine='cfgrib')
# 使用变量与坐标
u10 = ds_nc['10m_u_component_of_wind']
v10 = ds_nc['10m_v_component_of_wind']
下载与参数配置(CDS API)
安装与配置:
- 安装:
pip install cdsapi - 配置:在用户目录创建
,内容示例:.cdsapirc
url: https://cds.climate.copernicus.eu/api/v2
key: <uid>:<api_key>
注意事项:
时间列表禁止使用,
24:00,请选用
00:00到
23:00的时间范围;或者选取特定的时间间隔如
00:00, 06:00, 12:00, 18:00。area参数格式为
[北纬, 西经, 南纬, 东经];不设置默认为全球。
月平均产品不需要提供额外的
day参数;而日统计产品则需指定统计类型与时区/频率参数。
示例 1:ERA5 单层(逐时)
import cdsapi
?
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-single-levels',
? {
? ? ? ?'product_type': '再分析数据',
? ? ? ?'variable': [
? ? ? ? ? ?'2米温度',
? ? ? ? ? ?'10米风的U分量', '10米风的V分量',
? ? ? ? ? ?'海平面平均气压', '总降水量'
? ? ? ],
? ? ? ?'year': '2023',
? ? ? ?'month': ['01'],
? ? ? ?'day': ['15'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?# 可选区域示例:深圳及周边
? ? ? ?# 'area': [25, 110, 20, 120],
? ? ? ?'format': 'netcdf',
? }
).download('era5_single_levels_20230115.nc')
示例 2:ERA5 压力层(逐时)
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-pressure-levels',
? {
? ? ? ?'product_type': '再分析数据',
? ? ? ?'variable': ['温度', '风的U分量', '风的V分量', '地势'],
? ? ? ?'pressure_level': ['1000', '925', '850', '700', '500', '300', '200', '100'],
? ? ? ?'year': '2023',
? ? ? ?'month': ['07'],
? ? ? ?'day': ['01'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?'format': 'netcdf',
? }
).download('era5_pressure_20230701.nc')
示例 3:ERA5-Land(逐时)
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-land',
? {
? ? ? ?'variable': [
? ? ? ? ? ?'2米温度',
? ? ? ? ? ?'第一层体积土壤水分',
? ? ? ? ? ?'第一层地温',
? ? ? ? ? ?'表面净太阳辐射',
? ? ? ? ? ?'总降水量'
? ? ? ],
? ? ? ?'year': '2022',
? ? ? ?'month': ['04'],
? ? ? ?'day': ['26'],
? ? ? ?'time': ['00:00', '06:00', '12:00', '18:00'],
? ? ? ?'format': 'netcdf',
? }
).download('era5_land_20220426.nc')
示例 4:单层月平均
c = cdsapi.Client()
c.retrieve(
? ?'reanalysis-era5-single-levels-monthly-means',
? {
? ? ? ?'product_type': '逐月平均再分析数据',
? ? ? ?'variable': ['2米温度', '总降水量', '海平面平均气压'],
? ? ? ?'year': '2020',
'month': ['07'],
'时间': '00:00',
'格式': 'netcdf',
}
.download('era5_single_levels_monthly_202007.nc')
示例 5:压力层日统计(平均值)
c = cdsapi.Client()
c.retrieve(
'衍生 ERA5 压力层每日统计数据',
{
'产品类型': '再分析',
'变量': ['地势位能'],
'压力层级': ['300', '500', '700', '850'],
'年份': '2021',
'月份': ['08'],
'日期': ['15'],
'每日统计': '日平均值',
'时区': 'utc+00:00',
'频率': '6 小时一次',
'格式': 'netcdf',
}
).download('era5_pressure_daily_mean_20210815.nc')
ERA5 再分析的特点与质量控制
数据来源:多源观测(卫星、雷达、地面站点、探空等)与同化系统整合,模式基础为 ECMWF 的 IFS。
同化一致性:ERA5 提供时间与空间上一致的分析;极端天气/观测稀少区域可能存在偏差,需结合独立观察验证。
质量控制:
使用前建议检查:时间轴、缺失值(NaN)、单位与坐标系、变量属性(
standard_name、
long_name)。
大体量文件建议分块下载与分区处理;读取 GRIB 时注意
cfgrib的消息索引与筛选条件。
ERA5 与 ECMWF 预报(公开数据)的区别
ERA5:再分析产品,融合观察,代表“最佳估计”的历史/近实时大气状态;适用于回顾性分析、气候统计与再现研究。
ECMWF 预报(HRES/ENS 等):数值天气预报(未来),不整合后验观测;适合面向未来的业务与决策支持。
用途差异:ERA5 常用于训练与评估、气候再现;预报产品则用于未来风能、降水、极端天气预警等。
处理工具与最佳实践
Python:
xarray(多维数据处理)、
cfgrib(GRIB 读取)、
cartopy/
matplotlib(可视化)、
numpy/pandas(数值与表格处理)。
性能建议:
使用
chunks(dask)按时间或空间分块以提升并行输入输出与计算效率。
变量筛选下载(仅取所需变量和时间窗口),减少存储与带宽消耗。
区域裁剪(
area)优先;避免全局数据下载造成不必要的资源浪费。
数据许可与引用
许可与使用:ERA5 数据由 Copernicus 气候变化服务(C3S)提供,遵循其使用与再分发条款;参考 CDS 页面相关许可证。
推荐引用格式:
Copernicus Climate Change Service (C3S) (年份): ERA5: 第五代 ECMWF 全球气候大气再分析。Copernicus 气候变化服务气候数据存储 (CDS).
https://cds.climate.copernicus.eu
常见问题(FAQ)
Q1:下载报错
HTTPError: 400?
检查参数:时间列表不能包含
24:00;
area四元组顺序必须准确;月产品不含
day;日统计要提供
daily_statistic、
time_zone、
frequency。
网络/SSL:确认
.cdsapirc正确、网络与证书(公司代理/防火墙)允许访问
https://cds.climate.copernicus.eu。
Q2:单位不符合预期?
参阅变量的
units属性;如位势需转换为位势高度(除以
g)。降水单位为米(m),常换算为毫米(mm)。
Q3:如何选择 ERA5 与 ERA5-Land?
若需高分辨率陆面过程(土壤、水文、地表能量),优选 ERA5-Land;对于近地面风、降水等区域规模研究,ERA5 单层足矣。
Q4:压力层与单层如何选?
中高空动力与热力分析选择压力层;地面天气与业务预报评估选择单层。
附:多线程批量下载的参数迁移要点
将现有多线程下载的
dataset与
request模板替换为目标产品的参数集:
单层:移除
pressure_level、
daily_statistic;保持
time合法(不含
24:00
)。
压力层:加入
pressure_level
列表;常见层参见上文。
日统计:添加
daily_statistic
、
time_zone
、
frequency
;依据逐日循环构建任务。
月平均:移除
day
,仅保留
year/month/time
;文件命名按
YYYYMM
进行。
区域裁剪:根据需要加入
area
减少数据量与加速下载。
文件校验:下载后使用
netCDF4
/
xarray
简单开启验证变量和维度,失败则重试并记录日志。
附:《ERA5再分析地面气温数据在中国区域的适用性分析》
数据来源:
ERA5逐小时2m气温数据(0.25°×0.25°)
中国728个气象站点的日均温、日最高温和日最低温数据(1979–2019年)
中国气候区划图(8个一级气候区)
评估方法:
使用
平均绝对误差(MAE)
、
均方根误差(RMSE)
、
Pearson相关系数
对比分析不同月份、季节、气候区和海拔梯度
评价对
热浪
和
寒潮
的识别能力
1.
整体准确性
日均温
准确性最高,
日最高温
次之,
日最低温
最差。
日均温、日最高温和日最低温的MAE小于2℃的站点比例分别为:
76.37%
、
59.75%
、
41.35%
2.
空间时间差异
季节差异:
春秋季准确性高于冬夏季。
日均温在冬季误差较大,日最高温在春夏季误差较大。
气候区差异:
高原气候区
准确性最低(MAE最大,相关系数最低)。
北亚热带
准确性最高。
海拔差异:
低海拔(0–200m)
准确性最高,误差最小。
高海拔地区(>500m)误差大且变异性强。
3.
极端温度事件评估
ERA5
系统性低估
热浪和寒潮的发生频率:
热浪次数被低估
84.0%
寒潮次数被低估
31.0%
在2018年高温事件中,ERA5识别的热浪站点数比观测少
158个
。
ERA5对
日最高温偏低
、
日最低温偏高
,导致极端事件识别能力不足。
ERA5在中国地区的
日均温数据可靠性高
,适用于大多数气候分析;但在
日最高/最低温、高海拔地区、极端温度事件
方面存在显著偏差,使用时应格外谨慎,建议进行本地化校正或融合站点数据使用。
附:数据量与下载额度分析(全球/中国/常用参数)
表格:数据集大小汇总(典型范围)
产品
分辨率
变量配置
全球(GB/年)
中国(GB/年)
1979–2024全球(TB)
1979–2024中国
ERA5 单层
0.25°
常用5变量(u10,v10,t2m,d2m,tp)
40–80
1.4–2.8
1.8–3.7
64–129 GB
ERA5 压力层
0.25°
5变量×37层(u,v,t,q,z)
150–450
6–16
6.9–20.3
0.28–0.65 TB
ERA5-Land
0.1°
常用5变量
125–300
10–20
5.7–13.8
0.46–0.92 TB
ERA5 单层(全部)
0.25°
60+变量
480–960
17–34
22–44
0.8–1.6 TB
ERA5 压力层(扩展)
0.25°
15–20变量×37层
0.45–1.80 TB
16–63
20–82
0.7–2.9 TB
注:上述为GRIB压缩后的典型范围(依变量可压缩性、编码与元数据而变)。中国区域以示例
18–54°N, 73–135°E
、0.25°单层约占全球 ≈3.5%。
ps:下载实测 ERA5-Land-2024年12月全球可用地区逐小时7要素数据达到 18.16 GB,总耗时为01:09:01 ;ERA5-Land-2025年10月深圳地区(23° 113° 22° 114°)范围逐小时七要素数据大小为997.32 KB,总耗时00:11:08
以下为估算方法:
估算方法与关键参数
网格点数:
ERA5 单层/压力层(0.25°):约
721 × 1440 ≈ 1,038,240
点(全球)。
中国区域示例(18–54°N, 73–135°E,0.25°):约
145 × 249 ≈ 36,105
点(≈全球的 3.5%)。
ERA5-Land(0.1°)全球:约
1801 × 3601 ≈ 6,485,401
点;中国区域约
361 × 621 ≈ 224,181
点。
时间步:小时级每年约
8760
(不含闰年简化估算),月级约
720–744
。
原始体量(不压缩):
size_raw_GiB ≈ lat × lon × time × levels × vars × 4 / 1024^3
。
GRIB压缩系数(经验范围):
单层:约
0.25–0.45
。
压力层:约
0.10–0.30
(更易压缩但层数多)。
ERA5-Land:约
0.20–0.40
。
常用参数量级(小时级,按年)
单层(0.25°):常用5变量示例(
u10, v10, t2m, d2m, tp
)
全球:单变量约
8–16 GB/年
(GRIB),5变量约
40–80 GB/年
。
中国区域:单变量约
0.28–0.56 GB/年
,5变量约
1.4–2.8 GB/年
。
压力层(0.25°):常用5变量(
u, v, t, q, z
)× 37层
全球:约
150–450 GB/年
(取每变量全层
30–90 GB/年
的经验范围累加)。
中国区域:约
6–16 GB/年
(≈全球的 3.5%)。
ERA5-Land(0.1°):常用5变量(如
t2m, d2m, u10, v10, tp
)
全球:单变量约
25–60 GB/年
,5变量约
125–300 GB/年
。中国区域:单变量约
2–4 GB/年
,五个变量约
10–20 GB/年
。
历年来的累计量级(两种时间范围)
1979–2024(大约46年):
- 单层全球5个变量:约
;中国区域约1.8–3.7 TB
。64–129 GB - 压力层全球5个变量×37层:约
;中国区域约6.9–20.3 TB
。0.28–0.65 TB - ERA5-Land全球5个变量:约
;中国区域约5.7–13.8 TB
。0.46–0.92 TB
1940–2024(大约85年):
- 单层全球5个变量:约
;中国区域约3.4–6.8 TB
。120–240 GB - 压力层全球5个变量×37层:约
;中国区域约12.8–38.3 TB
。0.46–1.34 TB - ERA5-Land全球5个变量:约
;中国区域约10.6–25.5 TB
。0.85–1.70 TB
“所有参数”下载的量级提示(粗略)
- 单层变量数约
:全球按年约60+
(60×单变量8–16 GB),46年约480–960 GB/年
;中国区域约22–44 TB
,46年约17–34 GB/年
。0.8–1.6 TB - 压力层常用变量可达
(随项目而异):全球按年约15–20
(15–20×每变量全层30–90 GB),46年约0.45–1.80 TB/年
;中国区域约20–82 TB
,46年约16–63 GB/年
。0.7–2.9 TB
以上为经验区间,实际取决于变量可压缩性、坐标编码与元数据;建议以“月/季”为单位做一次性估算与抽样下载。
ECMWF/CDS 一次性下载额度与实践限制(经验)
- 官方机制:CDS 后端采用排队与分片调度,过大请求会被拒绝或执行时间极长;固定上限未公开。
- 实践阈值(更稳妥):
单次请求目标文件大小:
≤ 8–12 GB
较为稳定,
12–20 GB
边界易超时,
> 20 GB
高概率失败/中断。
- 字段规模(近似):
,建议单次fields ≈ 变量 × 压力层数 × 时间步 × 预报步(ERA5为0)
;超出易触发“请求过大”。≤ 2–3 万 - 并发与队列:账户并发通常受限(2–4 任务更稳妥),超限会排队或返回
;不建议短时间提交大量大请求。429 - 时段选择:大体量建议“分月/分季”,避免“全年合并”导致排队与失败。
推荐切分策略:
- 按时间(首选):月或季;闰月与长月(31天)优先单独处理。
- 按变量/层分组:将压缩相近的变量打包,层数多的变量单独下载。
- 按区域裁剪:先
裁剪再下载;全球视角仅在确需时使用。area
文件格式:优先
format='grib'
(体量更小、下载更稳),如需分析再转换 NetCDF。
失败重试:实现指数退避与断点续传;下载后做“快速校验”(能否打开、维度一致)。
快速自检与估算公式
- 原始体量:
。size_raw_GiB = 点数 × 时间步 × 层数 × 变量数 × 4 / 1024^3 - 压缩体量:
。size_grib_GB ≈ size_raw_GiB × 压缩系数(见上) - 中国区域占比:0.25°约
(示例范围);0.1°(ERA5-Land)依区域尺寸另算。≈ 3.5%
实战建议:将“单次文件体量”控制在
≤ 8–12 GB
,并以“月/季+变量分组+区域裁剪”为基本策略。
以上量级与额度为工程实践经验总结,便于规划下载任务与存储资源。若需更精细的估算,可按项目具体
area/vars/levels/time
套用估算公式,并先做1–2个月抽样验证再批量运行。
| 项目 | 建议/限制 | 说明 |
|---|---|---|
| 单次文件体量 | ≤ 8–12 GB(稳妥);12–20 GB(边界);>20 GB(高风险) | 过大易超时或被拒绝 |
| 字段规模 | ≤ 2–3 万 | 近似
|
| 并发任务 | 2–4 | 超限会排队/429 |
| 切分策略 | 分月/分季、变量/层分组、区域裁剪 | 降低单次请求规模 |
| 文件格式 | GRIB优先 | 更易压缩与下载稳定 |
| 失败处理 | 指数退避+断点续传 | 完成后快速校验维度与可读性 |


雷达卡


京公网安备 11010802022788号







