使用copernicusmarine.open_dataset处理数据后，调用to_netcdf保存NetCDF文件时进程卡顿的技术求助

阿华AIGC实验室

2026-4-27

解决Copernicus Marine数据导出NetCDF卡顿问题

我之前处理Copernicus海洋数据时也碰到过类似的to_netcdf写入卡顿甚至挂起的情况，结合你的代码场景，下面是几个实用的排查和解决思路：

1. 优先排查内存压力问题

你的代码计算了20年日数据的时间平均，虽然只取了表层，但0.125°分辨率的区域（20°经度×40°纬度）大概有 (20/0.125)×(40/0.125) = 160×320 = 51200个网格点，看起来数据量不大，但如果xarray在内存中加载了完整的原始数据集（即使是延迟加载，计算mean时可能会一次性把数据读入内存），还是可能造成内存瓶颈，尤其是如果你的服务器内存资源有限的话。

解决办法：

优化数据分块：在open_dataset时显式指定分块参数，让dask可以分块计算和写入，避免一次性加载全量数据：

dataset_zo_93_12 = copernicusmarine.open_dataset(
    dataset_id="cmems_obs-mob_glo_phy_my_0.125deg_P1D-m",
    variables=["zo"],
    start_datetime="1993-01-01",
    end_datetime="2012-12-31",
    minimum_longitude=min_lon,
    maximum_longitude=max_lon,
    minimum_latitude=min_lat,
    maximum_latitude=max_lat,
    chunks={"time": 365}  # 按年分块，减少单块数据量
)

降低数据精度：将结果从float64转换为float32，可以减少一半的数据体积，大幅提升写入速度：
```
mss = surface_ssh.mean(dim='time').astype('float32')
```
监控内存使用：用系统工具（比如top、htop）或者Python的memory_profiler库，确认写入时内存是否被占满。如果内存不足，考虑缩小时间范围先做测试，或者增加服务器内存。

2. 检查目标文件系统的IO性能

你的输出路径是/data_copernicus/，如果这是一个网络存储（NFS、SMB等），写入速度会远慢于本地磁盘，容易出现卡顿。

解决办法：

先将文件写入本地临时目录（比如/tmp/），确认写入正常后再复制到目标路径：

temp_output = "/tmp/zo_1993_2012_pso_0125deg.nc"
mss.to_netcdf(temp_output)
# 复制到目标目录
import shutil
shutil.copy(temp_output, output_path)
os.remove(temp_output)

用dd命令测试目标磁盘的写入速度，确认是否是IO瓶颈：

dd if=/dev/zero of=/data_copernicus/test_write_speed bs=1G count=1 oflag=direct

3. 优化xarray/dask的写入配置

默认的xarray写入配置可能没有充分利用并行资源，或者存在线程/进程冲突的问题。

解决办法：

显式指定dask的调度器，比如用线程调度器（适合IO密集型任务）：

import dask
with dask.config.set(scheduler='threads'):
    mss.to_netcdf(output_path)

检查目标文件是否被其他进程锁定：如果之前的写入失败导致文件残留，可能会被系统锁定，先删除目标文件再重新尝试。

4. 先做小范围测试验证

先缩小时间范围（比如只取1年的数据），看是否能正常写入，排除数据量过大的问题：

dataset_zo_test = copernicusmarine.open_dataset(
    dataset_id="cmems_obs-mob_glo_phy_my_0.125deg_P1D-m",
    variables=["zo"],
    start_datetime="1993-01-01",
    end_datetime="1993-12-31",  # 只取1年数据测试
    minimum_longitude=min_lon,
    maximum_longitude=max_lon,
    minimum_latitude=min_lat,
    maximum_latitude=max_lat
)
surface_ssh_test = dataset_zo_test.zo.isel(depth=0)
mss_test = surface_ssh_test.mean(dim='time').astype('float32')
mss_test.to_netcdf("/tmp/test_mss.nc")

如果小范围数据能正常写入，说明问题确实出在全量数据的内存或IO上，再针对性优化。

内容的提问来源于stack exchange，提问作者Eric Sánche