如何匹配同采样点同日期不同行的环境监测变量？

阿华AIGC实验室

2026-5-14

嘿，这个场景太常见了——你现在手里的是长格式（long format）的环境观测数据，要转成宽格式（wide format），把同一采样点、同一时间的不同变量合并到同一行。20万行数据不算小，我给你两个实用方案，分别对应代码党和可视化操作党：

方案1：用Python Pandas处理（推荐大数据量）

Pandas处理这种格式转换效率极高，20万行完全不在话下，步骤如下：

导入库并读取数据
假设你的数据是CSV格式（Excel或其他格式也类似），先读入数据：
```
import pandas as pd

# 替换成你的数据文件路径
df = pd.read_csv("environment_data.csv")
```

执行格式转换
使用pivot_table方法，它会自动帮你按采样点和时间分组，把不同的Measurement转成列，同时处理可能的重复值（比如同一时间同一采样点同一变量有多个观测值）：

# 转换格式：以采样点和时间为索引，Measurement为列，value为值，重复值取平均值
wide_df = df.pivot_table(
    index=["Sampling Point", "Date and Time"],
    columns="Measurement",
    values="value",
    aggfunc="mean"  # 可根据需求替换成"first"（取第一个值）、"last"（取最后一个值）
).reset_index()

# 重命名列名，匹配你的期望格式
wide_df.rename(columns={
    "temperature": "Temperature",
    "turbidity": "Turbidity",
    "water flow": "Flow"
}, inplace=True)

保存结果
把转换好的宽格式数据导出到文件：

wide_df.to_csv("wide_format_environment_data.csv", index=False)

方案2：用Excel Power Query处理（无需写代码）

如果不想碰代码，Excel的Power Query工具也能轻松搞定大数据量的格式转换：

打开你的Excel数据，选中数据区域，点击数据选项卡 → 从表格/区域（旧版Excel是“获取和转换数据”组里的“自表格”），进入Power Query编辑器。
选中Sampling Point和Date and Time两列，右键点击 → 透视列。
在弹出的窗口中：
- 值列选择value；
- 高级选项里选择合适的聚合函数（比如“平均值”，或者“保留第一个值”，根据你的数据情况选）；
- 点击确定。
此时你会看到变量已经转成列了，可按需重命名列名（比如把temperature改成Temperature），最后点击关闭并上载，宽格式的数据就会出现在新的工作表里。