如何构建融合静态特征与时间序列的RNN（LSTM/GRU）预测模型

阿华AIGC实验室

2026-5-7

如何构建融合动态时间序列特征与静态特征的RNN模型（LSTM/GRU）

嗨，我明白你现在在做多口水井累计产水量预测的任务，需要把随时间变化的动态特征（产水速率、泵速）和固定不变的静态特征（井深、经纬度、含水层厚度）一起喂进RNN类模型里。其实这个需求在时序预测中挺常见的，下面我结合你的数据场景，给你分享几种实用的实现思路：

方法1：把静态特征重复拼接至每个时间步的动态特征中

这是最直观的做法——既然RNN处理的是每个时间步的特征向量，那我们就把静态特征复制成和时间序列长度一致的维度，然后和每个时间步的动态特征拼在一起，让模型在每一步都能看到静态特征的信息。

拿你提供的井#1数据举例：动态特征每个时间步是[产水速率, 泵速]（2维），静态特征是[井深, 经度, 纬度, 含水层厚度]（4维），那每个时间步的输入就变成[产水速率, 泵速, 100, x1, y1, 3]（6维），再把整个序列喂给LSTM/GRU。

用Keras实现的伪代码如下：

import tensorflow as tf
from tensorflow.keras.layers import LSTM, Dense, Input

# 动态序列输入：(样本数, 时间步长, 动态特征数) → 比如单井5天数据就是(1, 5, 2)
dynamic_input = Input(shape=(None, 2))
# 静态特征输入：(样本数, 静态特征数) → 单井就是(1, 4)
static_input = Input(shape=(4,))

# 将静态特征重复至与时间序列长度一致
static_repeated = tf.tile(tf.expand_dims(static_input, axis=1), [1, tf.shape(dynamic_input)[1], 1])
# 拼接动态特征与重复后的静态特征
combined_input = tf.concat([dynamic_input, static_repeated], axis=-1)

# 构建LSTM层并输出预测结果
lstm_out = LSTM(64)(combined_input)
output = Dense(1)(lstm_out)  # 预测累计产水量

model = tf.keras.Model(inputs=[dynamic_input, static_input], outputs=output)
model.compile(optimizer='adam', loss='mse')

这种方法的优势是简单易实现，适合静态特征对每个时间步的序列变化都有影响的场景（比如井深会影响每天的抽水效率）。

方法2：静态特征单独编码后，与RNN的全局输出拼接

如果静态特征更偏向全局调节因子（比如井深影响的是最终产水量的基线，而非每天的产水速率波动），那可以让RNN先处理动态序列得到全局编码，再把静态特征经过全连接层提取信息后，和RNN的输出拼接，最后做预测。

实现思路：

动态特征走LSTM/GRU，提取序列的全局信息（比如取最后一个时间步的隐藏状态）
静态特征通过1-2层全连接层，得到压缩后的特征编码
拼接两个编码向量，再经过全连接层输出预测值

伪代码示例：

dynamic_input = Input(shape=(None, 2))
static_input = Input(shape=(4,))

# 处理动态序列，取最后一个时间步的输出作为全局编码
lstm_out = LSTM(64, return_state=False)(dynamic_input)

# 编码静态特征
static_encoded = Dense(32, activation='relu')(static_input)
static_encoded = Dense(16, activation='relu')(static_encoded)

# 拼接两个编码并输出预测
combined = tf.concat([lstm_out, static_encoded], axis=-1)
output = Dense(1)(combined)

model = tf.keras.Model(inputs=[dynamic_input, static_input], outputs=output)
model.compile(optimizer='adam', loss='mse')

方法3：将静态特征作为RNN的初始隐藏状态

还有一种更“深入”的思路：把静态特征编码后，作为LSTM/GRU的初始隐藏状态（h0和c0），让静态特征从序列处理的第一步就成为模型的“初始记忆”，引导后续的时序学习。

这种方式适合静态特征决定序列整体趋势的场景（比如含水层厚度直接影响水井的长期产水能力），伪代码如下：

dynamic_input = Input(shape=(None, 2))
static_input = Input(shape=(4,))

# 将静态特征编码为与LSTM单元数一致的维度
static_encoded = Dense(64)(static_input)  # LSTM单元数设为64，所以输出维度为64
h0 = static_encoded
c0 = static_encoded  # 也可以用两个独立的Dense层分别编码h0和c0，增加灵活性

# 传入初始状态到LSTM
lstm_out = LSTM(64)(dynamic_input, initial_state=[h0, c0])
output = Dense(1)(lstm_out)

model = tf.keras.Model(inputs=[dynamic_input, static_input], outputs=output)
model.compile(optimizer='adam', loss='mse')

针对你任务的小提示

数据预处理：动态特征（产水速率、泵速）和静态特征（井深、含水层厚度）都要做归一化处理（比如缩放到0-1区间或标准正态分布），避免特征尺度差异导致模型训练不稳定。
多井数据处理：如果你的数据集包含多口水井，注意不同井的序列长度可能不同，可以用padding补全，或者按井分组进行批量训练。
模型选型建议：可以先从方法1入手，它的实现成本最低，容易验证效果；如果效果不理想，再尝试方法2或3，对比不同融合方式的性能差异。

内容的提问来源于stack exchange，提问作者Ali Wali