如何使用LSTM预测训练数据范围外的数值？附训练示例代码

免费开始使用

如何使用LSTM预测训练数据范围外的数值？附训练示例代码

阿华AIGC实验室

2026-5-20

如何用LSTM预测训练数据范围外的序列值

嘿，看起来你正在用LSTM做一个简单的序列预测任务——用5个连续的归一化数字预测下一个，现在想突破训练数据的范围做预测对吧？我来一步步帮你解决这个问题。

1. 补全并优化基础训练代码

你的代码片段没写完，下面是可运行的完整版本，我做了几个小调整让模型更稳定：

from keras.models import Sequential
from keras.layers import LSTM, Dense
from sklearn.model_selection import train_test_split
import numpy as np
import matplotlib.pyplot as plt

# 生成训练数据：输入是5个连续归一化数，标签是下一个数
xs = [[[(j+i)/100] for j in range(5)] for i in range(100)]
ys = [(i+5)/100 for i in range(100)]

# 转换成Keras需要的numpy数组格式
xs = np.array(xs)
ys = np.array(ys)

# 拆分训练测试集，加个random_state保证结果可复现
x_train, x_test, y_train, y_test = train_test_split(xs, ys, test_size=0.2, random_state=42)

# 构建模型：把LSTM单元数改成8（比1个更稳定，能更好捕捉趋势），去掉return_sequences=True（因为我们是单步预测）
model = Sequential()
model.add(LSTM(8, input_shape=(5, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')

# 训练模型
history = model.fit(x_train, y_train, epochs=50, batch_size=4, validation_data=(x_test, y_test))

# 可视化训练损失，确认模型在学习
plt.plot(history.history['loss'], label='训练损失')
plt.plot(history.history['val_loss'], label='验证损失')
plt.legend()
plt.show()

2. 预测超出训练范围数值的两种实用方法

方法1：直接输入超出范围的单条序列

因为你的序列是固定步长线性递增的，只要模型学到了"下一个数比最后一个输入大0.01"的规律，就能直接预测训练范围外的值。比如我们构造一个训练数据里没有的输入：

# 构造超出训练范围的输入：比如[1.00, 1.01, 1.02, 1.03, 1.04]
test_input = np.array([[[1.00], [1.01], [1.02], [1.03], [1.04]]])
predicted_value = model.predict(test_input)
print(f"预测的下一个数值：{predicted_value[0][0]:.4f}")  # 正常情况下会接近1.05

方法2：迭代生成连续的超出范围序列

如果想生成更长的超出范围序列（比如从训练数据的最后一个序列开始，连续预测10个值），可以用迭代预测的方式：

# 取训练数据的最后一个序列作为起始点（对应输入[0.95, 0.96, 0.97, 0.98, 0.99]）
last_sequence = xs[-1]
predicted_sequence = []

# 连续预测10个超出范围的值
for _ in range(10):
    # 预测下一个值
    next_val = model.predict(last_sequence.reshape(1, 5, 1), verbose=0)[0][0]
    predicted_sequence.append(next_val)
    # 更新序列：去掉最前面的旧值，加入刚预测的新值，作为下一次预测的输入
    last_sequence = np.concatenate([last_sequence[1:], [[next_val]]])

# 打印结果，应该会是1.00、1.01...1.09左右的数值
print("超出训练范围的预测序列：")
for val in predicted_sequence:
    print(f"{val:.4f}")

3. 关键注意事项

确保模型学趋势而非记数值：如果你的序列不是线性的（比如非线性增长），只靠小范围训练数据可能没法准确预测超出范围的值。这时要么扩大训练数据的覆盖区间，要么调整模型结构（比如增加LSTM单元数、加多层LSTM），让模型能捕捉更复杂的趋势。
归一化的反向转换：如果你的原始数据是未归一化的（比如你这里除以100做了归一化），预测后记得乘以100转换回原始数值。
验证规律的延续性：预测超出范围的值前，要确认训练数据的规律在超出范围后依然成立——比如你的序列是固定步长递增，那超出后规律不变；但如果是指数增长却只训练了前期数据，后期预测可能就不准了。

内容的提问来源于stack exchange，提问作者Andrzej Gis

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

ArkClaw

7×24在线专属智能伙伴

Seedance 2.0 全面开放 API

创作无限可能，一键生成电影级 AI 视频

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠