TensorFlow基于自定义数值数据集实现感知机的技术咨询

阿华AIGC实验室

2026-5-15

当然可以！这正是TensorFlow多层感知机（MLP）的灵活之处——MNIST只是最常用的演示数据集，你在MNIST案例里用到的优化器（比如Adam、SGD）和代价函数（比如交叉熵、均方误差），完全可以直接复用在自定义数值型数据集上。下面我给你详细解释逻辑，再附上完整的训练示例。

核心逻辑说明

MLP的本质是对输入特征做线性变换+非线性激活的堆叠，不管输入是图像（扁平化后也是数值张量）还是纯数值特征，模型的工作逻辑完全一致。你只需要：

把自定义数据集整理成(样本数量, 特征数量)的二维张量格式
根据任务类型（分类/回归）调整输出层的结构和对应的代价函数
对数值特征做必要的预处理（比如标准化），帮助模型更快收敛

自定义数值数据集的MLP训练示例（分类任务）

我们先做一个二分类任务的示例，模拟一个3维数值特征的数据集，用和MNIST相同的Adam优化器与交叉熵代价函数。

1. 导入依赖并构造数据集

import tensorflow as tf
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 模拟自定义二分类数据集：3个输入特征，2类标签
np.random.seed(42)  # 固定随机种子保证可复现
n_samples = 1000
X = np.random.randn(n_samples, 3)  # 生成1000个样本，每个样本3个数值特征
# 根据特征的线性组合生成标签：特征和大于0为类别1，否则为0
y = (X[:, 0] + X[:, 1] + X[:, 2] > 0).astype(int)

# 划分训练集、测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 标准化特征（数值特征必须做这一步，避免尺度差异影响模型收敛）
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

2. 构建并编译MLP模型

这里的模型结构和MNIST的逻辑完全一致，只是输入维度从MNIST的784（28*28）改成了3：

model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(3,)),  # 输入层匹配3个特征
    tf.keras.layers.Dense(32, activation='relu'),  # 隐藏层
    tf.keras.layers.Dense(2, activation='softmax')  # 二分类输出层，2个神经元对应两类
])

# 编译模型：复用MNIST常用的Adam优化器和交叉熵代价函数
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.SparseCategoricalCrossentropy(),  # 标签是整数时用这个
    metrics=['accuracy']
)

3. 训练与评估模型

训练流程和MNIST完全相同：

# 训练模型，用10%的训练集做验证
history = model.fit(
    X_train_scaled, y_train,
    epochs=20,
    batch_size=32,
    validation_split=0.1
)

# 在测试集上评估效果
test_loss, test_acc = model.evaluate(X_test_scaled, y_test)
print(f"测试集准确率: {test_acc:.4f}")

# 对新样本做预测
new_sample = np.array([[0.5, -1.2, 0.8]])
new_sample_scaled = scaler.transform(new_sample)
pred_proba = model.predict(new_sample_scaled)
pred_class = np.argmax(pred_proba)
print(f"预测类别: {pred_class}, 类别概率: {pred_proba[0]}")

回归任务的MLP示例

如果你的自定义数据集是回归任务（输出连续值），只需要调整输出层和代价函数，优化器依然可以用Adam：

# 模拟回归数据集：2个输入特征，1个连续输出
X_reg = np.random.randn(n_samples, 2)
# 构造带噪声的线性关系作为真实标签
y_reg = 2*X_reg[:,0] + 3*X_reg[:,1] + np.random.randn(n_samples)*0.1

# 划分数据集并标准化
X_reg_train, X_reg_test, y_reg_train, y_reg_test = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)
X_reg_train_scaled = scaler.fit_transform(X_reg_train)
X_reg_test_scaled = scaler.transform(X_reg_test)

# 构建回归MLP模型
reg_model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(2,)),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(1, activation='linear')  # 回归输出层用1个神经元，激活函数为linear
])

# 编译：代价函数改用均方误差（MSE），这是回归任务的常用损失
reg_model.compile(
    optimizer='adam',
    loss=tf.keras.losses.MeanSquaredError(),
    metrics=['mae']  # 监控平均绝对误差
)

# 训练模型
reg_history = reg_model.fit(
    X_reg_train_scaled, y_reg_train,
    epochs=20,
    batch_size=32,
    validation_split=0.1
)

# 评估测试集
test_mse, test_mae = reg_model.evaluate(X_reg_test_scaled, y_reg_test)
print(f"测试集MSE: {test_mse:.4f}, 测试集MAE: {test_mae:.4f}")

关键注意点

数据预处理：数值特征的尺度差异会严重影响MLP的收敛速度，一定要做标准化或归一化。
代价函数匹配：分类任务用交叉熵（SparseCategoricalCrossentropy对应整数标签，CategoricalCrossentropy对应one-hot标签），回归任务用MSE、MAE等。
模型结构调整：输入层的input_shape必须和你的特征数量一致，输出层神经元数量匹配分类类别数或回归的输出维度。

内容的提问来源于stack exchange，提问作者Nandakishor Jahagirdar