在TensorFlow构建FCN-8s模型时：tf.add()与tensorflow.keras.layers.Add()的差异及Add()与add()的区别疑问

在TensorFlow构建FCN-8s模型时：tf.add()与tensorflow.keras.layers.Add()的差异及Add()与add()的区别疑问

阿华AIGC实验室

2026-4-30

关于TensorFlow中加法操作的两个疑问解答

刚好之前在搭建Keras模型时也碰到过类似的可视化问题，我来给你详细拆解这两个疑问：

一、`tf.add()`与`tensorflow.keras.layers.Add()`的核心差异

这两者本质上是不同层级的API，核心区别在于是否属于Keras的层体系：

tf.add()是TensorFlow核心API提供的底层张量运算操作，它的作用仅仅是对两个输入张量执行元素级加法，不会被Keras模型识别为一个“层”。所以当你用它做加法时，虽然计算逻辑是正确的（结果能正常传递到下一层，模型摘要也能体现），但在可视化模型架构（比如tf.keras.utils.plot_model）时，它不会被当作一个节点纳入层的连接图中，就会出现你看到的“断开”现象。
tensorflow.keras.layers.Add()是Keras的正式层类，它是对tf.add()的封装，符合Keras层的接口规范。使用它时，这个加法操作会被模型当作一个正式的层来跟踪，不仅能正常完成加法运算，还会被纳入模型的结构记录中，所以可视化时能和前后层正确连接，也支持层的命名、序列化等Keras层的特性。

举个简单对比示例：

使用`tf.add()`的写法

input_tensor = tf.keras.Input(shape=(32,))
x = tf.keras.layers.Dense(64)(input_tensor)
y = tf.keras.layers.Dense(64)(input_tensor)
z = tf.add(x, y)  # 仅做张量运算，不被视为层
model = tf.keras.Model(inputs=input_tensor, outputs=z)

此时用plot_model可视化，看不到加法对应的节点，x、y和z之间会呈现“断开”。

使用`Add()`层的写法

input_tensor = tf.keras.Input(shape=(32,))
x = tf.keras.layers.Dense(64)(input_tensor)
y = tf.keras.layers.Dense(64)(input_tensor)
z = tf.keras.layers.Add()([x, y])  # 作为正式层加入模型
model = tf.keras.Model(inputs=input_tensor, outputs=z)

这个写法下，Add()会作为一个层节点出现在可视化图中，和x、y、z的连接完全正常。

二、`tensorflow.keras.layers.Add()`与`tensorflow.keras.layers.add()`的区别

这两个其实是同一功能的不同写法，本质没有差异：

tf.keras.layers.Add()是层的类，需要先实例化（调用Add()创建层对象），再传入输入张量。这种方式更灵活，比如你可以给层设置自定义名称：tf.keras.layers.Add(name='custom_add_layer')([x, y])。
tf.keras.layers.add()是Keras提供的便捷函数，它内部会自动创建一个Add层的实例，然后直接传入输入张量。相当于简化写法，适合不需要额外配置层参数的场景，比如tf.keras.layers.add([x, y])和tf.keras.layers.Add()([x, y])的效果完全一致。

简单来说，add()就是Add()的语法糖，最终都会生成同一个加法层，在模型结构、可视化、运算逻辑上没有任何区别，只是写法不同而已。

内容的提问来源于stack exchange，提问作者pedro_galher

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠