加性范畴中矩阵符号对应及相关定理应用的技术问询

阿华AIGC实验室

2026-4-23

以下问题出自Arbib和Manes所著的《Arrows, Structures and Functors the categorical imperative》。

背景

(1) 定义1：范畴中的积

在范畴$\textbf{K}$中，一族对象$(A_i\mid i\in I)$的积（product）是一个对象$A$，连同一族态射
$$(A \xrightarrow{\normalsize{\text{in}}i} A_i\mid i\in I)$$
（称为投影（projections）），满足如下性质：对任意其他对象$C$及一族$I$-索引态射$(f_i:C\to A_i)$，存在唯一的态射$f:C\to A$，使得对所有$i\in I$，都有$\pi_i\circ f=f_i$。我们记$A=\prod{i\in I}A_i$；若$I={1,\ldots,n}$，也可写作$A=A_1\times\ldots\times A_n$。

(2a) 命题1：向量空间范畴中的积

给定一族向量空间$(A_i\mid i\in I)$，它们的积定义为笛卡尔积
$$\prod_{i\in I}A_i={f\mid f:I\to \bigcup_{i\in I} A_i\text{ 且对每个 }i\in I, f(i)\in A_i}$$
装备“按分量”的加法和数乘运算：
$$(f+f')(i)=f(i)+f'(i)\quad \text{及} \quad (\lambda \cdot f)(i)=\lambda\cdot f(i)$$
其中$f,f'\in \prod_{i\in I}A_i$，$\lambda\in \textbf{R}$，$i\in I$。那么$\prod_{i\in I}A_i$连同一族投影
$$\pi_j:\prod_{i\in I}A_i\to A_i:f\mapsto f(j)$$
是范畴$\textbf{Vect}$中$(A_i)$的积（符合定义1的要求）。

证明：只需验证$p(c)(i)=p_i(c)$满足定义1的条件即可。

(2b) 命题2：向量空间范畴中的余积（弱直和）

给定一族向量空间$(A_i\mid i\in I)$，它们的弱直和（weak direct sum）定义为
$$\coprod_{i\in I}A_i={f\mid f:I\to \bigcup_{i \in I}A_i;f(i)\in A_i \text{对每个}i\in I;\text{且}\text{supp}(f)\text{是有限集}}$$
将其视为$\prod_{i\in I}A_i$的子空间。那么$\coprod_{i\in I}A_i$连同一族嵌入
$$\text{in}j:A_j\to \coprod{i\in I}A_i:a_j\mapsto \text{满足}f(i)=0(\forall i\neq j)\text{且}f(j)=a_j\text{的映射}f$$
是范畴$\textbf{Vect}$中$(A_i)$的余积（coproduct）。

(3) 有限维实空间的积与余积示例

$\textbf{R}^{n$在$\textbf{Vect}$中可作为积：通过投影$\pi_j:\textbf{R}}n\to \textbf{R},(x_1,\dots,x_n)\mapsto x_j$；同时也可作为余积：通过嵌入$\text{in}_i:\textbf{R}\to \textbf{R}^n, x\mapsto (0,\dots,x,0,\dots,0)$（其中$x$位于第$i$个位置）。

为了引入任意范畴中的类似情况，我们观察到：线性映射$f:\textbf{R}^3\to \textbf{R}^2$对应一个由$\textbf{R}\to \textbf{R}$的线性映射组成的$2\times 3$矩阵
$$({f_i}^{j)=\begin{pmatrix}{f_1}}1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}$$
具体对应方式如下：

因为$\textbf{R}^3=\textbf{R}+\textbf{R}+\textbf{R}$（余积），$f$对应行向量$\begin{pmatrix}f_1, & f_2, & f_3\end{pmatrix}$，其中$f_i=f\cdot \text{in}_i:\textbf{R}\to \textbf{R}^2$；
每个$f_i$又对应列向量$\begin{pmatrix}{f_i}^1 \\ {f_i}^{2\end{pmatrix}$，其中${f_i}}j=\pi_j\cdot f_i:\textbf{R}\to \textbf{R}$，这是因为$\textbf{R}^2=\textbf{R}\times \textbf{R}$（积）。

因此$f$对应上述$2\times 3$矩阵$({f_i}^j)$。举个例子，利用泛性质可得：
$$f(x,y,z)=f_1(x)+f_2(y)+f_3(z)=\begin{pmatrix}{f_1}^1(x) + {f_2}^1(y) + {f_3}^{1(z)\ {f_1}}2(x) + {f_2}^2(y) + {f_3}^2(z)\end{pmatrix}$$

(4) 定理：加性范畴的等价条件

设$\textbf{K}$是一个范畴，其中每个对象$A$的$A+A$（余积）和$A\times A$（积）都存在。则以下两个条件等价：

$\textbf{K}$具有Abm-结构；
$\textbf{K}$是带点范畴（通过$0_\text{AB}$），且对所有对象$A$，映射$\Delta:A+A\to A\times A$（定义为$\pi_j \cdot \Delta \cdot \text{in}i = \delta{ij}$，其中$\delta_{ij}$是克罗内克函数：
$$\delta_{ij}=
\begin{cases}
\text{id}_A & \text{若 } i=j\
0 & \text{若 } i\neq j
\end{cases}$$
）是同构。

此外，若上述任一条件成立，则$\textbf{K}$上的Abm-结构是唯一的。

注：这里的$\Delta$对应矩阵$\begin{pmatrix}\text{id}_A & 0 \\ 0 & \text{id}_A\end{pmatrix}$。

问题

在公式(3)$f_i=f\cdot \text{in}_i$和(4)${f_i}^j=\pi_j\cdot f_i$中，对应$2\times 3$矩阵$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}$的运算关系如下：

(a) $f_1=f\cdot \text{in}_1$对应：$\begin{pmatrix}1 & 0\end{pmatrix}\cdot\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}=\begin{pmatrix} {f_1}^1 & {f_2}^1 & {f_3}^1\end{pmatrix}$
(b) $f_2=f\cdot \text{in}_2$对应：$\begin{pmatrix}0 & 1\end{pmatrix}\cdot\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}=\begin{pmatrix} {f_1}^2 & {f_2}^2 & {f_3}^2\end{pmatrix}$
(c) ${f_i}^1=\pi_1\cdot f_i$对应：$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}1 \\ 0\\ 0\end{pmatrix}=\begin{pmatrix}{f_1}^1 \\ {f_1}^2\end{pmatrix}$
(d) ${f_i}^2=\pi_2\cdot f_i$对应：$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}0 \\ 1\\ 0 \end{pmatrix}=\begin{pmatrix}{f_2}^1 \\ {f_2}^2\end{pmatrix}$
(e) ${f_i}^3=\pi_3\cdot f_i$对应：$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}^{1\ {f_1}}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}0 \\ 0\\ 1 \end{pmatrix}=\begin{pmatrix}{f_3}^1 \\ {f_3}^2\end{pmatrix}$

我的疑问是：

当说$f$对应这个$2\times 3$矩阵时，是不是意味着$f:(i,j)\mapsto {f_i}^{j$？毕竟从公式${f_i}}j=\pi_j\cdot f\cdot \text{in}_i$来看，$f$似乎以矩阵形式呈现，但$f$本质是$\textbf{R}^3\to \textbf{R}^2$的映射，它的具体作用形式应该是什么？
如何利用公式${f_i}^j=\pi_j\cdot f\cdot \text{in}_i$推导出$f(x,y,z)=f_1(x)+f_2(y)+f_3(z)$的矩阵形式？另外，后续要应用定理(4)中的$\pi_j \cdot \Delta \cdot \text{in}i = \delta{ij}$（其中$\Delta$是恒等矩阵），应该怎么入手？

解答

咱们先把矩阵和线性映射的对应关系掰扯清楚，再一步步解决你的问题：

关于矩阵与映射的对应关系

首先要明确：$f:\mathbb{R}^{3\to\mathbb{R}}2$是线性映射，而$\mathbb{R}^{3$是3个$\mathbb{R}$的**余积**（直和），$\mathbb{R}}2$是2个$\mathbb{R}$的积（直积）。这个范畴论的背景是矩阵对应关系的核心：

余积的泛性质告诉我们，任何从余积$\mathbb{R}^3$出发的映射$f$，都可以唯一分解为$f = [f_1, f_2, f_3]$，这里的$f_i = f \circ \text{in}_i$是$\mathbb{R}\to\mathbb{R}^{2$的线性映射，对应“把第i个分量的输入单独映射到$\mathbb{R}}2$”；
积的泛性质又告诉我们，任何到积$\mathbb{R}^2$的映射$f_i$，都可以唯一分解为$f_i = \langle f_i^1, f_i^2 \rangle$，这里的$f_i^j = \pi_j \circ f_i = \pi_j \circ f \circ \text{in}_i$是$\mathbb{R}\to\mathbb{R}$的线性映射——而$\text{Hom}(\mathbb{R},\mathbb{R})$和实数集$\mathbb{R}$是同构的，所以$f_i^j$其实就是一个实数，对应“把第i个分量的输入通过f映射后，取第j个分量的输出值”。

所以，这个$2\times 3$矩阵的第j行第i列元素是$f_i^j$，它描述的是$f$对输入向量各分量的作用方式，但$f$本身不是“$(i,j)\mapsto f_i^{j$”的映射——$f$的作用对象是$\mathbb{R}}3$中的向量$(x,y,z)$，作用结果是$\mathbb{R}^2$中的向量，其具体形式就是矩阵和输入向量的乘积：
$$f(x,y,z) = \begin{pmatrix} f_1^1 & f_2^1 & f_3^1 \ f_1^2 & f_2^2 & f_3^2 \end{pmatrix} \begin{pmatrix} x \ y \ z \end{pmatrix}$$
这和我们熟悉的线性映射矩阵表示完全一致。

推导$f(x,y,z)$的矩阵形式

我们可以利用范畴论的泛性质和线性映射的性质一步步推导：

余积的元素分解：$\mathbb{R}^3$作为余积，任何元素$(x,y,z)$都可以唯一表示为$\text{in}_1(x) + \text{in}_2(y) + \text{in}_3(z)$——说白了就是把向量拆成三个分量向量的和，比如$(x,y,z)=(x,0,0)+(0,y,0)+(0,0,z)$；
线性映射的可加性：因为$f$是线性映射，所以$f(a+b+c)=f(a)+f(b)+f(c)$，代入上面的分解式就得到：
$$f(x,y,z)=f(\text{in}_1(x)) + f(\text{in}_2(y)) + f(\text{in}_3(z)) = f_1(x) + f_2(y) + f_3(z)$$
这里的$f_k = f \circ \text{in}_k$就是之前定义的映射；
积的分量提取：每个$f_k(x)$是$\mathbb{R}^2$中的向量，利用积的投影$\pi_1,\pi_2$可以提取它的两个分量：$f_k(x) = (\pi_1(f_k(x)), \pi_2(f_k(x)))$。而根据$f_k^j = \pi_j \circ f_k$的定义，再结合$\text{Hom}(\mathbb{R},\mathbb{R})$的线性性（即$f_k^j(x)=f_kj \cdot x$），我们可以把$f_k(x)$写成：
$$f_k(x) = (f_k^1 x, f_k^2 x)$$
合并分量得到矩阵形式：把所有$f_k$的表达式代入，就得到：
$$f(x,y,z) = (f_1^1 x + f_2^1 y + f_3^1 z, f_1^2 x + f_2^2 y + f_3^2 z)$$
这就是矩阵乘法的结果，和你给出的形式（注意原内容里的矩阵排版可能是笔误，正确的应该是合并后的向量）完全一致。

定理(4)中$\Delta$的应用思路

定理里的$\Delta:A+A\to A\times A$是从余积到积的映射，它的定义$\pi_j \circ \Delta \circ \text{in}i = \delta{ij}$其实就是说：

当$i=j$时，$\pi_j \circ \Delta \circ \text{in}_i = \text{id}_A$——也就是$\Delta$把第i个余积分量映射到积的第i个分量，保持恒等；
当$i\neq j$时，$\pi_j \circ \Delta \circ \text{in}_i = 0$——也就是$\Delta$把第i个余积分量映射到积的第j个分量时是零映射。

这完全对应我们熟悉的恒等矩阵$\begin{pmatrix} \text{id}_A & 0 \ 0 & \text{id}_A \end{pmatrix}$的作用。在加性范畴中，这个$\Delta$是同构，意味着有限积和有限余积是等价的（称为双积），这就允许我们像在向量空间中一样，用矩阵来表示任意态射：

比如从$A_1+A_2+A_3$到$B_1\times B_2$的态射，就可以表示为$2\times 3$的矩阵，其中第j行第i列的元素是$\pi_j \circ f \circ \text{in}_i$；
矩阵的乘法规则也和向量空间中一致，因为态射的复合对应矩阵的乘积；
后续你在处理加性范畴中的态射时，就可以把$\Delta$当作恒等矩阵来使用，比如在转换积和余积的态射表示时，用$\Delta$来建立同构关系，从而把余积上的态射转换成积上的态射，或者反过来。

备注：内容来源于stack exchange，提问作者Seth