加性范畴中矩阵符号对应及相关定理应用的技术问询
以下问题出自Arbib和Manes所著的《Arrows, Structures and Functors the categorical imperative》。
背景
(1) 定义1:范畴中的积
在范畴$\textbf{K}$中,一族对象$(A_i\mid i\in I)$的积(product)是一个对象$A$,连同一族态射
$$(A \xrightarrow{\normalsize{\text{in}}i} A_i\mid i\in I)$$
(称为投影(projections)),满足如下性质:对任意其他对象$C$及一族$I$-索引态射$(f_i:C\to A_i)$,存在唯一的态射$f:C\to A$,使得对所有$i\in I$,都有$\pi_i\circ f=f_i$。我们记$A=\prod{i\in I}A_i$;若$I={1,\ldots,n}$,也可写作$A=A_1\times\ldots\times A_n$。
(2a) 命题1:向量空间范畴中的积
给定一族向量空间$(A_i\mid i\in I)$,它们的积定义为笛卡尔积
$$\prod_{i\in I}A_i={f\mid f:I\to \bigcup_{i\in I} A_i\text{ 且对每个 }i\in I, f(i)\in A_i}$$
装备“按分量”的加法和数乘运算:
$$(f+f')(i)=f(i)+f'(i)\quad \text{及} \quad (\lambda \cdot f)(i)=\lambda\cdot f(i)$$
其中$f,f'\in \prod_{i\in I}A_i$,$\lambda\in \textbf{R}$,$i\in I$。那么$\prod_{i\in I}A_i$连同一族投影
$$\pi_j:\prod_{i\in I}A_i\to A_i:f\mapsto f(j)$$
是范畴$\textbf{Vect}$中$(A_i)$的积(符合定义1的要求)。
证明:只需验证$p(c)(i)=p_i(c)$满足定义1的条件即可。
(2b) 命题2:向量空间范畴中的余积(弱直和)
给定一族向量空间$(A_i\mid i\in I)$,它们的弱直和(weak direct sum)定义为
$$\coprod_{i\in I}A_i={f\mid f:I\to \bigcup_{i \in I}A_i;f(i)\in A_i \text{对每个}i\in I;\text{且}\text{supp}(f)\text{是有限集}}$$
将其视为$\prod_{i\in I}A_i$的子空间。那么$\coprod_{i\in I}A_i$连同一族嵌入
$$\text{in}j:A_j\to \coprod{i\in I}A_i:a_j\mapsto \text{满足}f(i)=0(\forall i\neq j)\text{且}f(j)=a_j\text{的映射}f$$
是范畴$\textbf{Vect}$中$(A_i)$的余积(coproduct)。
(3) 有限维实空间的积与余积示例
$\textbf{R}n$在$\textbf{Vect}$中可作为积:通过投影$\pi_j:\textbf{R}n\to \textbf{R},(x_1,\dots,x_n)\mapsto x_j$;同时也可作为余积:通过嵌入$\text{in}_i:\textbf{R}\to \textbf{R}^n, x\mapsto (0,\dots,x,0,\dots,0)$(其中$x$位于第$i$个位置)。
为了引入任意范畴中的类似情况,我们观察到:线性映射$f:\textbf{R}^3\to \textbf{R}^2$对应一个由$\textbf{R}\to \textbf{R}$的线性映射组成的$2\times 3$矩阵
$$({f_i}j)=\begin{pmatrix}{f_1}1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}$$
具体对应方式如下:
- 因为$\textbf{R}^3=\textbf{R}+\textbf{R}+\textbf{R}$(余积),$f$对应行向量$\begin{pmatrix}f_1, & f_2, & f_3\end{pmatrix}$,其中$f_i=f\cdot \text{in}_i:\textbf{R}\to \textbf{R}^2$;
- 每个$f_i$又对应列向量$\begin{pmatrix}{f_i}^1 \\ {f_i}2\end{pmatrix}$,其中${f_i}j=\pi_j\cdot f_i:\textbf{R}\to \textbf{R}$,这是因为$\textbf{R}^2=\textbf{R}\times \textbf{R}$(积)。
因此$f$对应上述$2\times 3$矩阵$({f_i}^j)$。举个例子,利用泛性质可得:
$$f(x,y,z)=f_1(x)+f_2(y)+f_3(z)=\begin{pmatrix}{f_1}^1(x) + {f_2}^1(y) + {f_3}1(z)\ {f_1}2(x) + {f_2}^2(y) + {f_3}^2(z)\end{pmatrix}$$
(4) 定理:加性范畴的等价条件
设$\textbf{K}$是一个范畴,其中每个对象$A$的$A+A$(余积)和$A\times A$(积)都存在。则以下两个条件等价:
- $\textbf{K}$具有Abm-结构;
- $\textbf{K}$是带点范畴(通过$0_\text{AB}$),且对所有对象$A$,映射$\Delta:A+A\to A\times A$(定义为$\pi_j \cdot \Delta \cdot \text{in}i = \delta{ij}$,其中$\delta_{ij}$是克罗内克函数:
$$\delta_{ij}=
\begin{cases}
\text{id}_A & \text{若 } i=j\
0 & \text{若 } i\neq j
\end{cases}$$
)是同构。
此外,若上述任一条件成立,则$\textbf{K}$上的Abm-结构是唯一的。
注:这里的$\Delta$对应矩阵$\begin{pmatrix}\text{id}_A & 0 \\ 0 & \text{id}_A\end{pmatrix}$。
问题
在公式(3)$f_i=f\cdot \text{in}_i$和(4)${f_i}^j=\pi_j\cdot f_i$中,对应$2\times 3$矩阵$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}$的运算关系如下:
- (a) $f_1=f\cdot \text{in}_1$对应:$\begin{pmatrix}1 & 0\end{pmatrix}\cdot\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}=\begin{pmatrix} {f_1}^1 & {f_2}^1 & {f_3}^1\end{pmatrix}$
- (b) $f_2=f\cdot \text{in}_2$对应:$\begin{pmatrix}0 & 1\end{pmatrix}\cdot\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}=\begin{pmatrix} {f_1}^2 & {f_2}^2 & {f_3}^2\end{pmatrix}$
- (c) ${f_i}^1=\pi_1\cdot f_i$对应:$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}1 \\ 0\\ 0\end{pmatrix}=\begin{pmatrix}{f_1}^1 \\ {f_1}^2\end{pmatrix}$
- (d) ${f_i}^2=\pi_2\cdot f_i$对应:$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}0 \\ 1\\ 0 \end{pmatrix}=\begin{pmatrix}{f_2}^1 \\ {f_2}^2\end{pmatrix}$
- (e) ${f_i}^3=\pi_3\cdot f_i$对应:$\begin{pmatrix}{f_1}^1 & {f_2}^1 & {f_3}1\ {f_1}2 & {f_2}^2 & {f_3}^2\end{pmatrix}\cdot\begin{pmatrix}0 \\ 0\\ 1 \end{pmatrix}=\begin{pmatrix}{f_3}^1 \\ {f_3}^2\end{pmatrix}$
我的疑问是:
- 当说$f$对应这个$2\times 3$矩阵时,是不是意味着$f:(i,j)\mapsto {f_i}j$?毕竟从公式${f_i}j=\pi_j\cdot f\cdot \text{in}_i$来看,$f$似乎以矩阵形式呈现,但$f$本质是$\textbf{R}^3\to \textbf{R}^2$的映射,它的具体作用形式应该是什么?
- 如何利用公式${f_i}^j=\pi_j\cdot f\cdot \text{in}_i$推导出$f(x,y,z)=f_1(x)+f_2(y)+f_3(z)$的矩阵形式?另外,后续要应用定理(4)中的$\pi_j \cdot \Delta \cdot \text{in}i = \delta{ij}$(其中$\Delta$是恒等矩阵),应该怎么入手?
解答
咱们先把矩阵和线性映射的对应关系掰扯清楚,再一步步解决你的问题:
关于矩阵与映射的对应关系
首先要明确:$f:\mathbb{R}3\to\mathbb{R}2$是线性映射,而$\mathbb{R}3$是3个$\mathbb{R}$的**余积**(直和),$\mathbb{R}2$是2个$\mathbb{R}$的积(直积)。这个范畴论的背景是矩阵对应关系的核心:
- 余积的泛性质告诉我们,任何从余积$\mathbb{R}^3$出发的映射$f$,都可以唯一分解为$f = [f_1, f_2, f_3]$,这里的$f_i = f \circ \text{in}_i$是$\mathbb{R}\to\mathbb{R}2$的线性映射,对应“把第i个分量的输入单独映射到$\mathbb{R}2$”;
- 积的泛性质又告诉我们,任何到积$\mathbb{R}^2$的映射$f_i$,都可以唯一分解为$f_i = \langle f_i^1, f_i^2 \rangle$,这里的$f_i^j = \pi_j \circ f_i = \pi_j \circ f \circ \text{in}_i$是$\mathbb{R}\to\mathbb{R}$的线性映射——而$\text{Hom}(\mathbb{R},\mathbb{R})$和实数集$\mathbb{R}$是同构的,所以$f_i^j$其实就是一个实数,对应“把第i个分量的输入通过f映射后,取第j个分量的输出值”。
所以,这个$2\times 3$矩阵的第j行第i列元素是$f_i^j$,它描述的是$f$对输入向量各分量的作用方式,但$f$本身不是“$(i,j)\mapsto f_ij$”的映射——$f$的作用对象是$\mathbb{R}3$中的向量$(x,y,z)$,作用结果是$\mathbb{R}^2$中的向量,其具体形式就是矩阵和输入向量的乘积:
$$f(x,y,z) = \begin{pmatrix} f_1^1 & f_2^1 & f_3^1 \ f_1^2 & f_2^2 & f_3^2 \end{pmatrix} \begin{pmatrix} x \ y \ z \end{pmatrix}$$
这和我们熟悉的线性映射矩阵表示完全一致。
推导$f(x,y,z)$的矩阵形式
我们可以利用范畴论的泛性质和线性映射的性质一步步推导:
- 余积的元素分解:$\mathbb{R}^3$作为余积,任何元素$(x,y,z)$都可以唯一表示为$\text{in}_1(x) + \text{in}_2(y) + \text{in}_3(z)$——说白了就是把向量拆成三个分量向量的和,比如$(x,y,z)=(x,0,0)+(0,y,0)+(0,0,z)$;
- 线性映射的可加性:因为$f$是线性映射,所以$f(a+b+c)=f(a)+f(b)+f(c)$,代入上面的分解式就得到:
$$f(x,y,z)=f(\text{in}_1(x)) + f(\text{in}_2(y)) + f(\text{in}_3(z)) = f_1(x) + f_2(y) + f_3(z)$$
这里的$f_k = f \circ \text{in}_k$就是之前定义的映射; - 积的分量提取:每个$f_k(x)$是$\mathbb{R}^2$中的向量,利用积的投影$\pi_1,\pi_2$可以提取它的两个分量:$f_k(x) = (\pi_1(f_k(x)), \pi_2(f_k(x)))$。而根据$f_k^j = \pi_j \circ f_k$的定义,再结合$\text{Hom}(\mathbb{R},\mathbb{R})$的线性性(即$f_kj(x)=f_kj \cdot x$),我们可以把$f_k(x)$写成:
$$f_k(x) = (f_k^1 x, f_k^2 x)$$ - 合并分量得到矩阵形式:把所有$f_k$的表达式代入,就得到:
$$f(x,y,z) = (f_1^1 x + f_2^1 y + f_3^1 z, f_1^2 x + f_2^2 y + f_3^2 z)$$
这就是矩阵乘法的结果,和你给出的形式(注意原内容里的矩阵排版可能是笔误,正确的应该是合并后的向量)完全一致。
定理(4)中$\Delta$的应用思路
定理里的$\Delta:A+A\to A\times A$是从余积到积的映射,它的定义$\pi_j \circ \Delta \circ \text{in}i = \delta{ij}$其实就是说:
- 当$i=j$时,$\pi_j \circ \Delta \circ \text{in}_i = \text{id}_A$——也就是$\Delta$把第i个余积分量映射到积的第i个分量,保持恒等;
- 当$i\neq j$时,$\pi_j \circ \Delta \circ \text{in}_i = 0$——也就是$\Delta$把第i个余积分量映射到积的第j个分量时是零映射。
这完全对应我们熟悉的恒等矩阵$\begin{pmatrix} \text{id}_A & 0 \ 0 & \text{id}_A \end{pmatrix}$的作用。在加性范畴中,这个$\Delta$是同构,意味着有限积和有限余积是等价的(称为双积),这就允许我们像在向量空间中一样,用矩阵来表示任意态射:
- 比如从$A_1+A_2+A_3$到$B_1\times B_2$的态射,就可以表示为$2\times 3$的矩阵,其中第j行第i列的元素是$\pi_j \circ f \circ \text{in}_i$;
- 矩阵的乘法规则也和向量空间中一致,因为态射的复合对应矩阵的乘积;
- 后续你在处理加性范畴中的态射时,就可以把$\Delta$当作恒等矩阵来使用,比如在转换积和余积的态射表示时,用$\Delta$来建立同构关系,从而把余积上的态射转换成积上的态射,或者反过来。
备注:内容来源于stack exchange,提问作者Seth




