PyTorch中GRU层h_n输出的维度排布及正向隐藏状态提取方法咨询

阿华AIGC实验室

2026-4-14

嗨，看了你这段刚接触PyTorch一个月写的GRU代码，我来帮你理清楚双向GRU中hn的维度排布问题～

首先，你观察到hn的形状是torch.Size([4, 64, 32])，这个确实是2层GRU × 2个方向的结果。关于它的排布顺序，PyTorch的规则是：按层划分，每一层的正向隐藏状态在前，反向隐藏状态在后，并不是交替排列的。具体到你的两层双向GRU，hn的每个索引对应的含义是：

索引0：第1层GRU的正向最后时刻隐藏状态
索引1：第1层GRU的反向最后时刻隐藏状态
索引2：第2层GRU的正向最后时刻隐藏状态
索引3：第2层GRU的反向最后时刻隐藏状态

再看你提取正向隐藏状态的代码：

forward_hidden = hn[[x for x in range(0, gru_layers_count * 2, 2)], :, :]

这个写法是完全正确的，它会选取索引0和2的元素，正好对应两层的正向隐藏状态。不过可以给你一个更简洁的写法，效果完全一致：

forward_hidden = hn[::2, :, :]

这里的::2表示从索引0开始，每隔一个元素取一次，刚好拿到所有层的正向隐藏状态。如果要提取反向的，就用hn[1::2, :, :]即可。

备注：内容来源于stack exchange，提问作者ashwani kumar dwivedi

火山引擎最新活动

方舟 Coding Plan

HOT

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

查看详情

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

查看详情

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

查看详情

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠

查看详情

ArkClaw 专属智能伙伴