如何存储指令指针值？为何无法执行mov %rip,%rax及call返回地址计算

阿华AIGC实验室

2026-5-8

嘿，这个问题问到点子上了——我来给你掰扯清楚这几个点，都是x86-64指令集里很关键的细节！

1. 怎么把当前RIP的值复制到其他寄存器？

最简单的方法就是用 lea (%rip), %rax（以rax为例，你可以换成任意通用寄存器）。这条指令的作用是计算括号里的内存地址（这里就是RIP本身的值加上偏移0），然后把这个地址值直接放到目标寄存器里。

要注意的是：x86-64里，当CPU执行一条指令时，RIP已经指向了这条指令的下一条指令的地址。所以用 lea (%rip), %rax 得到的是当前lea指令后面那条指令的地址。如果想获取当前lea指令自己的地址，你需要根据这条lea指令的长度做偏移，比如假设这条lea是7字节，就用 lea -0x7(%rip), %rax——不过大多数场景下，我们需要的都是下一条指令的地址，也就是RIP的当前有效值。

2. 为什么mov %rbx, %rcx合法，mov %rip, %rax却不行？

这本质是x86-64指令集的设计限制：

通用寄存器（比如rbx、rcx、rax这些）之间的mov操作是指令集原生支持的，有专门的opcode编码（比如mov r64, r64对应的opcode是0x89/0x8B），所以CPU能直接识别执行。
但RIP是特殊的指令指针寄存器，它的访问被CPU做了特殊限制——指令集里根本没有设计mov r64, %rip这种指令的编码！早期的32位x86里，EIP也不能被直接mov访问，这是因为指令指针是控制程序执行流的核心寄存器，CPU要保证指令流的稳定性，不允许随意直接读取或修改，只能通过特定指令（比如call、jmp、ret、lea）来间接操作。

而lea之所以能获取RIP的值，是因为x86-64新增了“允许RIP作为基址寄存器参与地址计算”的特性——lea的本质是计算内存地址，而不是真正访问内存，所以用(%rip)作为地址源时，CPU会把当前RIP的值代入计算，最终把结果放到目标寄存器里，相当于间接拿到了RIP的值。

3. call指令是怎么计算返回地址的？

这个过程其实很直白，分两步走：

第一步：保存返回地址：当CPU执行call指令时，它首先会把当前RIP的值（也就是call指令的下一条指令的地址）压入栈中——这个值就是返回地址。因为此时RIP已经指向了call之后的那条指令（CPU是先取指令再执行，执行call的时候，下一条指令已经被预取了，RIP自然指向它）。
第二步：跳转到目标地址：然后CPU会修改RIP的值，跳转到call指令指定的目标地址（可以是直接的偏移地址、寄存器里的地址、或者内存中的地址，取决于call的类型）。

当后续执行ret指令时，CPU会把栈顶的返回地址弹出到RIP，程序就回到call指令之后的位置继续执行了。

举个直观的代码例子：

start:
    call func   ; 执行这条call时，RIP指向的是下面`mov rax, 1`的地址
    mov rax, 1  ; 这就是返回地址，会被call指令自动压入栈
func:
    push rbx
    ; ... 函数逻辑代码
    ret         ; 弹出栈顶的返回地址（即mov rax,1的地址）到RIP，回到start处继续执行

内容的提问来源于stack exchange，提问作者samuelbrody1249