关于Durrett《随机过程基础》中(1,3)库存策略转移矩阵行列关系的疑问
嘿,我太懂你读Durrett这本《随机过程基础》时被(1,3)库存策略转移矩阵搞懵的感觉了!我当初也卡在这里好久,现在给你掰扯清楚:
彻底搞懂(1,3)库存策略的转移矩阵行列对应
先把(1,3)库存策略的核心流程拎明白,这是理解矩阵的前提:
- 每天清晨先查库存:如果库存≤1,直接补到3;如果库存>1,啥也不补
- 接着当天发生随机销售,销量是个有概率分布的随机变量
- 当天结束后的库存,就是次日清晨补货前的库存
转移矩阵的行:当日清晨补货前的库存状态
每一行对应的是你当天早上刚开门、还没补货时的库存数量。比如行索引是0,就代表当日开始时库存是0;行索引是2,代表当日开始时库存是2。
转移矩阵的列:次日清晨补货前的库存状态
每一列对应的是经过一天的补货+销售操作后,第二天早上开门时的库存数量。比如列索引是1,就代表次日开始时库存是1;列索引是3,代表次日开始时库存是3。
矩阵元素的含义:状态转移概率
矩阵里的元素P[i][j],就是如果当日开始时库存是i,那么次日开始时库存是j的概率。
举个具体例子帮你理解
假设每日销量D的可能取值是0、1、2、3,对应的概率分别是p0、p1、p2、p3:
- 当行i=0(当日开始库存0):因为0≤1,所以补货到3。当天销售后,库存是
max(3-D, 0),所以:- 列j=0的概率是D=3的概率
p3 - 列j=1的概率是D=2的概率
p2 - 列j=2的概率是D=1的概率
p1 - 列j=3的概率是D=0的概率
p0
- 列j=0的概率是D=3的概率
- 当行i=2(当日开始库存2):因为2>1,不补货。当天销售后库存是
max(2-D, 0),所以:- 列j=0的概率是D≥2的概率
p2+p3 - 列j=1的概率是D=1的概率
p1 - 列j=2的概率是D=0的概率
p0 - 列j=3的概率是0(因为最多卖2,库存剩0或1或2,到不了3)
- 列j=0的概率是D≥2的概率
容易踩的坑
很多人会误以为行是补货后的库存状态,但Durrett这里的转移矩阵是基于「补货前的初始库存」定义的——毕竟补货动作本身就是由这个初始状态决定的,搞反的话整个矩阵的逻辑就完全错位了!
内容的提问来源于stack exchange,提问作者Mathematicing




