使用Scipy.interpolate.splev外推补全Python/Pandas缺失数据的问题

阿华AIGC实验室

2026-5-14

解决期权波动率外推问题：splev用法与interp1d失效原因

我来帮你搞定这个期权MidVol外推的问题——先讲怎么用scipy.splev实现你要的外推计算，再聊聊为啥interp1d的结果会偏差这么大。

一、用splev实现缺失行权价的MidVol外推

你已经用splrep生成了样条拟合参数，接下来直接把缺失的行权价传给splev就行，关键是要设置ext=0来开启外推功能。给你完整的代码示例：

import scipy.interpolate as spi

# 假设你的原始数据存储在df中，索引是行权价，'MidVol'是波动率列
# 生成B样条拟合参数（k=5是5阶样条，s=6是平滑因子，可根据数据调整）
ipo = spi.splrep(df.index, df['MidVol'], k=5, s=6)

# 定义需要补全的缺失行权价
missing_strikes = [20000, 22000, 24000, 26000, 28000, 30000]

# 执行外推计算：ext=0表示使用样条端点的导数进行外推
extrapolated_midvols = spi.splev(missing_strikes, ipo, ext=0)

# 转成你需要的列表格式
extrap_list = extrapolated_midvols.tolist()

这里要注意几个细节：

splrep的k参数是样条的阶数，5阶样条比三次样条（k=3）更平滑，适合拟合波动率曲面的趋势；
s是平滑因子，数值越大，拟合曲线越平滑（会牺牲一点对原始数据的贴合度），你可以根据实际数据调整这个值，找到平衡；
ext=0是外推的核心设置：它告诉splev，当输入的行权价超出原始数据范围时，用样条在边界处的导数向外延伸计算，而不是默认返回边界的MidVol值（ext=1）或者直接报错（ext=2）。