Matlab转Python代码提速求助：矩阵填充效率差异问题

阿华AIGC实验室

2026-5-15

提速方案：用NumPy向量化操作替代Python列表循环

你的问题核心在于Python列表的循环操作是解释器层面的，而Matlab的矩阵填充是底层优化过的向量化操作——这就是为什么Matlab跑2秒，Python列表版本要2分钟的原因。不管是append还是列表推导式，本质都是在Python层面做逐行的切片、拼接，效率极低。解决方法是用NumPy完全复刻Matlab的矩阵思维，用底层优化的向量化操作替代Python循环。

具体步骤与代码示例

首先，把你的输入数据转换成NumPy数组（这是关键前提，NumPy数组的操作是C实现的，远快于Python列表）：

import numpy as np

# 假设prices1和price_diff是Python列表，先转成NumPy数组
prices1_np = np.array(prices1)
price_diff_np = np.array(price_diff)

然后，利用NumPy的sliding_window_view（NumPy 1.20+支持，安全高效）生成滑动窗口矩阵，再拼接对应的价格差列：

intervals = []
stop_point = validIntSize  # 对应你原代码里的validIntSize

for mean in self.means:
    # 生成滑动窗口：每一行是prices1[i:i+mean]，取前stop_point行
    # 这个操作不复制数据，只是改变数组的步长，速度极快
    window_matrix = np.lib.stride_tricks.sliding_window_view(prices1_np, window_size=mean)[:stop_point]
    
    # 提取对应的price_diff元素，转成列向量（方便拼接）
    diff_column = price_diff_np[mean - 1 : mean - 1 + stop_point, np.newaxis]
    
    # 拼接窗口矩阵和价格差列，得到和Matlab结构一致的矩阵
    interval_matrix = np.hstack([window_matrix, diff_column])
    intervals.append(interval_matrix)

为什么这个方法快？

滑动窗口无复制：sliding_window_view通过修改数组的内存步长来生成窗口，不需要复制原始数据，比手动切片快几个数量级。
向量化操作：所有矩阵拼接、切片都是NumPy底层的C代码执行，完全避开了Python解释器的循环开销。
内存连续：NumPy数组是内存连续的，和Matlab矩阵的存储方式一致，缓存利用率远高于Python列表。

兼容旧版NumPy（<1.20）的替代方案

如果你的NumPy版本较低，可以用np.lib.stride_tricks.as_strided实现滑动窗口（注意要计算正确的步长，避免越界）：

def sliding_window(arr, window_size):
    arr = np.asarray(arr)
    shape = (arr.shape[0] - window_size + 1, window_size)
    strides = (arr.strides[0], arr.strides[0])
    return np.lib.stride_tricks.as_strided(arr, shape=shape, strides=strides)

# 然后替换上面的sliding_window_view：
window_matrix = sliding_window(prices1_np, mean)[:stop_point]