如何在Python中使用正则表达式按版本号排序字符串列表？

如何在Python中使用正则表达式按版本号排序字符串列表？

阿华AIGC实验室

2026-5-6

解决方案

当然可以！你完全可以借助正则表达式提取字符串中的版本号数字，以此作为排序依据，轻松得到你想要的排序结果。我来给你具体演示怎么实现——

思路

核心逻辑很简单：

用正则精准匹配每个字符串里的版本号部分（也就是v后面的数字序列）
把提取到的版本号字符串转换成整数（避免字符串排序的坑，比如v010按字符串会排在v02前面，但转成整数后10会正确排在2后面）
用这个整数作为排序的key，对原列表进行排序

代码实现（以Python为例）

import re

# 你的原始字符串列表
original_list = [
    "main_cam_v005_01",
    "main_cam_v001_1001",
    "main_cam_v008_1000",
    "main_cam_v003_305",
    "main_cam_v007_1007"
]

# 定义排序用的key函数：提取版本号数字并转为整数
def get_version_sort_key(s):
    # 匹配_vxxx_格式的部分，捕获xxx数字
    match_result = re.search(r'_v(\d+)_', s)
    if match_result:
        # 把捕获到的数字字符串转成整数，确保按数值排序
        return int(match_result.group(1))
    # 处理不符合格式的字符串（这里你的列表都符合，所以返回0即可）
    return 0

# 执行排序
sorted_list = sorted(original_list, key=get_version_sort_key)

# 打印结果
print(sorted_list)

运行结果

执行上面的代码后，你会得到完全符合预期的排序结果：

['main_cam_v001_1001', 'main_cam_v003_305', 'main_cam_v005_01', 'main_cam_v007_1007', 'main_cam_v008_1000']

关键细节解释

正则表达式r'_v(\d+)_'：专门匹配_v开头、_结尾的片段，其中(\d+)是捕获组，用来精准提取v后面的所有数字
转成整数int(match_result.group(1))：这一步是核心，字符串排序是按字符逐个比较的，转成整数后才能真正按照版本号的数值大小排序，避免出现v010排在v008前面的错误

内容的提问来源于stack exchange，提问作者JokerMartini

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠