关于一款递归排序算法的时间复杂度分析请求

阿华AIGC实验室

2026-4-22

看起来你写了一个递归版的自适应桶排序，挺有意思的！我来帮你拆解它的时间复杂度，结合你的代码逻辑和测试场景来分析：

先理清你的算法逻辑

你的核心思路是：

若数组长度小于2，直接返回（递归终止条件）
创建和原数组长度相同的桶，根据元素的数值范围（min到max）计算每个元素应该放入的桶索引
对每个桶，如果里面包含不同值（用set(i)判断），就递归调用自身排序这个桶
最后把所有桶的元素扁平化返回

时间复杂度的分情况讨论

桶排序的时间复杂度高度依赖元素的分布情况，你的递归版本也不例外：

1. 最好情况：O(n)

当数组元素的分布足够均匀，或者重复值极多时，每次分桶后，所有非空桶里的元素都是相同值（或者长度小于2），不需要触发递归。
比如你测试用的random.randint(1, size)生成的数组：元素均匀分布在1到size之间，计算k=(len(a)-1)/(mx-mn)后，每个元素会被精准分配到对应的桶（甚至每个桶里的元素值都相同），这时候只需要两次遍历数组（一次分桶，一次扁平化），时间开销是严格线性的。这也是为什么你的测试里，自己的排序会比Python内置的sorted（基于Timsort，时间复杂度O(n log n)）更快。

2. 平均情况：O(n log n)

如果元素分布不算极端，但每次分桶后会有部分桶包含不同值需要递归处理，且每次递归处理的桶大小是原数组的常数分之一（比如每次把数组分成k个大小相近的子桶），那么递归深度是O(log n)，而每一层递归的总操作量都是O(n)（遍历所有元素分桶），总时间复杂度就是O(n log n)，和常见的高效排序算法（快速排序、归并排序）持平。

3. 最坏情况：O(n²)

当元素分布极端不均匀时，会触发最坏情况：比如数组是[1, 1000, 1000000, ...]（每个元素的数值间隙极大），每次分桶时所有元素都会被round到同一个桶里，而且这个桶里的元素值都不相同，需要继续递归。这种情况下，每次递归都要处理和原数组大小几乎一样的子数组，递归深度达到O(n)，总时间复杂度就退化为O(n²)，和最坏情况的冒泡排序、插入排序一样低效。