二分搜索为何每次对半分割样本空间？如何证明其时间复杂度最优？

阿华AIGC实验室

2026-5-19

为什么二分搜索对半分割是时间复杂度最优的？

这个问题问得特别到位——直觉上我们都觉得对半分效率最高，但要从数学上把这个结论坐实，确实需要拆解一下核心逻辑。我从递推分析和决策树两个角度给你证明：

一、用递推式分析最坏情况时间复杂度

首先，我们定义：假设每次把样本空间按比例 (a : (1-a)) 分割（(0 < a < 1)），最坏情况下每次都会进入更大的那一部分子空间（因为最坏情况就是运气最差，每次都要搜更大的区域）。设 T(n) 为搜索大小为n的空间所需的最多比较次数，那么递推关系是：

T(n) = 1 + T(max(a*n, (1-a)*n))
边界条件：T(1) = 1（找到元素需要1次比较，找不到的情况类似，不影响渐近分析）

我们可以通过迭代这个递推式，计算需要多少次迭代才能把空间缩小到1：
经过k次迭代后，剩余空间大小是 n * (max(a, 1-a))^k
当剩余空间≤1时停止，即：
n * (max(a, 1-a))^k ≤ 1

两边取以2为底的对数（方便和二分搜索对比）：
k * log₂(max(a, 1-a)) ≤ -log₂n

因为 max(a,1-a) ≥ 1/2（不管怎么分，总有一部分至少占一半），所以 log₂(max(a,1-a)) ≥ -1。我们的目标是让k尽可能小，也就是让右边的分母 -log₂(max(a, 1-a)) 尽可能大。

现在看这个分母的最大值：

当 a=1/2 时，max(a,1-a)=1/2，分母是 -log₂(1/2)=1，此时 k ≈ log₂n
当 a≠1/2 时，比如 a=1/3（1:3分割），max(a,1-a)=2/3，分母是 -log₂(2/3)=log₂(3/2)≈0.585，此时 k≈log₂n / 0.585≈1.71 * log₂n，比二分搜索的次数多了70%
再极端点，比如 a=1/4（1:4分割），max(a,1-a)=3/4，分母是 -log₂(3/4)=log₂(4/3)≈0.415，此时 k≈log₂n / 0.415≈2.41 * log₂n，效率更低