分类目录:《算法设计与分析》总目录
堆排序与归并排序一样,但不同于插入排序的是,堆排序的时间复杂度是 O ( n log n ) O(n\log n) O(nlogn)。而与插入排序相同,但不同于归并排序的是,堆排序同样具有空间原址性:任何时候都只需要常数个额外的元素空间存储临时数据。因此,堆排序是集合了我们目前已经讨论的两种排序算法优点的一种排序算法。
堆排序引入了另一种算法设计技巧:使用一种我们称为“堆”的数据结构来进行信息管理。堆的具体实现可以参考《算法设计与分析》系列中堆的部分,本文中的许多前置函数如max_heap(A)
、heapify(A, i)
等都在该系列的文章中提及。
初始时候,堆排序算法利用max_heap(A)
将输入数组
A
[
1
⋯
n
]
A[1\cdots n]
A[1⋯n]建成最大堆,其中
n
=
A
.
l
e
n
g
t
h
n=A.length
n=A.length,因为数组中的最大元素总在根结点
A
[
1
]
A[1]
A[1]中,通过把它与
A
[
n
]
A[n]
A[n]进行互换,我们可以让该元素放到正确的位置。这时候,如果我们从堆中去掉结点
n
n
n(这一操作可以通过减少
A
.
h
e
a
p
s
i
z
e
A.heap size
A.heapsize的值来实现),剩余的结点中,原来根的孩子结点仍然是最大堆,而新的根结点可能会违背最大堆的性质。为了维护最大堆的性质,我们要做的是调用heapify(A, i)
,从而在
A
[
1
⋯
n
−
1
]
A[1\cdots n-1]
A[1⋯n−1]上构造一个新的最大堆。堆排序算法会不断重复这一过程,直到堆的大小从
n
−
1
n-1
n−1降到2。
def heapSort(arr):
arr = max_heap(arr)
sorted_arr = []
for i in range(n-1, 0, -1):
sorted_arr.append(arr[0])
arr[0] = arr[i]
arr = arr[:-1]
heapify(arr, 0)
下图给出了一个在heapSort(arr)
的第1行建立初始最大堆之后,堆排序操作的一个例子。图片显示了第2-4行for
循环第一次迭代开始前最大堆的情况和每一次迭代之后最大堆的情况。
heapSort(arr)
过程的时间复杂度是
O
(
n
log
n
)
O(n\log n)
O(nlogn),因为每次调用max_heap(arr)
的时间复杂度是
O
(
n
)
O(n)
O(n),而
n
−
1
n-1
n−1次调用heapify(A, i)
,每次的时间为
O
(
log
n
)
O(\log n)
O(logn)。
最后,我们用动图演示一下插入排序的全过程: