高级排序算法之归并排序,快速排序

前言

承接上文基础排序算法—冒泡,插入,选择,相比之下,归并排序和快速排序更为高效,时间复杂度均为O(nlogn),相比简单排序的O(n^2)好了很多,下面介绍一下这两种算法的思路,实现和主要指标.主要思路来自<数据结构与算法之美>

正文

归并排序

主要思路

在归并排序采用分冶的思想,使用递归实现.描述如下

  1. 开始归并排序
  2. 如果数组元素小于两个,无需排序,结束
  3. 否则需要排序,归并排序数组左侧,归并排序数组右侧,按序合并左右侧

采用的是自顶至下的思路,例如[1,5,3,7,4,6],左侧为[1,5,3],右侧为[7,4,6],左侧归并排序后为[1,3,5],右侧归并排序后为[4,6,7],按序合并后[1,3,4,5,6,7]这里的关键是只在主流程思考,不要试图代入到递归的子流程中,引用一句: "编写递归代码的关键是,只要遇到递归,我们就把它抽象成一个递推公式,不用想一层层的调用关系,不要试图用人脑去分解递归的每个步骤" ,递归公式如下

merge_sort(arr[low,high))=merge_sort(arr[low,mid))+merge_sort(arr[mid,high)
merge(arr,low,mid,high)

java实现如下

public void sort(Comparable[] arr) {
        if (arr.length <= 1) {
            return;
        }
        mergeSort(arr, 0, arr.length);
    }


    private void mergeSort(Comparable[] arr, int low, int high) {
        if (high - low <= 1) {
            return;
        }
        int mid = low + (high - low) / 2;
        mergeSort(arr, low, mid);
        mergeSort(arr, mid, high);
        merge(arr, low, mid, high);
    }

    private void merge(Comparable[] arr, int low, int mid, int high) {
        Comparable[] left = Arrays.copyOfRange(arr, low, mid);
        Comparable[] right = Arrays.copyOfRange(arr, mid, high);
        int l = 0, r = 0;
        int pos = low;
        for (int i = 0; i < (high - low); i++) {
            Comparable next = null;
            if (l == left.length) {
                next = right[r++];
            } else if (r == right.length) {
                next = left[l++];
            } else if (left[l].compareTo(right[r]) <= 0) {
                next = left[l++];
            } else {
                next = right[r++];
            }
            arr[pos++] = next;
        }
    }

merge方法将两个有序数组合并为一个有序数组,最后的判断逻辑有一点繁琐,王争文中有提到可以用哨兵简化,也许是我使用方法不对,使用哨兵后感觉反而更麻烦了,最终采用了繁琐的写法.

时间复杂度

对于递归实现,分析时间复杂度时也要推导出公式,对左右数组归并排序数量级都是一半,因此为T(n/2),merge()方法是对两个数组按序排列,时间复杂度为O(n), 当n=1时,时间复杂度为常数,由此可得

T(n) = T(n/2) + T(n/2) + n = 2*T(n/2) + n
T(1) = C

下面对公式进行代入

T(n) = 2*T(n/2) + n
		 = 2*(2*T(n/4) + n/2) + n
		 = 2*(2*(2*T(n/8)+n/4) + n/2) + n
		 = 2^3*T(n/2^3) + 3n
		 = 2^k*T(n/2^k) + kn
当T(n/2^k) == T(1) 即n/2^k == 1 可得k=logn(底数为2),代入到T(n)中得

T(n) = n*C +logn*n

所以归并排序的时间复杂度为O(nlogn),根据归并排序的思路,它的算法复杂度不受数组顺序影响.

是原地排序吗?

不是,merge过程中需要对左右子数组复制进行归并,尽管递归过程中会不断申请额外空间,但是同一时间申请的最大额外空间为O(n),空间复杂度为O(n)

稳定吗?

归并排序数组元素的移动只发生在merge阶段,当左右相等时,我们会优先选择左侧(left[l].compareTo(right[r]) <= 0),因此是稳定的

快速排序

主要思路

快排通过partition(划分)将数组划分为中间值的左侧和右侧.保证左侧<=中间值<右侧,再对左侧右侧(不包含中间值所在下标)递归处理,实现排序.

快排的递归伪代码如下

quick_sort(arr,low,high)={
  if (high-low<=1) return
	mid = partition(arr,low,high)
	quick_sort(arr,low,mid)
	quick_sort(arr,mid+1,high)
}

java代码如下

public void sort(Comparable[] arr) {
        if (arr.length <= 1) {
            return;
        }
        quickSort(arr, 0, arr.length);
    }

    private void quickSort(Comparable[] arr, int low, int high) {
        if (high - low <= 1) {
            return;
        }
        int mid = partition(arr, low, high);
        quickSort(arr, low, mid);
        quickSort(arr, mid + 1, high);
    }

    private int partition(Comparable[] arr, int low, int high) {
        Comparable cmpValue = arr[high - 1];
        int i = low;
        for (int j = low; j < high - 1; j++) {
            if (arr[j].compareTo(cmpValue) <= 0) {
                swap(arr, i++, j);
            }
        }
        swap(arr, i, high - 1);
        return i;
    }

快速排序的核心在于partition(划分),这里有两种方式:

  1. 以arr[0]为中间值,左右各选一个锚点,将左侧>中间值的与右侧<=中间值的做交换,直到左右锚点相遇/左右锚点反序/任意锚点到达边界,这样左侧都小于等于中间值,右侧都大于中间值
  2. 类似于选择排序,将数组在逻辑上划分为左侧的已排序部分和右侧的未排序部分,初始时已排序部分为空.依次将小于中间值的数字插入到已排序部分

时间复杂度

和归并排序类似,时间复杂度的递推公式为

T(n) = n + T(n/2) + T(n/2)  = n + 2*T(n/2) 
T(1) = C

推到过程同上,时间复杂度也是O(nlogn)

是原地排序吗?

是的,快速排序过程中不占用额外空间

稳定吗?

不稳定,从上文基础排序算法—冒泡,插入,选择中我们得知选择排序是不稳定的,快速排序的划分过程采用的事选择排序的思想,因此也是不稳定的

归并排序 vs 快速排序

  • 两种排序的时间复杂度相同,O(nlogn),都很优秀
  • 归并排序空间复杂度为O(n),快速排序的空间复杂度为O(1)
  • 归并排序是稳定的,快速排序是不稳定的
  • 两种排序的使用都用了递归
  • 递归的使用方法上,归并排序是自底至上,先划分执行子任务,子任务完成后,再归并.快速排序是自顶至下,先进行partition,再划分执行子任务.

从实际使用来说,快速排序的效率更高,一般的库实现也会优先选择它.


源码地址github

相关推荐