线性排序算法-计数排序

朱雀 2022-11-09 15:29 262阅读 0赞

我们前面分析过几种排序算法,时间复杂度为O(n^\{2\})如冒泡排序,插入排序和选择排序等,时间复杂度为O(nlogn),如归并排序和快速排序等,接下来我们来分析一种时间复杂度为O(n)的排序算法。既然存在排序时间复杂度为O(n)的算法,为什么我们还要去分析时间复杂度更高的算法?我们知道每一种排序算法其实都有其限制条件和适用场景。其实计数排序虽然时间复杂度为O(n),但是这种算法有其先决条件,接下来我们来分析下

当要排序的 n 个数据,所处的范围并不大的时候,比如最大值是 k,我们就可以把数据划分成 k 个桶。每个桶内的数据值都是相同的,这样我们遍历一遍数据,把数据划分到每一个桶内,就可以避免桶内的元素再进行排序了。

我们大家都经历过考试,高考时有几千万学生,总成绩都是750分,如果现在要求我们要根据考生的实际分数进行排名。对于这个问题,我们使用计数排序就比较适合,分数有范围范围,0-750。对于这个问题,我们就可以定义750个桶,然后遍历一遍考生的成绩列表,按照分数的大小依次放入相应的桶中,再从桶中依次取出就可以了。接下来我们以一个比较小的数据范围来进行说明,比如成绩在0-5分之间,考生人数是8个。成绩如下。第一个考生的成绩是2分,第二个考生的成绩是5分,依次类推。。

2021031522500688.png

对于这个分数,我们就可以定义6个桶,编号分别为0-5,如下图所示

20210315224743479.png

然后我们遍历一遍考生,把每个分数对应多少考生记录到数组中,如下图。比如,分数为0分的考生有2个,分数为1分的考生有0个,依次类推。

20210315225030349.png

从图中可以看出,分数为 3 分的考生有 3 个,小于 3 分的考生有 4 个,所以,成绩为 3 分的考生在排序之后的有序数组中,会保存下标 4,5,6 的位置。

20210315225631306.png

那我们如何快速计算出,每个分数的考生在有序数组中对应的存储位置呢?这个处理方法非常巧妙,很不容易想到。思路是这样的:我们对桶对应的数组 C 数组顺序求和,C 数组 存储的数据就变成了下面这样子。C[k]里存储小于等于分数 k 的考生个数。

20210315225805170.png

得到前面的数据后,我们从后到前依次扫描待排序的数组 A。比如,当扫描到 3 时,我们可以从数组 C 中取出下标为 3 的值 7,也就是说,到目前为止,包括自己在内,分数小于等于 3 的考生有 7 个,也就是说 3 是数组 R 中的第 7 个元素(也就是数组 R 中下标为 6 的位置)。当 3 放入到数组 R 中后,小于等于 3 的元素就只剩下了 6 个了,所以相应的 C[3]要减 1,变成 6。以此类推,当我们扫描到第 2 个分数为 3 的考生的时候,就会把它放入数组 R 中的第 6 个元素的位置(也就是下标为 5 的位置)。当我们扫描完整个数组 A 后,数组 R 内的数据就是按照分数从小到大有序排列的了。

起始时指针指向最后一个元素,经过处理后元素状态如下图

2021031523083174.png

接下来指针向前移动一个元素。如下图所示

20210315231145352.png

指针再继续往前移动一位 C[3] = 6,所以 R[5] = 3 ,同时执行C[3] = C[3] -1

20210315231305231.png

指针再往前移动一位。指针指向的位置为2,C[2] = 4,所以赋值R[3] = 2,同时C[2] = C[2] - 1 ,等于3.

20210315231539155.png

经过一系列的变动,最终变为如下状态,最终R中的数据就是有序的了,把R的数据拷贝会A就可以了。

202103152322207.png

经过上面的分析,代码如下。

  1. public static void countingSort(int[] nums) {
  2. if (nums == null || nums.length == 0) return;
  3. int n = nums.length;
  4. // 查找数组中数据的范围
  5. int max = nums[0];
  6. for (int i = 1; i < n; ++i) {
  7. if (max < nums[i]) {
  8. max = nums[i];
  9. }
  10. }
  11. int[] c = new int[max + 1]; // 申请一个计数数组c,下标大小[0,max]
  12. for (int i = 0; i <= max; ++i) {
  13. c[i] = 0;
  14. }
  15. // 计算每个元素的个数,放入c中
  16. for (int i = 0; i < n; ++i) {
  17. c[nums[i]]++;
  18. }
  19. // 依次累加
  20. for (int i = 1; i <= max; ++i) {
  21. c[i] = c[i - 1] + c[i];
  22. }
  23. // 临时数组r,存储排序之后的结果
  24. int[] r = new int[n];
  25. // 计算排序的关键步骤,有点难理解
  26. for (int i = n - 1; i >= 0; --i) {
  27. int index = c[nums[i]] - 1;
  28. r[index] = nums[i];
  29. c[nums[i]]--;
  30. }
  31. // 将结果拷贝给a数组
  32. for (int i = 0; i < n; ++i) {
  33. nums[i] = r[i];
  34. }
  35. }

这种利用另外一个数组来计数的实现方式是不是很巧妙呢?这也是为什么这种排序算法叫计数排序的原因。

计数排序只能用在数据范围不大的场景中,如果数据范围 k 比要排序的数据 n 大很多,就不适合用计数排序了。而且,计数排序只能给非负整数排序,如果要排序的数据是其他类型的,要将其在不改变相对大小的情况下,转化为非负整数。

比如,还是拿考生这个例子。如果考生成绩精确到小数后一位,我们就需要将所有的分数都先乘以 10,转化成整数,然后再放到 9010 个桶内。再比如,如果要排序的数据中有负数,数据的范围是[-1000, 1000],那我们就需要先对每个数据都加 1000,转化成非负整数。

参考:https://time.geekbang.org/column/article/42038

发表评论

表情:
评论列表 (有 0 条评论,262人围观)

还没有评论,来说两句吧...

相关阅读

    相关 线性排序算法计数排序

    线性排序 时间复杂度是线性的,所以我们把这类排序算法叫作线性排序(Linear sort),桶排序、计数排序、基数排序就是常见的线性排序,之所以能做到线性,他们不是通过比

    相关 排序算法 - 计数排序

    基本思想 计数排序是一种线性排序算法,它利用了一个数组,因为数组下标的增长是线性的,所以它就把自己的元素转换成新开辟数组的下标。可是下标都是非负数啊?数组当中的值有正有负

    相关 排序算法计数排序

    \[非比较排序-计数排序\] 1.算法思想 计数排序要求数据必须是有确定范围的整数,需要定义一个新的数组,新数组的长度是根据原数组最大值和最小值来确定的,该数组用

    相关 排序算法——计数排序

    排序算法——计数排序 > 计数排序是一个非基于比较的排序算法。它的优势在于在对一定范围内的整数排序时,快于任何比较排序算法。 这是一种牺牲空间换取时间的做法,当O(k)>

    相关 线性排序算法-计数排序

    我们前面分析过几种排序算法,时间复杂度为O(![n^\{2\}][n_2])如[冒泡排序,插入排序和选择排序][Link 1]等,时间复杂度为O(nlogn),如[归并排序][

    相关 排序算法 —— 计数排序

    引言 计数排序是桶排序思想的一种具体实现,针对一些具有特殊限制的样本数据,如公司员工年龄,那么样本数据本身就一定在0~200之间,针对这样的数据,使用从0到200 的桶数

    相关 排序算法——计数排序

    前言 计数排序的思想:在给定的数组中,依次寻找比当前数字小的元素的个数(count),统计之后直接使用t就可以定位到该数所在的位置,因为比它小的元素的个数已经通过coun