让我们来谈谈数的排序思维:
计数排序假定待排序的全部元素都是介于0到K之间的整数。计数排序使用一个额外的数组countArray。当中第i个元素是待排序数组array中值等于i的元素的个数。然后依据数组countArray来将array中的元素排到正确的位置。
算法的步骤例如以下:
- 找出待排序的数组中最大和最小的元素
- 统计数组中每一个值为i的元素出现的次数,存入数组countArray的第i项
- 对全部的计数累加(从countArray中的第一个元素開始,每一项和前一项相加)
- 反向填充目标数组:将每一个元素i放在新数组的第countArray[i]项。每放一个元素就将countArray[i]减去1
稳定性和复杂度:
计数排序是稳定的排序算法;平均时间复杂度、最优时间复杂度和最差时间复杂度都为O(n+k),空间复杂度为O(n+k)。当中,n为待排元素个数,k为待排元素的范围(0~k)。
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <time.h> #include <assert.h> #define RANDMAX 1000000 #define RANDMIN 900000 void getRandArray(int array[], int size); void countSort(int array[], int size); void isSorted(int array[], int size); int main(int argc, char const *argv[]) { int size = 0; scanf("%d", &size); assert(size > 0); int *array = (int *)calloc(size, sizeof(int)); getRandArray(array, size); clock_t begin; clock_t end; begin = clock(); countSort(array, size); end = clock(); //打印排序所花费的时间。在linux下单位为ms printf("%ld ", (end - begin) / 1000); isSorted(array, size); free(array); return 0; } //利用伪随机数填充数组array。伪随机数的范围在RANDMIN~RANDMAX-1之间 void getRandArray(int array[], int size) { assert(array != NULL && size > 0); srand((unsigned) time(NULL)); int i = 0; for (i = 0; i < size; ++i) { array[i] = rand() % (RANDMAX - RANDMIN) + RANDMIN ; } } //从小到大进行排序 void countSort(int array[], int size) { assert(array != NULL && size > 0); //计数数组,用于统计数组array中各个不同数出现的次数 //由于数组array中的数属于0...RANDMAX-1之间,所以countArray的大小要够容纳RANDMAX个int型的值 int *countArray = (int *) calloc(RANDMAX, sizeof(int)); //用于存放已经有序的数列 int *sortedArray = (int *) calloc(size, sizeof(int)); //统计数组array中各个不同数出现的次数,循环结束后countArray[i]表示数值i在array中出现的次数 int index = 0; for (index = 0; index < size; ++index) { countArray[array[index]]++; } //统计数值比index小的数的个数。循环结束之后countArray[i]表示array中小于等于数值i的元素个数 for (index = 1; index < RANDMAX; ++index) { countArray[index] += countArray[index - 1]; } for (index = size - 1; index >= 0; --index) { //由于数组的起始下标为0。所以要减一 sortedArray[countArray[array[index]] - 1] = array[index]; //这里减一是为了保证当有多个值为array[index]的元素时,后出现的值为array[index]的元素 //放在后面,也就是为了保证排序的稳定性 --countArray[array[index]]; } memcpy(array, sortedArray, size * sizeof(int)); free(sortedArray); free(countArray); } //推断数组array是否已经是有序的 void isSorted(int array[], int size) { assert(array != NULL && size > 0); int unsorted = 0; int i = 0; for (i = 1; i < size; ++i) { if (array[i] < array[i - 1]) { unsorted = 1; break; } } if (unsorted) { printf("the array is unsorted! "); } else { printf("the array is sorted! "); } }
计数排序是非比較的排序算法,据说其排序速度要快于不论什么的比較排序算法(我还未验证,可是在排序100000000个10000以内的数时花费为606毫秒,而C语言的qsort函数则为10802毫秒,由此可见一斑),因为计数排序须要一个计数数组以及一个存放有序数列的数组。故计数排序对内存的要求比較高。
------------------------------------------------------------------更新------------------------------------------------------------------
2014年10月20日
以上的实现有两个问题:
1、比較耗费内存:假设元素值的范围在9百万~1千万之间。上面的实现中countArray的大小须要1千万,而实际出现的不同值的元素就仅仅有1千万-9百万=1百万,也就是说用上面的实现会导致countArray中有90%的空间没有被利用,这个是非常浪费内存空间的!
尽管这个样例比較极端可是在详细应用面前还是须要注意!
2、不能出现负数:假设元素值中有负数。就不能用上面的实现方法了,由于counArray的下标是待排数组的元素值,所以上面的实现不能排序包括负数的数列。
解决方法:
1、第一个问题好解决:仅仅要首先一次遍历待排数组。找出最大值和最小值(眼下我所知的比較快的方法是时间复杂度为O(1.5n)的方法)。然后分配大小为(max-min+1)*sizeof(int)的空间给countArray即可了。至于统计的方法就得改变一点点了:
//从小到大进行排序,节省空间的版本号 void countSort2(int array[], int size) { assert(array != NULL && size > 0); int min; int max; getMinAndMax(array, size, &min, &max); // printf("max - min + 1 = %d ", max - min + 1); int countArraySize = max - min + 1; //计数数组,用于统计数组array中各个不同数出现的次数 int *countArray = (int *) calloc(countArraySize, sizeof(int)); //用于存放已经有序的数列 int *sortedArray = (int *) calloc(size, sizeof(int)); //统计数组array中各个不同数出现的次数。循环结束后countArray[i]表示数值i+min在array中出现的次数 int index = 0; for (index = 0; index < size; ++index) { countArray[array[index] - min]++; } //统计数值比index小的数的个数。循环结束之后countArray[i]表示array中小于等于数值i+min的元素个数 for (index = 1; index < countArraySize; ++index) { countArray[index] += countArray[index - 1]; } for (index = size - 1; index >= 0; --index) { //由于数组的起始下标为0。所以要减一 sortedArray[countArray[array[index] - min] - 1] = array[index]; //这里减一是为了保证当有多个值为array[index]的元素时。后出现的值为array[index]的元素 //放在后面,也就是为了保证排序的稳定性 --countArray[array[index] - min]; } memcpy(array, sortedArray, size * sizeof(int)); free(sortedArray); free(countArray); } //待优化 void getMinAndMax(int array[], int size, int *min, int *max) { assert(array != NULL && size > 0); if (size == 1) { *min = *max = array[0]; return ; } *min = array[0]; int index; for (index = 1; index < size; ++index) { if (array[index] < *min) { *min = array[index]; } } *max = array[0]; for (index = 1; index < size; ++index) { if (array[index] > *max) { *max = array[index]; } } }
这样的方法能够改进在元素值范围比較小的数列的排序时间(在大部分情况时间较短)和空间复杂度。因为仅仅是为了验证想法的可行性,就没有在查找最值的函数上下功夫优化。等以后有时间了。再进一步优化。
2、第二个问题:刚刚在洗漱的时候忽然想到了一个可行的方法:先一次遍历待排数组,找出负数中的最大值和最小值。正数中的最大值和最小值。创建两个计数数组,negativeCountArray用来统计待排数组中各个不同负数的出现个数,positiveCountArray用来统计待排数组中各个正数出现的个数,先统计总的负数的个数。然后再统计各个不同正数的个数,然后在往sortedArray中放元素的时候对正数和负数差别对待。这样就能让计数排序对包括负数的数列进行排序了。
代码例如以下:
//从小到大进行排序。节省空间,可排序负数的版本号 void countSort3(int array[], int size) { assert(array != NULL && size > 0); int negativeMin; int negativeMax; int positiveMin; int positiveMax; _getMinAndMax(array, size, &negativeMin, &negativeMax, &positiveMin, &positiveMax); int positiveCountArraySize = positiveMax - positiveMin + 1; int negativeCountArraySize = negativeMax - negativeMin + 1; //计数数组,用于统计数组array中各个不同数出现的次数 int *positiveCountArray = (int *) calloc(positiveCountArraySize, sizeof(int)); int *negativeCountArray = (int *) calloc(negativeCountArraySize, sizeof(int)); //用于存放已经有序的数列 int *sortedArray = (int *) calloc(size, sizeof(int)); //统计数组array中各个不同的数出现的次数,循环结束后positiveCountArray[i]表示数值i+positiveMin>=0在array中出现的次数 //negativeCountArray[i]表示数值i+negativeMin<0在array中出现的次数 int index = 0; for (index = 0; index < size; ++index) { if (array[index] < 0) { negativeCountArray[array[index] - negativeMin]++; } else { positiveCountArray[array[index] - positiveMin]++; } } //统计数值比index+negativeMin小的负数的个数。循环结束之后negativeCountArray for (index = 1; index < negativeCountArraySize; ++index) { negativeCountArray[index] += negativeCountArray[index - 1]; } int negativeCount = negativeCountArray[index - 1];//负数的总数 //统计数值比index小的非负数数的个数,循环结束之后positiveCountArray[i]表示array中小于等于数值i的值为非负数的元素个数 for (index = 1; index < positiveCountArraySize; ++index) { positiveCountArray[index] += positiveCountArray[index - 1]; } for (index = size - 1; index >= 0; --index) { if (array[index] < 0) { sortedArray[negativeCountArray[array[index] - negativeMin] - 1] = array[index]; --negativeCountArray[array[index] - negativeMin]; } else { //因为非负数总是比负数来的大,所以在把正数放到sortedArray时要在下标上加上负数的总个数 sortedArray[positiveCountArray[array[index] - positiveMin] - 1 + negativeCount] = array[index]; --positiveCountArray[array[index] - positiveMin]; } } memcpy(array, sortedArray, size * sizeof(int)); free(sortedArray); free(positiveCountArray); free(negativeCountArray); } //待优化 void _getMinAndMax(int array[], int size, int *negativeMin, int *negativeMax, int *positiveMin, int *positiveMax) { assert(array != NULL && size > 0); if (size == 1) { *negativeMin = *negativeMax = *positiveMin = *positiveMax = array[0]; return ; } int firstNegative = 0; int firstPositive = 0; int index; for (index = 0; index < size; ++index) { if (array[index] < 0) { firstNegative = array[index]; } } for (index = 0; index < size; ++index) { if (array[index] > 0) { firstPositive = array[index]; } } *negativeMin = firstNegative; *positiveMin = firstPositive; for (index = 0; index < size; ++index) { if (array[index] < 0 && array[index] < *negativeMin) { *negativeMin = array[index]; } if (array[index] > 0 && array[index] < *positiveMin) { *positiveMin = array[index]; } } *negativeMax = firstNegative; *positiveMax = firstPositive; for (index = 0; index < size; ++index) { if (array[index] < 0 && array[index] > *negativeMax) { *negativeMax = array[index]; } if (array[index] > 0 && array[index] > *positiveMax) { *positiveMax = array[index]; } } }
因为仅仅是为了验证想法的可行性,就没有在查找最值的函数上下功夫优化,等以后有时间了。再进一步优化。
其它八种排序算法的博客:
版权声明:本文博客原创文章,博客,未经同意,不得转载。