希尔排序是基于插入排序的一个优化。可以使平均时间复杂度减少为O(n * log2(n))。
例题
洛谷1177 排序
题目描述
将读入的 N 个数从小到大排序后输出。
输入格式
第 1 行为一个正整数 N。
第 2 行包含 N 个空格隔开的正整数 a[i],为你需要进行排序的数,数据保证了a[i]不超过10^9。
输出格式
将给定的 N个数从小到大输出,数之间用空格隔开。
输入输出样例
输入
5
4 2 4 5 1
输出
1 2 4 4 5
说明提示
对于20% 的数据,有 N <= 10^3。
对于100% 的数据,有 N <=10^5 。
希尔排序
这里我们定义一个新的变量gap表示增量,意思是每次将a[1] ~ a[n] 分为gap组:
第1组:a[1],a[gap + 1],a[2 * gap + 1] ……
第2组:a[2],a[gap + 2],a[2 * gap + 2] ……
第3组:a[3],a[gap + 3],a[2 * gap + 3] ……
……………………………………………………
第gap组:a[gap],a[gap + gap],a[2 * gap + gap] ……
之后分别对这gap组进行插入排序,就可以让序列中变得比之前更加有序。
gap刚开始往往取(n / 2),之后每次让gap /= 2,直到gap == 0了就停止。这里可能相对来说比较难理解,你可以自己动手去分析一下样例。
最后算一下这个算法的时间复杂度:我们需要先枚举gap,再去枚举i和j,总共有三重循环。第一重循环每次是gap /= 2,跑了大约log2(n)次,而第二重循环跑了大约n次。但第三重循环实际上很快,常数次就跑完了,因为每次分完组,都会使这个序列变得更加有序,第三重循环去插入的时候跑了几次就跳出去了。所以综合起来平均的时间复杂度也就O(n * log2(n))级别,相对于插入排序就快了很多了。
这里有一个坑点务必注意:在写j这个循环时,判断是否跳出循环的语句中一定要把j >= 1 放在a[j] > a[j + gap]前面。
for (int j = i - gap; j >= 1 && a[j] > a[j + gap]; j -= gap) // 正确
for (int j = i - gap; a[j] > a[j + gap] && j >= 1; j -= gap) // 错误
因为如果说我的j -= gap后万一变成了负数,那么a[j]就没有意义了,而&&运算是先去判断前面的语句,如果前面的语句正确才去判断后面的语句,否则不会去判断后面的语句。
这样如果是第一行的for循环,当j变成负数后,先判断出j >= 1是假的,根据&&符号的运算法则,不回去判断a[j] > a[j + gap],是正确的。
而如果是第二行的for循环,当j变成负数后,会先去判断a[j] > a[j + gap],可j是负数,a[j]根本没有意义,就成功RE了。
代码
# include <cstdio>
# include <cmath>
# include <cstring>
# include <algorithm>
using namespace std;
const int N_MAX = 100000;
int n;
int a[N_MAX + 10];
void shellSort()
{
for (int gap = n / 2; gap >= 1; gap /= 2)
for (int i = gap + 1; i <= n; i++)
for (int j = i - gap; j >= 1 && a[j] > a[j + gap]; j -= gap)
swap(a[j], a[j + gap]);
}
int main()
{
scanf("%d", &n);
for (int i = 1; i <= n; i++)
scanf("%d", &a[i]);
shellSort();
for (int i = 1; i <= n; i++)
printf("%d ", a[i]);
printf("
");
return 0;
}