大O复杂度表示法
大O复杂度表示法,表示代码执行时间随数据规模增长的变化趋势,也叫作渐进时间复杂度,简称时间复杂度。
时间复杂度分析
1. 只关注循环执行次数最多的一段代码
T(n)=O(2+n+1)=O(n)
2. 加法法则:总复杂度等于量级最大的那段代码的复杂度
如果T1(n)=O(f(n)),T2(n)=O(g(n));那么T(n)=T1(n)+T2(n)=max(O(f(n)), O(g(n)))=O(max(f(n), g(n)))
3. 乘法法则:嵌套代码的复杂度等于嵌套内外代码的复杂度的乘积
如果T1(n)=O(f(n)),T2(n)=O(g(n));那么T(n)=T1(n)*T2(n)=O(f(n))*O(g(n))=O(f(n)*g(n))
常见时间复杂度实例分析
1. O(1)
一般情况下,只要算法中不存在循环语句、递归语句,即使有成千上万行的代码,其时间复杂度也是Ο(1)。
2. O(logn)、O(nlogn)
非常常见的算法时间复杂度,比如归并排序、快速排序的时间复杂度是O(nlogn)
3.O(m+n)、O(m*n)
代码复杂度由两个数据的规模决定。
空间复杂度分析
全称是渐进空间复杂度,表示算法的存储空间与数据规模之间的增长关系。
常见的空间复杂度有O(1)、O(n)、O(n2)
最好、最坏情况时间复杂度
// n表示数组array的长度 int find(int[] array, int n, int x) { int i = 0; int pos = -1; for (; i < n; ++i) { if (array[i] == x) pos = i; } return pos; }
以上代码是无序数组里查找变量x的位置 ,时间复杂度是O(n)
代码进行优化后:
// n表示数组array的长度 int find(int[] array, int n, int x) { int i = 0; int pos = -1; for (; i < n; ++i) { if (array[i] == x) { pos = i; break; } } return pos; }
最好情况时间复杂度是第一个元素刚好是要查找的变量x,这时候的时间复杂度是O(1),如果数组里不存在变量x,那么时间复杂度是O(n)。
最好情况时间复杂度:在最理想的情况下,执行这段代码的时间复杂度。
最坏情况时间复杂度:在最糟糕的情况下,执行这段代码的时间复杂度。
平均情况时间复杂度
按上面的例子,把所有情况(有n+1种):在数组的0~n-1位置中和不在数组中,把每种情况查找要遍历的元素个数累加起来,再除以n+1,就是平均遍历的元素个数的平均值:
时间复杂度的大O标记法中,可以省略掉系数、低阶、常量,所以,公式简化之后,得到的平均时间复杂度就是O(n)。
实际上还要考虑每种情况的出现的概率,比如每种情况出现的概率都是1/2,那么平均时间复杂度的推导公式:
引入概率之后,前面那段代码的加权平均值为(3n+1)/4。用大O表示法来表示,去掉系数和常量,这段代码的加权平均时间复杂度仍然是O(n)。
均摊时间复杂度
// array表示一个长度为n的数组 // 代码中的array.length就等于n int[] array = new int[n]; int count = 0; void insert(int val) { if (count == array.length) { int sum = 0; for (int i = 0; i < array.length; ++i) { sum = sum + array[i]; } array[0] = sum; count = 1; } array[count] = val; ++count; }
这段代码实现了一个往数组中插入数据的功能。当数组满了,就把数组里的求和,并清空数组,然后将求和放在数组的第一位。
最好情况时间复杂度:O(1)
最坏情况时间复杂度:O(n)
平均情况时间复杂度:O(1)。假设数组元素个数从0~n的概率一样,即1/(n+1),那平均情况时间复杂度公式如下:
均摊时间复杂度:
看上面的例子(插入数据),每一次O(n)的插入操作,都会跟着n-1次O(1)的插入操作,把耗时多的那次操作均摊到接下来的n-1次耗时少的操作上,均摊下来的均摊时间复杂度是O(1)。
均摊时间复杂度是一种特殊的平均时间复杂度。
课后思考:
1、有人说,我们项目之前都会进行性能测试,再做代码的时间复杂度、空间复杂度分析,是不是多此一举呢?而且,每段代码都分析一下时间复杂度、空间复杂度,是不是很浪费时间呢?你怎么看待这个问题呢?
相对于做性能测试,时间复杂度、空间复杂度分析更加便捷、不需要额外的资源。在代码层面就已经做出判断,时间复杂度和空间复杂度不达标,重写代码即可。
而且性能测试是受测试环境影响,配置不一样,得出的结果不一样。
2、用今天学习的知识,来分析一下,下面这个add()函数的时间复杂度。
// 全局变量,大小为10的数组array,长度len,下标i。 int array[] = new int[10]; int len = 10; int i = 0; // 往数组中添加一个元素 void add(int element) { if (i >= len) { // 数组空间不够了 // 重新申请一个2倍大小的数组空间 int new_array[] = new int[len*2]; // 把原来array数组中的数据依次copy到new_array for (int j = 0; j < len; ++j) { new_array[j] = array[j]; } // new_array复制给array,array现在大小就是2倍len了 array = new_array; len = 2 * len; } // 将element放到下标为i的位置,下标i加一 array[i] = element; ++i; }
最好时间复杂度:O(1)
数组空间不满,直接插入。
最坏时间复杂度:O(n)
数组空间满了,复制数组。
平均时间复杂度:O(1)
假设数组元素个数(0~n)的概率相同(1/n+1),那么计算公式为:
1/(n+1)+1/(n+1)+.......+n/(n+1)=2n/(n+1)=O(1)
均摊时间复杂度:O(1)
每次的复制数组操作(O(n))都有n次的直接插入的操作(O(1)),均摊后是O(1)