普林斯顿大学算法课 Algorithm Part I Week 3 排序算法复杂度 Sorting Complexity

普林斯顿大学算法课 Algorithm Part I Week 3 排序算法复杂度 Sorting Complexity
计算复杂度（Computational complexity）：用于研究解决特定问题X的算法效率的框架

计算模型（Model of computation）：可允许的操作（Allowable operations）

成本模型（Cost model）：操作数（Operation counts）

复杂度上界（Upper bound）：保证能在一定的时间内解决

复杂度下界（Lower bound）：通过数学方法证明，必须花费的最少时间

最优算法（Optimal algorithm）：可能达到的最小复杂度的算法（Algorithm with best possible cost guarantee for X），通常介于复杂度上界和下界之间

举例：排序

决策树模型：

有三个不同的元素a b c，通过比较的方式来得出排序结果。那么它的决策树为下图所示

树的高度代表了最差情况下需要比较的次数。
树的宽度代表了可能的排列顺序。

命题

任何基于比较的排序算法在最坏情况下至少要lg(N!) ~ N lgN 次比较。

证明
1. 假设数组由N个不同的值组成，从a1到an
2. 最坏情况由决策树的高度决定
3. 二叉树最多可能的叶子节点数是2^h
4. 因为数组有N!中不同的排序方式，所以至少有N!个叶子节点
结论

计算模型：决策树（decision tree）

成本模型：比较（compares）

上界：使用归并排序可以达到NlgN复杂度

下界：NlgN

最优算法：归并排序

归并算法的时间上界达到排序算法的时间下界；但耗费过多内存空间，从内存占用方面来讲并不是最优的。

影响排序复杂性的因素
- 输入的起始顺序
  - 如果输入较为有序，则我们可能不需要NlgN次的比较（在数组完全有序的情况下，插入排序只要比较N-1次）
- 重复元素
  - 如果输入带有重复元素，则我们可能不需要NlgN次的比较（使用3路快排（3-way quicksort））
- 元素的数字属性（Digital properties of keys）：我们可以用数字/特征比较（digit/character compares）来代替值比较（key compares）对数字和字符串进行比较
基于这些因素，可以根据数据的性质，来选择合适的排序算法。　　　　　　　
相关阅读:
python字符串的常用方法
 python基础之数据类型
 python自定义带参数和不带参数的装饰器
 python中logging结合pytest打印日志
 本地的项目上传到gitee仓库步骤--适合小白上手
 Python中的分数运算
 2018年6月23日开通我的Python学习博客
 python多版本兼容性问题：当同时安装Python2和Python3后，如何兼容并切换
 github之关联远程仓库
 SHH验证
原文地址：https://www.cnblogs.com/Jimtastic/p/4003517.html