【数据结构系列】线段树(Segment Tree)

【数据结构系列】线段树(Segment Tree)
一、线段树的定义

　　线段树，又名区间树，是一种二叉搜索树。

　　那么问题来了，啥是二叉搜索树呢？

　　对于一棵二叉树，若满足：

①它的左子树不空，则左子树上所有结点的值均小于它的根结点的值

②若它的右子树不空，则右子树上所有结点的值均大于它的根结点的值

③它的左、右子树也分别为二叉搜索树

　　那么这就是一棵二叉搜索树。

　　扯完废话，再回到线段树这里。顾名思义，线段树就是由线段构成的树，它大概长成这样：

　　对于每一棵线段树上的节点，都有三个值：左区间、右区间以及权值。（当然，在某些情况下它只有左右区间，这个时候线段树只是作为维护某个值而使用的数据结构，如扫描线）

　　线段树有一个非常重要的性质，就是当父亲节点的区间为[x,y]时，左孩子的区间就必定为[x,(x+y)/2],右孩子的区间必定为[(x+y)/2+1,y]

二、线段树的基本操作

　　常见的应用在竞赛中的操作分为：建树,单点修改,区间求和,查询区间最值,区间修改

　　我们先从建树开始讲起。

1.线段树的建树

　　线段树的建树是采用递归写法来构建的。其核心思想就是:

　　递归左子树，递归左子树的左子树...递归到左子树的叶子结点，然后回溯到叶子结点的父节点的右子树...以此类推。在每一次递归到叶子结点的时候就给该节点赋值（输入或者0之类的）。

　　建树的伪代码很容易得出:
```
1 void Build() {
2     if(是叶子节点) 赋值
3     else {
4         递归左子树;
5         递归右子树;
6     }      
7 }
```
　　那么问题出在这里:怎么判断是叶子结点？怎么递归左右子树？现在，往上翻，看看线段树的性质。至于叶子节点的判断,我们也可以利用线段树的性质。叶子结点没有子节点，那么它的左右区间必定相同(即一个点而不是一条线段)，否则可以继续向下递归。

　　另外，线段树是一棵满二叉树，所以满足满二叉树一个性质:父亲节点编号为a,那么左子树编号为2*a,右子树编号为2*a+1

　　知道了这些性质，建树就很好写了。
```
 1 /*i表示当前递归编号,l,r分别表示当前点的左右区间*/
 2 /*Tree数组是存储线段树的数组*/
 3 void Build(int i, int l, int r) {
 4      if(l == r) {
 5          scanf("%d", Tree[i])
 6          return;
 7      }
 8      int Mid = (l + r) / 2;
 9      Build(i * 2, l, Mid);
10      Build(i * 2, Mid + 1, r);
11      PushUp(i) /*这是什么?往后看*/      
12 }
```
　　怎么样？很简单吧！

2.线段树的单点修改

　　接下来来讲讲线段树最基本操作之一 -- 单点修改。(前面讲了怎么递归左右子树，这里不再赘述)

　　单点修改在题目中一般以 "给定两个数A, B,将树上第A个修改为B"的形式存在。你可能认为:"这不是很Easy吗？"，然后立马敲下了这一段代码。
```
Tree[A] = B
```
　　这么写就大错特错了！因为这里的"Tree[A]"不一定是我们需要找的那个'A'，这么写的话会导致整棵树结构被打乱。

　　特别提醒:线段树中的修改操作一定只能使用特别的操作来完成，千万不要自以为是的写一些似乎是对的代码

　　那么怎么做呢?我们来分析一下。

　　如果要找到这个点A，我们必须要递归左右子树来寻找。上面介绍了递归的方法，大家是否已经发现了这样的递归很像某一种算法?没错，就是分治(如果要理解成二分也没有问题)，那么问题就很显然了，每次都二分，如果要寻找的点A在当前区间的中点，即(l+r)/2之前，就递归左子树，否则递归右子树。那么写成伪代码是这样的
```
void Quary_Single() {
  if(找到改点) 修改
  if(查找点在当前区间前半部分) 递归左子树
  else 递归右子树  
}
```
　　这些操作我都介绍过了，那么写成真正的代码也不会很难吧。
```
 1 /*i为当前编号,L,R为左右区间,A为修改点的编号,B为修改的值*/
 2 void Update_Single(int i, int L, int R, int A, int B) {
 3     if(L == R) {
 4          /*如果找到了,修改值*/
 5          Tree[i] == B;
 6          return;
 7      }
 8      int Mid = (L + R) / 2;
 9      if(A <= Mid) Update_Single(i * 2, L, Mid, A, B); /*递归左子树*/
10      else Update_Single(i * 2 + 1, Mid + 1, R, A, B); /*递归右子树*/
11      PushUp(i); /*这是什么?往后看*/
12  }
```
　　大家应该都有一个想法吧:单点修改也不过如此。

　　的确，不过如此

3.线段树的区间求和

　　首先我要介绍一个东西，叫做 "PushUp"函数。这个函数的作用是什么呢?应该有很多人都想到了，就是将子节点的信息"传"给父亲节点。具体写起来也不难，我们可以将PushUp函数当做前缀和来处理(其实方便区间和，如果要求区间最值，PushUp函数就是处理最值了)

　　代码大约是这样:
```
/*区间最值处理*/
void PushUp(int Now) {
    Tree[Now] = Max(Tree[Now * 2], Tree[Now * 2 + 1]);
}
/*区间和处理*/
void PushUp(int Now) {
    Tree[Now] = Tree[Now * 2] + Tree[Now * 2 + 1];
}
```
　　这个东西要在什么地方加上呢?要在建树以及修改之后，也就是上述的两个操作之后。。

　那么来讲讲区间求和问题吧。区间求和其实非常简单，我们只需要查询给定的区间，然后找到这个区间里面的所有叶子结点，把叶子结点的权值加起来，得到的结果就是我们所需要的区间和。那么要PushUp干嘛呢?PushUp简化了这个过程。在原本的操作里，最差的情况是要递归一直到叶子结点，多么令人心痛的浪费时间！然而我们用PushUp预处理之后，就变成了前缀和问题，求和不就是小菜一碟吗？

　给出伪代码
```
int Quary_Total() {
    if(在查询区间内) 返回当前权值
    if(当前区间中点在查询区间的右边) 遍历左子树,并求和
    if(当前区间中点在查询区间的左边) 遍历右子树,并求和
    return 答案
}
```
　真代码不需要我多说了吧。
```
1 /*i 为当前编号, L, R为查询区间*/
2 int Quary_Total(int i, int L, int R, int l, int r) {
3      if(l >= L && r <= R) return Tree[i]; /*如果在区间内*/
4      int Mid = (L + R) / 2, Cnt = 0; /*初始化*/
5      if(L <= Mid) Cnt += Quary_Total(i * 2, L, R, l, Mid); /*递归左子树*/
6      if(R > Mid)  Cnt += Quary_Total(i * 2 + 1, L, R, Mid + 1, r); /*递归右子树*/
7      return Cnt;
8  }
```
　　就是这么简单。

4.线段树的区间最值

　其实区间最值完全可以放在区间和里面讲的，因为写法几乎一样，唯一不同的是PushUp的方式以及判断的方式。因为在PushUp的时候预处理每一棵子树的最值，所以真正处理区间时只要把上面一层扫过去就可以了。

　真代码直接上:)
```
int Quary_RMQ(int i, int L, int R, int l, int r) {
     if(l >= L && r <= R) return Tree[i];
     int Mid = (L + R) / 2, Cnt = 0;
     int A, B;
     A = Quary_RMQ(i * 2, L, R, l, Mid);
     B = Quary_RMQ(i * 2 + 1, L, R, Mid + 1, R);
     return Max(A, B); /*返回最大值*/
 }
```
　那么线段树的四大基本操作就这么讲完了

三、线段树的优势和劣势

　　线段树的优势和劣势都很明显。

优势:时间快,操作多

　　线段树的优势首先是时间快，上文也讲过，线段树的所有操作都是基于分治算法，再经过PushUp优化，整个算法就变得十分稳定。比起一般的数组暴力算法，线段树是明显更优的。看下表就知道

　　当然，在一些时候它也会劣于下面两种算法，不过是在极少数时候。

　另外，它操作多样化，比起树状数组，多了区间最值一种操作。　　

劣势:空间浪费

　　上面也介绍过了,线段树一直是一棵满二叉树，所以无论如何，它所开的空间必须是四倍。但是在某些情况，线段树会浪费三倍的空间(只有一条链等),但你又不能省掉这三倍空间，还是得苦逼的开四倍。

　　和树状数组比起来，一棵普通的线段树是树状数组空间的四倍。

四、总结

　　线段树是一种区间存储结构，操作基本都有一个固定的模板，所以对于OIer的编码能力要求并不强，只要掌握了，基本就是小菜一碟。只要注意空间上的问题，其他都没什么困难的。

　谢谢大家的收看！如有不对之处请指出！ :)

　　本文作者: $xiaoyao24256$
相关阅读:
c#子类序列化与父类序列化（Serializable）的区别
 eclipse中启动项目报内存溢出问题通过修改配置解决
 java 代码的良好习惯
 s:iterator 标签使用错误记录
 html5 required属性的注意事项
 赋值文件夹名称为日期的doc命令
 cmd命令中截取日期字符
 s:if 标签字符串比较正确用法和错误用法
 Resource interpreted as Stylesheet but transferred with MIME type text/plain
xmind指定32位jdk解决在64位系统上不能启动的问题
原文地址：https://www.cnblogs.com/xiaoyao24256/p/6590885.html

【数据结构系列】线段树(Segment Tree)

一、线段树的定义

二、线段树的基本操作

1.线段树的建树

2.线段树的单点修改

3.线段树的区间求和

4.线段树的区间最值

三、线段树的优势和劣势

优势:时间快,操作多

劣势:空间浪费

四、总结