概述
集群和分布式都是从集中式进化而来的。分布式和集群会相互合作的,同时的集群和分布式。在这里重点说说集群
集群是什么?
集群能提高单位时间内处理的任务数量,提升服务器性能
有多台服务器去处理任务,但是每个任务都是由一台服务器独立完成的
分布式是什么?
分布式能缩短单个任务处理的时间
跟集群一样,也有多台服务器去处理任务,但是每个任务由多台服务器合作完成,每台服务器负责完成大任务中的一个小任务
集中式是什么?
集中式就是最传统的那种,所有任务由一台大机完成
集群场景
可以在一台物理服务器上集群多个应用服务器,每个应用服务器独立工作。再在前端分配一个中央控制服务器,负责把发送到这台物理服务器的请求,按照一定权重分发给各个应用服务器。
例子
以tomcat为例子,可以采用1*apache+N*tomcat的模式
apache作为门面,在前端用负载均衡把请求发给各个tomcat服务器
好处
通常集群32位的服务器来代替单个64位的服务器,这样能尽量发挥出硬件的性能
- 在64位的程序中,由于指针膨胀以及内存对齐,会造成内存浪费。
- 在单个64位的服务器宕机的时候,所产生的快照很大,不好分析
- 大内存的服务器,意味着要对更大的内存区域进行垃圾收集,那么会增大GC的时间,会加长服务器的停顿
难点
由于http请求是无状态的,那么对于会话级别的事务,如何保持用户的状态?
在单个服务器中,提供了session-sessionID的机制来保存用户的状态
那么现在有多台服务器,如何记录用户的状态?
有两个大方向:
- session粘性
- 共享session
session粘性
这种方式也成为亲和式集群,给session创造粘性,意思是让用户每次都访问的同一个应用服务器
这样就要在前端服务器apache中记录下,用户首次访问的是哪个tomcat,将用户后面发送的请求都发送到这个tomcat上去
这样带来的后果是,各个服务器负载不均衡,因为只在用户首次访问的时候,采用了负载均衡分发,但是这个影响也不会那么明显
worker.controller.sticky_session=true|false
worker.controller.sticky_session_force=true|false
这是在apache对于session粘性的配置
worker.controller.sticky_session,为true会开启session粘性机制,为false关闭
worker.controller.sticky_session_force,为true意味着即使这个服务器宕机了,也仍然发送到这个服务器,为false则会选择发送其他到其他服务器
建议选择前者为true,后者为false。这样既能达到session粘性,又能在服务器宕机的时候继续提供服务
优点:
- 占用的内存少,因为只记录了sessionID以及对应发送的服务器
缺点:
- 如果服务器宕机了,在这个服务器上的session信息都会丢失
同步session
这种方式需要在一个地方存放session的所有信息,并且能让每个服务器节点都能访问得到这些session
这种方式大概有三种方案:
- cookie同步
- 数据库同步
- 内存数据库同步
cookie同步
cookie同步是将session的所有信息存放在客户端,每次请求的时候,将session也发送上来
优点:
- 不占用服务器内存
- 服务器宕机不会丢失session信息
缺点:
- 放在客户端,不安全
- 受浏览器的限制,浏览器禁用cookie
- 增大流量,变相拉低响应时间
- session序列化和反序列都需要额外的时间
数据库同步
将session信息存放在一个都能访问到的数据库
优点:
- 服务器宕机不会丢失session信息
缺点:
- 占用的内存大
- 增大数据库负担
- session序列化和反序列都需要额外的时间
- 访问数据库会需要额外的时间
内存数据库同步
将session信息存放在一个都能访问到的内存数据库中,比如redis、memcached
优点:
- 服务器宕机不会丢失session信息
- 访问的速度快
缺点:
- 占用内存大
- session序列化和反序列都需要额外的时间
总结
session同步最好的是第三种,内存数据库同步
session同步的好处是不怕单个服务器宕机,但是他占用的资源、速度也比session粘性要大
缺点
- 节点对共享资源的竞争,如磁盘文件
- 节点对同一资源进行操作带来的问题,如对同一文件进行读写
- 32位的节点受最大内存的限制
- 节点内资源池的闲置。如连接池,可能会出现某些节点的连接池用满,某些节点还有可用连接。可以考虑配置同一资源池,集中式JNDI
- 节点内的本地缓存重复,因为每份节点都有一份本地缓存。可以考虑采用缓存数据库统一存放缓存,如redis
- 浪费内存,节点越多,重复加载的类越多,jvm中的方法区内容差不多,但是每个节点都有一份。