一、什么是分布式系统
分布式系统是建立在网络之上的系统。分布式系统背后是由一系列的计算机组成的,但用户感知不到背后的逻辑,就像访问单个计算机一样。
特征:
-
最开始一台服务器上存储着文件,数据,应用程序。随着流量的增多,瓶颈出现,应用程序需要更快CPU,数据库服务器要更大内存(缓存)和硬盘,文件服务器要更大硬盘,便将三个功能分离到各自服务器。
-
为了提高速度,将常用数据放到缓存中,缓存又分本地缓存和分布式缓存。
-
缓解服务器压力,采用集群,并通过负载均衡服务器调度不同的应用服务器。
-
除了缓存外仍有大量数据直接访问数据库服务器,这时便采用读写分离。
-
使用CDN,反向代理加速网站响应,CDN可从距离自己最近的网络提供商机房获取数据,如果反响代理中缓存着用户请求的资源则直接返回给用户。
-
分布式数据库,是数据库拆分的最后手段,按照不同业务拆分
-
业务越来越复杂采用分布式服务,传统的SOA架构。
二、分布式架构的演进
1. 单体应用-All in one
特征:应用程序、数据库、文件等所有的资源都在一台服务器上。
缺陷:发现随着系统访问量的再度增加,webserver机器的压力在高峰期会上升到比较高,这个时候开始考虑增加一台webserver。
2. 应用服务和数据服务分离
特征:应用程序、数据库、文件分别部署在独立的资源上。
3. 使用缓存改善性能
特征:数据库中访问较集中的一小部分数据存储在缓存服务器中,减少数据库的访问次数,降低数据库的访问压力。
4. 使用应用服务器集群
特征:通过Nginx的反向代理,通过负载均衡的调度,可以在一定程度上解决服务器处理能力的瓶颈;
负载均衡的策略有:
轮询:每一次来自网络的请求轮流分配给内部中的服务器,从1至N然后重新开始。此种均衡算法适合于服务器组中的所有服务器都有相同的软硬件配置并且平均服务请求相对均衡的情况。实现简单,但存在服务器的处理能力不同的情况;
权重:根据服务器的不同处理能力,给每个服务器分配不同的权值,使其能够接受相应权值数的服务请求。
例如:服务器A的权值被设计 成1,B的权值是3,C的权值是6,则服务器A、B、C将分别接受到10%、30%、60%的服务请求。
此种均衡算法能确保高性能的服务器得到更多的使用率,避免低性能的服务器负载过重。考虑了服务器处理能力的不足;
5. 数据库读写分离
特征:数据库读写分离。
6. 反向代理CDN加速
特征:采用CDN和反向代理加快系统的访问速度。
7. 分布式文件系统和分布式数据库
特征:数据库采用分布式数据库,文件系统采用分布式文件系统,加上远程分布式缓存。
数据库是系统数据库拆分的最后方法,只有在单表数据规模非常庞大的时候才使用,更常用的数据库拆分手段是业务分库,将不同的业务数据库部署在不同的物理服务器上。
8. 使用Nosql和搜索引擎
特征:随着业务越来越复杂,对数据存储和检索的需求也越来越复杂,系统需要采用一些非关系型数据库如NoSQL和分数据库查询技术如搜索引擎。
9. 业务拆分
特征:系统上按照业务进行拆分改造,应用服务器按照业务区分进行分别部署。
为了应对日益复杂的业务场景,通常使用分而治之的手段将整个系统业务分成不同的产品线,应用之间通过超链接建立关系,也可以通过消息队列进行数据分发,
当然更多的还是通过访问同一个数据存储系统来构成一个关联的完整系统。
10. 分布式服务SOA
特征:公共的应用模块被提取出来,部署在分布式服务器上供应用服务器调用。
三、分布式存在的问题及微服务的引出
(1) 当服务越来越多时,服务URL配置管理变得非常困难,F5硬件负载均衡器的单点压力也越来越大。
(2) 当进一步发展,服务间依赖关系变得错踪复杂,甚至分不清哪个应用要在哪个应用之前启动,架构师都不能完整的描述应用的架构关系。
(3) 接着,服务的调用量越来越大,服务的容量问题就暴露出来,这个服务需要多少机器支撑?什么时候该加机器?
(4) 服务多了,沟通成本也开始上升,调某个服务失败该找谁?服务的参数都有什么约定?
(5) 一个服务有多个业务消费者,如何确保服务质量?
(6) 随着服务的不停升级,总有些意想不到的事发生,比如cache写错了导致内存溢出,故障不可避免,每次核心服务一挂,影响一大片,人心慌慌,如何控制故障的影响面?服务是否可以功能降级?或者资源劣化?
由于服务越来越多ESB服务总线维护起来越来越麻烦,微服务便由此发展而来!
由于业务间的逻辑越来越复杂,我们就不把这些业务全部杂糅在一起,每个业务都分开来做,这就是微服务。