• 高可用&高并发(从架构&代码层面出发)


    高可用&高并发(从架构&代码层面出发)

    最近想缕缕互联网架构方面的知识,所以这里先宏观的看看关于互联网架构下的问题和相关实现,分布式架构中,我们知道最重要的就是高可用,和高并发,所以我会从这里着手。

    高可用

    架构可用性】:

    所谓高可用就是我们在整个架构的过程中不能存在单点故障:(如果是我的服务节点在整个架构中只部署了一个,那么我们就说这个节点是单点的),当我们把只部署了一个节点,那服务器挂了,那我们的服务则是不可用状态。我们可以:

    集群:所谓的集群就是把一个服务部署了多个节点,例如我们发现Tomcat不够用,那就部署多个,这就是一个例子,那说到集群就要聊一下负载,谁来对请求进行分发,采用那种方式进行请求分发。

    【负载均衡】:

    • 硬件负载;F5、netscaler
    • 软件负载:Apache、Nginx、Lvs、Happrox 

    那请求多了,我们我们的负载均衡的服务器也扛不住了,那我们就要对负载均衡的服务器进行集群

    • 硬件:会有一个主机和一个备机,主机和备机通过一个心跳线进行连接,如果发现备机发现主机没有心跳了,则接管主机的工作。
    • 软件:Lvs+keeplived

    负载均衡算法】:随机、hash、轮询、最小连接数

    常见的负载】:DNS轮询、二层负载(MAC层)、三层负载(IP层,根据传递的数据报文中的ip进行负载)、ip+端口负载(比如nginx中upstream)、七层负载(应用层负载->url的负载)

    【应用层负载】:ribbon、dubbo、SpringCloud loadbalance

    热备:多个节点在自己内部进行选举,当发现一个节点挂了后,其内部的选举策略会推选出新的master

    • zookeeper:zab协议
    • redis-sentinel:raft算法

    多机房部署: 同城灾备、异地灾备

    【应用可用性】: 

    微服务的集群部署

    容错性:

    服务容错性:当某个服务出现错误的时候,整个系统必须正常运行,解决方法(请求隔离)

    接口容错性:保证外部接口传递数据的安全性,解决办法(数据校验),以及幂等性(可能处理一个请求多次,举个例子,一个请求其实后端已经成功处理,可是调用者并不知道),解决办法(事务处理)

    自我保护能力:(比如系统只能接受1000tps但是给了我2000tps)解决办法(熔断、限流、缓存、主动降级)

    监控:

    • 系统资源的监控:(cpu、内存、磁盘)
    • 告警手段:发短信、邮件、电话(可以使用alertManager)
    • 应用监控:应用吞吐量、访问量(进行数据埋点、数据上报到统一的一个监控系统中)、系统的执行情况(elk)
    • 链路监控:比如一个请求经过了很多链路,我们想知道那个链路的响应时间最久(pinpoint、zipkin)

    高并发

    单位时间内可以同时处理的请求数量, 以下有几个名词是衡量一个系统并发的指标。

    RT(response time-> 响应时间):当我们发送一个http请求后得到数据的系统响应时间,这是影响用户体验的一个重要因素

    throughput(吞吐量):系统单位时间内的请求数量,通过QPS来决定的

    QPSTPS(每秒的事务数、查询数):每秒同时承载的事务的处理数量 == 并发数/平均响应时间 使用 Jmeter 可以压测出

    用户体验:

    瀑布流、异步化、进行限额(针对支付)

    架构层面

    微服务

    【服务进行拆分】(单个计算机的计算的性能是有限的,进行服务拆分就等于多个计算机共同工作,这样就提高了性能。)

    【SLA】服务拆分后,我们可以针对重要的模块提供更大规模的集群

    【数据库(关系型数据库)】 

    • 数据分片(分库分表)
    • 读写分离

    【存储(非结构化存储)】:MongoDB、Redis等

    【服务的无状态化设计】:当访问峰值来临,我们不得不增加服务器,但是如果增减了服务器,有时候有的数据是存储在a服务器上的,但是增加了B服务器那数据不统一如何处理

    session -> Redis 数据的存储->数据库部署到第三方节点

    【分布式缓存】 热点数据进行缓存

    容量规划】;

    【容量】指的是比如一个网站超过1000w的Page View就开始变慢,或者返回错误,那我们就认为10000w的PV就是我们网站的容量,从这几个方面进行考虑:

    • 什么时候应该加机器 、
    • 当前的吞吐量是多少、
    • 承载多少容量需要增加多少服务器

    【步骤】:压测集群、节点达到一个临界值

    【目标】:

    • 最大的负载状态(服务器级别的):cpu的使用率、内存的使用率、磁盘io的延时
    • 最大能接受的请求阈值:(qps、tps、错误率、平均响应时间)

    【指标的收集】:压力测试 (得到更精准的数据 )、产线压测(可能传递用户真实数据进行测试)

    【趋势的预测】:使用往年的数据和今年的数据增长进行一些预判(以峰值进行一个比较标准)

    【扩容】:水平扩容、垂直扩容

    异步化架构】::一些实时性要求不是很高的场景,我们可以通过把流量分发到mq中,从而对高并发进行一个好的处理

    冗余】:增加副本、CDN内容分发网络(部署不同的节点,在不同的地方,用户距离那个地方近就访问哪个地方的节点)

    【代码层面

    • 不要在循环中调用rpc
    • hashmap的初始数据,如果初始数据太小,那可能就造成了频繁的扩容,从而消耗性能
    • 数据的预热,当一些频繁使用的数据,提前进行加载(类似于恶汉模式)
    •  数据库层面,查询语句的优化,是否有索引,是否查了全表 so on
    • 异步化,线程池的使用

    【客户端层面的优化】:

    • 减少请求的数量,合并请求。
    • 数据缓存,减少请求的次数

     其他的一些知识:

    服务的幂等性:多次请求和一次请求对于数据的变化保持一致,就是把之前的数据重新发送了一遍,必须保证只有一个数据成功。

    • 状态机:一个数据在整个生命周期中经历的状态,比如一个订单的状态,发起、支付中、支付结束、so on,我们可以通过这个状态进行判断
    • 数据库的唯一约束、token
    • redis 当一个请求过来判断存储key和value下次来redis中进行判断。

    分布式锁:我们知道synchronize和lock是解决同一进程多个线程直接的问题,但是在分布式中不是同一个进程,那就需要一个第三方的视角去判断谁可以访问某个资源,常见的分布式锁:

    • zookeeper、数据库、Redis、etcd

    CAP:一致性(在集群节点中的数据一致性)、可用性(当一个请求发送后,在我可以接受的时间内,给我一个响应)、分区容错性(产生网络故障的时候,集群中的数据还是可以访问的 )

  • 相关阅读:
    Map集合
    Collections 工具类
    LinkedList 集合
    List集合
    Iterator迭代器
    Collection集合
    时间日期类
    一看就懂!速写docker 容器数据库备份脚本
    Nginx 配置之HTTPS和WSS那些你不知道的事!
    https 证书认证/颁发/秒级认证无烦恼
  • 原文地址:https://www.cnblogs.com/UpGx/p/15034869.html
Copyright © 2020-2023  润新知