• 12306 VS 淘宝双十一


    最近过年买票回家经常听到的一句话就是,md 12306又崩了。。卧槽。。心累。。
    但其实有不了解的真相。
    为什么12306要时不时崩一下
    另一边双十一几亿人同时购物疯狂败家剁手都没有问题,为什么12306一出手,就是炸穿裤衩的用户体验?
    玄学

    一个正确的结论是:
    12306的难度要比双十一大的多的多的多多多~

    如果说双十一的难度是人间模式,那么12306差不多相当于是地狱十八层,还要再挖个坑的难度。

    第一

       双十一的流量再大,也只不过是纯线上业务,什么叫纯线上业务?所有用户都是在网页或者APP下单,整个数据其实是闭环的。
    这就导致双十一其实只是一个纯粹的**线上流量**问题,解决起来相对纯粹,就像一个单纯的小朋友一样好欺负。
    而12306不是,12306不是只有一个APP和网站的朋友,**所有人**在线下售票厅以及线下机器里产生的交易,也会影响整个12306的数据系统。
    
      实际上现实生活中非常多的买火车票返乡的人,例如辛苦的农民和工人朋友,很多都是不会线上操作的,他们只会线下彻夜排队,非常辛苦,所以12306也必须照顾他们的感受,不能断掉线下业务。
    
    这就导致了12306本身是一个线下与线上同享数据的复杂业务,复杂度要高出双十一一个数量级的。
    和纯粹简单的双十一相比,12306就像一个饱经社会摧残的老油条,你永远不知道他们会什么时候会出现什么幺蛾子。
    

    12306是一个非确定的任务:
    因为你永远不可能测算出会有多少人在哪一天去哪一个地方,一个从浙江回山东的人,他为了回家,选择的线路和时间会非常诡异多变。
    他可以买浙江到山东,可以买浙江到上海到山东,可以买浙江到南京到山东,可以买千岛湖到山东,可以买浙江到北京到山东,可以买浙江到黑龙江到山东,甚至可以买浙江到广东再飞回山东,只要能回山东,啊我的大葱。
    他可以接受1号出发,2号出发,3号出发,5号出发,10086号出发,只要能出发

    第二

      第二:双十一活动并不是只有11月11号当天,其实是一个月前甚至几个月前就已经开始了,大量的用户都已经支付了定金,大量的商家也已经锁定了库存和销售额,只不过最终的结算是在11月11号当天进行的而已。
    
    这就代表着,双十一面对的是一个高确定性的任务,只要有确定性,流量再大也不是特别难的问题。
    当你知道困难会在什么时候发生的时候,这个困难就不再困难了。
    真正的困难,在于不可知
    

    例如:

    为什么经常突然一个明星出轨或者结婚或者负面新闻,微博就要挂掉?是没有技术实力还是服务器资源不够?
    都不是,是因为这种流量是突发性的,谁也不知道会突然出现这种爆炸增长,所以服务器就挂掉了。

    第三

    电商业务不是一个一次性要完成所有流程的业务,但是12306必须一次性完成,这进一步加大了难度。
    电商业务一般是走流程,中转流程需要时间,实现异步处理,例如:一个典型的电商购物流程是,浏览,和商家撕逼价格,下单,和商家撕逼运费以及快递,物流发货,买家收货,和商家撕逼售后,等。。时间。。
    但是12306必须一次完成
    卖票就是要立刻完成。
    从下单,到付款,到锁定票,都是一气呵成的,没有任何缓冲时间,不存在我下单一个票2天后告诉我成功或者失败这种事情,头都给消费者打爆。
    没有缓冲期,直面所有流量

    第四

    库存管理非常的复杂

    随便选一辆北京往南开的车,G65这辆高铁,北京始发终到珠海,一共17个站,共计10小时55分钟。
    就这一个路线,17个站,支持随意站上车,随意站下车,会有多少种可能性?
    因为坐车不可能只做单站循环,就是不能北京到北京。
    所以是从1加到16,一共136种可能性,注意哦,电商同样的场景只有增删改查4种可能性。
    这样一个线路的实时库存,做起来是非常令人头大的。
    假如有人买了从武汉到珠海,那么对应的就是武汉到珠海沿途所有线路的库存减1,但是北京到武汉不减。
    假如有人买了石家庄到漯河西,那么北京到保定,北京到石家庄不用变,漯河西到珠海段,不用变。
    其余所有可能性都要变,因为只要经过这两个站点的路线,都受到影响。
    实际业务中,这样的变动,会导致整个库存实时变动,并且是P级别的数据变动,如果对数据库稍微有所了解,都知道这种数据变动对于资源的消耗有多么恐怖,一个1GB的电子表格跑查询都能把很多高性能电脑跑崩掉,早期电子表格甚至限制在6万5千行,就是防止把电脑跑崩。
    而这种级别的数据,需要消耗的资源说出来都违反广告法。
    所以为什么12306夜里11点到早上要维护?这样的数据库如果不是天天维护保护缓存,早就彻底完犊子了。
    
    

    每一天,12306都是拿命来奋斗。

    所以之后买票的时候,要宠溺一点,温柔一点,你买的不是票,是工程师们的头发

    第五,业务去重需要大量的判断。

    12306本身是允许非本人买票的,就是我可以给我的爸妈买票,我爸妈也可以给我买票,只要添加乘车人就可以了,这就代表着,同一个人的信息,完全可以在不同的时间节点被不同的买家添加,这又带来了巨大的计算压力.

    第六,和12306比流量,什么公司都没有资格。

    你在双十一买东西,是不是买了就走了?买不到你就是骂几句,然后也走了。
    一个用户的点击是有限的,你就算单身30年,给你放开了点,你能点多快?
    要知道对系统而言,每一次点击,都是一次数据交换。
    12306面对的点击流量,要大的多,你买票的时候,是会不断刷新操作的,你在查询余票的时候,每一次都是要跑所有的数据库来帮你同步当前的余票信息,这个负载量和计算量是天量。
    而且,现在非常非常多的人在用抢票软件。
    所谓的抢票软件,原理就是不停地用机器去读取12306的数据接口,机器的速度绝对是比你单身30年的手速还要威猛几十倍,一秒刷几百次,1个人用抢票软件,可以造成几千个人一起刷产生的数据压力。
    各大抢票软件公司加起来用户几千万是有的,14亿人刷出几百亿人的流量都绰绰有余。
    你知道12306的流量负载有多强了么?

  • 相关阅读:
    Js实现页面处理器
    自定类型转换
    为什么PHP5中保存cookie以后,要刷新一次才能读取cookie的内容?
    PHP不不支持函数重载
    JS 省市区三级联动
    我喜欢的酷站
    网站宽度设置多少
    Windows环境下Node.js 以及NPM和CoffeeScript的安装配置
    HTML中Meta详解
    搭建SVN
  • 原文地址:https://www.cnblogs.com/gaowenxingxing/p/12209516.html
Copyright © 2020-2023  润新知