大型分布式网站架构笔记一
RPC的全称是Remote Process Call,即远程过程调用,拥有RMI、WebService等诸多成熟的方案。
对象序列化:
- 将对象转换为二进制流的过程称为对象的序列化
- 将二进制流恢复为对象的过程称为对象的反序列化
RPC实现方式:
基于TCP协议的RPC
优点:协议栈下层,灵活对协议字段定制,降低网络开销,提高性能,实现更大的吞吐量和并发数
缺点:需要更多的关注底层复杂的细节,较难实现跨平台的调用
基于HTTP协议的RPC
优点:无需关注底层细节,通过使用JSON或XML格式相应数据,实现跨平台,
缺点:传输所占字节数多导致效率相对TCP方式低(可以通过gzip数据压缩)
负载均衡算法的实现(P33)
ZooKeeper是Hadoop下的一个子项目,它是一个针对大型分布式系统的可靠的协调系统,提供的功能包括配置维护、名字服务、分布式同步、组服务等。
第二章 分布式系统基础设施
- 分布式缓存
- 持久化存储
- 消息系统
- 垂直化搜索引擎
- 其他基础设施(实时计算、离线计算、分布式文档系统、日志搜集系统、监控系统、数据仓库、CDN系统、负载均衡系统、消息推送系统、自动化运维系统)
三、互联网安全架构
常见WEB攻击手段:XSS,CRSF,SQL注入,DDos,其它:DNS域名劫持,CDN回源,缓冲区溢出
常用安全算法:非对称加密RSA,数字签名,数字证书。摘要认证。签名认证。(当年做大宗商品交易平台,用到建设银行E商贸通接口,基本涉及到公私钥生成--》公钥交换--》对称钥匙传输--》加签--》验签)
摘要认证:取决于对称secret
签名认证:用非对称公/私钥对
HTTPS协议:密钥随机产生,通过数字证书验证双方身份。全程加密。
OAuth:用户(User)通过平台商(Platform)对第三方软件商(ISV)的应用进行授权。