web请求过程 - 润新知

web请求过程

浏览器缓存：
按浏览器页面刷新一定是重新发送请求。因为按f5刷新时，浏览器直接向目标url发送请求。
但是假如我们在应用服务器的前端部署了一个缓存服务器，那么也有可能拿到的还是缓存信息。
所以，请求头需要增加两个请求项Pragma:no-cache和Cache-Control:no-cache，这两个参数在整个请求响应链中起作用，
当然会对缓存服务器或代理服务器起作用，no-cache表示所有内容都不会被缓存，在请求头和响应头中设置。
<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="cache-control" content="no-cache">
----------------------------------------------------------------------------------------------
DNS域名解析：
（1）域名解析意思是根据域名解析成正确的ip。用户第一次访问某个域名时，域名解析服务器返回解析的ip到客户浏览器，
浏览器会缓存这个域名和ip的对应关系，但是缓存有限制，比如浏览器缓存的大小和时间，缓存时间太短或太长都不好，
太短的话，可能会导致每次都需要解析，太长的话，假如ip变更，客户将访问不到变更之后正确的ip。
而这个时间限制缓存参数可以通过TTL属性来设置。
（2）假如浏览器缓存中不存在域名ip对应关系，那么浏览器会查看用户操作系统中是否存在解析缓存，Windows系统中，
Windows/system32/drivers/etc/hosts中记录的就是域名和ip的对应关系，打开文档后就能看到是如何设置的，
早期的黑客常通过修改此文件来劫持域名，使用户访问正常域名却连接到了黑客指定的ip上。而在win7中此文件被设计成了只读，
在linux下的这个配置文件是/etc/named.conf。
(3)以上两种方法仍然没有解决域名解析的话，就需要真正请求域名服务器来解析了。window中(网上邻居-->internet协议)可以看到
下方一个配置DNS的地方，这个dns配置的是Local DNS Server，比如你在学校上网，那么这个ldns就在学校里，假如在小区里，那么
这个服务器就联通或电信的SPA，服务器也在城市的某个角落里，不会很远。这个LDNS服务器性能已经很好了，他们当然也会缓存解析结果，
缓存时间通常受域名的失效时间来控制，通常情况下，80%的域名解析都能在这里完成。LDNS承担了主要的解析任务。
（4）如果LDNS仍然无法解析，那么就得需要Root DNS Server了，根域名服务器不会立刻返回解析结果，它返回给LDNS的是一个
gTLD主域名服务器地址，gTLD是国际顶级域名服务器，比如.com,.cn,.org等，全球只有13台。
（5）LDNS继续向gTLD服务器发送请求，现在，gTLD仍然不会返回结果，它会返回给LDNS一个name server域名服务器地址，
这个地址就是网站注册域名的服务器地址，假如网站是在某个域名服务提供商那里申请的域名，那么这个域名解析任务就在
这个域名提供商的服务器上来完成，域名解析就在这个服务器上进行，这个服务器会查询域名和ip的映射关系表，
然后把ip和TTL值返回给LDNS，LDNS服务器再缓存起来。然后LDNS把ip和TTL值返回给用户，用户系统也会相应地缓存。
基本流程是如此，实际上要更复杂。
在linux和window上可以通过nslookup命令来查看域名的解析结果。
而linux上还可以通过 dig 域名的命令来查看dns的解析过程。

清空dns缓存：
dns缓存在本地和LDNS上，其主要受TTL和系统缓存大小来控制，LDNS上的缓存很难人工控制，我们可以更改本地dns缓存，比如清空缓存，windows清空dns缓存命令：
ipconfig/flushdns ，linux命令：/etc/init.d/nscd restart 。也可以重启主机。
在java应用中，jvm也会缓存DNS的解析结果，java解析域名通过InetAddress类来完成，使用时注意用单例模式，否则会有严重性能问题，如果每次都创建InetAdress实例，
每次都要进行完整的域名解析，会非常耗时。
----------------------------------------------------------------
CDN工作机制
CDN是为了提高对用户的响应时间，目前通常把静态资源如图片、js、css、静态页面放在cdn上，用户访问，从主服务器上获得动态内容后再从cdn上下载静态资源，
淘宝90%的资源要从CDN上获取。假如某个静态页面url是：cdn.taobao.com,那么在域名解析的第5步，淘宝公司的域名解析会把这个域名指向CDN全局中的
负载均衡系统GTM，GTM会根据用户在哪里来返回离这个用户最近的CDN节点，用户拿到这个CDN节点之后，再去这个CDN节点获取这个静态文件，如果文件不存在，就会
再去主机找资源。

负载均衡
负载均衡就是通过分配之后让多个服务器来完成同一个任务，比如DNS的解析过程。这样提高效率，避免网络阻塞。为用户提供一致的访问质量。
通常分为三种架构：链路负载均衡，集群负载均衡，操作系统负载均衡，DNS的解析就是链路负载均衡。
相关阅读:
网络基础
 SQL注入
 OpenID说明
 Linux网络编程
 Linux的僵尸进程产生原因及解决方法
 计算机系统的存储层次
 Java实现SSO
JD（转载）
Switch的表达式的要求
 leetcode(23. Merge k Sorted Lists)
原文地址：https://www.cnblogs.com/sunyt/p/4146446.html