• 关于大厂面试中问到的二十几个 HTTP 面试题


    【Q035】http 常见的状态码有哪些

    在 Issue 中交流与讨论: 答案解析

    • 1XX 表示消息
    • 2XX 表示成功
    • 3XX 表示重定向
    • 4XX 表示客户端错误
    • 5XX 表示服务端错误
    常见的状态码
    • 200

    最喜欢见到的状态码,表示请求成功

    • 301

    永久重定向

    • 302

    临时重定向

    • 304

    自上次请求,未修改的文件

    • 400

    错误的请求

    • 401

    未被授权,需要身份验证,例如token信息等等

    • 403

    请求被拒绝

    • 404

    资源缺失,接口不存在,或请求的文件不存在等等

    • 500

    服务器端的未知错误

    • 502

    网关错误

    • 503

    服务暂时无法使用

    【Q036】http 状态码中 301,302和307有什么区别

    在 Issue 中交流与讨论: 答案解析

    • 301,Moved Permanently。永久重定向,该操作比较危险,需要谨慎操作:如果设置了301,但是一段时间后又想取消,但是浏览器中已经有了缓存,还是会重定向。
    • 302,Fount。临时重定向,但是会在重定向的时候改变 method: 把 POST 改成 GET,于是有了 307
    • 307,Temporary Redirect。临时重定向,在重定向时不会改变 method

    【Q050】http 状态码 502 和 504 有什么区别

    在 Issue 中交流与讨论: 答案解析

    • 502 Bad Gateway
      The server was acting as a gateway or proxy and received an invalid response from the upstream server.
      收到了上游响应但无法解析

    • 504 Gateway Timeout
      The server was acting as a gateway or proxy and did not receive a timely response from the upstream server.
      上游响应超时

    【Q079】简述 http 的缓存机制

    在 Issue 中交流与讨论: 答案解析

    【Q081】http proxy 的原理是什么

    更多描述: 如 `webpack-dev-server` 可以设置 proxy,`nginx` 也可以设置

    在 Issue 中交流与讨论: 答案解析

    todo

    【Q084】随着 http2 的发展,前端性能优化中的哪些传统方案可以被替代

    在 Issue 中交流与讨论: 答案解析

    1. 雪碧图
    2. 资源文件合并

    【Q085】http2 与 http1.1 有什么不同

    在 Issue 中交流与讨论: 答案解析

    【Q107】什么是 Basic Auth 和 Digest Auth

    在 Issue 中交流与讨论: 答案解析

    【Q108】gzip 的原理是什么

    在 Issue 中交流与讨论: 答案解析

    gzip 使用了 LZ77 算法与 Huffman 编码来压缩文件,重复度越高的文件可压缩的空间就越大。

    【Q109】可以对图片开启 gzip 压缩吗,为什么

    在 Issue 中交流与讨论: 答案解析

    不需要开启,如果开启的话,有可能使图片变的更大。如果你注意一些网站的 img 资源时,就会发现他们都没有开启 gzip

    参考: https://webmasters.stackexchange.com/questions/8382/is-gzipping-images-worth-it-for-a-small-size-reduction-but-overhead-compressing

    Don't use gzip for image or other binary files.

    Image file formats supported by the web, as well as videos, PDFs and other binary formats, are already compressed; using gzip on them won't provide any additional benefit, and can actually make them larger. To compress images, see Optimize images.

    【Q110】http 的请求报文与响应报文的格式是什么

    在 Issue 中交流与讨论: 答案解析

    nc 模拟 http 报文如下

    $ nc www.baidu.com 80
    GET / HTTP/1.1
    Host: www.baidu.com
    
    HTTP/1.1 200 OK
    Accept-Ranges: bytes
    Cache-Control: no-cache
    Connection: Keep-Alive
    Content-Length: 14615
    Content-Type: text/html
    Date: Tue, 10 Dec 2019 02:48:44 GMT
    P3p: CP=" OTI DSP COR IVA OUR IND COM "
    P3p: CP=" OTI DSP COR IVA OUR IND COM "
    Pragma: no-cache
    Server: BWS/1.1
    Set-Cookie: BAIDUID=F0FC6B3A056DEA285F51A1F2F8A170BB:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
    Set-Cookie: BIDUPSID=F0FC6B3A056DEA285F51A1F2F8A170BB; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
    Set-Cookie: PSTM=1575946124; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
    Set-Cookie: BAIDUID=F0FC6B3A056DEA287CB2B9422E09E30E:FG=1; max-age=31536000; expires=Wed, 09-Dec-20 02:48:44 GMT; domain=.baidu.com; path=/; version=1; comment=bd
    Traceid: 1575946124058431156210725656341129791126
    Vary: Accept-Encoding
    X-Ua-Compatible: IE=Edge,chrome=1
    
    <!DOCTYPE html><!--STATUS OK-->
    ........内容省略
    

    【Q111】http 响应头中的 ETag 值是如何生成的

    在 Issue 中交流与讨论: 答案解析

    关于 etag 的生成需要满足几个条件

    1. 当文件不会更改时,etag 值保持不变。所以不能单纯使用 inode
    2. 便于计算,不会特别耗 CPU。这样子 hash 不是特别合适
    3. 便于横向扩展,多个 node 上生成的 etag 值一致。这样子 inode 就排除了

    关于服务器中 etag 如何生成可以参考 HTTP: Generating ETag Header

    那么在 nginx 中的 etag 是如何生成的?

    nginx 中 ETag 的生成

    我在网上找到一些资料与源代码了解到了 etag 的计算方法。由 python 伪代码表示计算方法如下

    etag = '{:x}-{:x}'.format(header.last_modified, header.content_lenth)
    

    源码: ngx_http_core_modules.c

    etag->value.len = ngx_sprintf(etag->value.data, ""%xT-%xO"",
                                      r->headers_out.last_modified_time,
                                      r->headers_out.content_length_n)
                          - etag->value.data;
    

    总结:nginxetag 由响应头的 Last-ModifiedContent-Length 表示为十六进制组合而成。

    随手在我的k8s集群里找个 nginx 服务测试一下

    $ curl --head 10.97.109.49
    HTTP/1.1 200 OK
    Server: nginx/1.16.0
    Date: Tue, 10 Dec 2019 06:45:24 GMT
    Content-Type: text/html
    Content-Length: 612
    Last-Modified: Tue, 23 Apr 2019 10:18:21 GMT
    Connection: keep-alive
    ETag: "5cbee66d-264"
    Accept-Ranges: bytes
    

    etag 计算 Last-ModifiedContent-Length,使用 js 计算如下,结果相符

    > new Date(parseInt('5cbee66d', 16) * 1000).toJSON()
    "2019-04-23T10:18:21.000Z"
    > parseInt('264', 16)
    612
    

    Last-Modified,ETag 与协商缓存

    我们知道协商缓存有两种方式

    • Last-Modified/if-Modified-Since
    • ETag/If-None-Match

    既然在 nginxETagLast-ModifiedContent-Length 组成,那它便算是一个加强版的 Last-Modified 了,那加强在什么地方呢?

    ** Last-Modified 是由一个 unix timestamp 表示,则意味着它只能作用于秒级的改变**

    那下一个问题:如果 http 响应头中 ETag 值改变了,是否意味着文件内容一定已经更改

    【Q112】如果 http 响应头中 ETag 值改变了,是否意味着文件内容一定已经更改

    在 Issue 中交流与讨论: 答案解析

    不一定,由服务器中 ETag 的生成算法决定。详见 #112

    比如 nginx 中的 etaglast_modifiedcontent_length 组成,而 last_modified 又由 mtime 组成

    当编辑文件却未更改文件内容时,或者 touch filemtime 也会改变,此时 etag 改变,但是文件内容没有更改。

    【Q116】http 服务中静态文件的 Last-Modified 是根据什么生成的

    在 Issue 中交流与讨论: 答案解析

    一般会选文件的 mtime,表示文件内容的修改时间

    nginx 也是这样处理的,源码见: ngx_http_static_module.c

        r->headers_out.status = NGX_HTTP_OK;
        r->headers_out.content_length_n = of.size;
        r->headers_out.last_modified_time = of.mtime;
    

    关于为什么使用 mtime 而非 ctime,可以参考 #116

    【Q117】既然 http 是无状态协议,那它是如何保持登录状态

    在 Issue 中交流与讨论: 答案解析

    通过 cookie 或者 Authorization header 来传递凭证,在服务端进行认证

    【Q119】https 是如何保证报文安全的

    在 Issue 中交流与讨论: 答案解析

    https主要解决三个安全问题:

    1. 内容隐私
    2. 防篡改
    3. 确认对方身份

    https并不是直接通过非对称加密传输过程,而是有握手过程,握手过程主要是和服务器做通讯,生成私有秘钥,最后通过该秘钥对称加密传输数据。还有验证证书的正确性。
    证书验证过程保证了对方是合法的,并且中间人无法通过伪造证书方式进行攻击。

    【Q121】我们如何从 http 的报文中得知该服务使用的技术栈

    在 Issue 中交流与讨论: 答案解析

    一般有两个 response header,有时服务端为了隐蔽自己真实的技术栈会隐蔽这两个字段

    • X-Powerd-By
    • Server

    【Q122】在发送 http 请求报文时,Host 是必要的吗

    在 Issue 中交流与讨论: 答案解析

    是有必要的,因为我们不知道会途径会不会有代理出现, 如果直接到达服务器的话,服务器是可以通过路径知道资源在哪,但是如果通过代理的话,代理无法得知具体服务器是什么地址

    【Q133】http 响应头中如果 content-type 为 application/octet-stream,则代表什么意思

    在 Issue 中交流与讨论: 答案解析

    代表二进制流,一般用以下载文件

    【Q136】http 向 https 做重定向应该使用哪个状态码

    在 Issue 中交流与讨论: 答案解析

    一般用作 301 的较为多,但是也有使用 302,如果开启了 HSTS 则会使用 307

    如知乎使用了 302,淘宝使用了 301

    $ curl --head www.zhihu.com
    HTTP/1.1 302 Found
    Date: Tue, 24 Dec 2019 00:13:54 GMT
    Content-Length: 22
    Connection: keep-alive
    Server: NWS_TCloud_IPV6
    Location: https://www.zhihu.com/
    X-NWS-LOG-UUID: 0e28d9a1-6aeb-42cd-9f6b-00bd6cf11500
    
    $ curl --head www.taobao.com
    HTTP/1.1 301 Moved Permanently
    Server: Tengine
    Date: Tue, 24 Dec 2019 00:13:58 GMT
    Content-Type: text/html
    Content-Length: 278
    Connection: keep-alive
    Location: https://www.taobao.com/
    Via: cache20.cn1480[,0]
    Timing-Allow-Origin: *
    EagleId: 6f3f38a815771464380412555e
    
    

    【Q141】http 响应头中的 Date 与 Last-Modified 有什么不同,网站部署时需要注意什么

    在 Issue 中交流与讨论: 答案解析

    LM-Factor 与它俩有关。

    简而言之,一个静态资源没有设置 Cache-Control 时会以这两个响应头来设置强制缓存时间,而非直接进行协商缓存。在涉及到 CDN 时,表现更为明显,体现在更新代码部署后,界面没有更新。

    【Q144】http 1.1 中的 keep-alive 有什么作用

    在 Issue 中交流与讨论: 答案解析

    http 1.1 中,在响应头中设置 keep-alive 可以在一个 TCP 连接上发送多个 http 请求

    1. 避免了重开 TCP 连接的开销
    2. 避免了刷新时重新建立 SSL 连接的开销
    3. 避免了QPS过大时,服务器的连接数过大

    在服务器端使用响应头开启 keep-alive

    Connection: Keep-Alive
    Keep-Alive: timeout=5, max=1000
    
  • 相关阅读:
    3631: [JLOI2014]松鼠的新家
    1112: [POI2008]砖块Klo
    1935: [Shoi2007]Tree 园丁的烦恼
    4001: [TJOI2015]概率论
    1339 / 1163: [Baltic2008]Mafia
    4010: [HNOI2015]菜肴制作
    4052: [Cerc2013]Magical GCD
    2292: 【POJ Challenge 】永远挑战
    4063: [Cerc2012]Darts
    3997: [TJOI2015]组合数学
  • 原文地址:https://www.cnblogs.com/xianwang/p/12089494.html
Copyright © 2020-2023  润新知