• 【面试题学习】Http协议面试题


    当输入www.google.com时,页面发生了哪些事情:

    1.域名解析

    域名解析检查顺序为:浏览器自身DNS缓存---》OS自身的DNS缓存--》读取host文件--》本地域名服务器--》权限域名服务器--》根域名服务器。如果有且没有过期,则结束本次域名解析。域名解析成功之后,进行后续操作

    2.tcp3次握手建立连接

    3.建立连接后,发起http请求

    4.服务器端响应http请求,浏览器得到到http请求的内容;

    5.浏览器解析html代码,并请求html代码中的资源

    6.浏览器对页面进行渲染,展现在用户面前。

    1、说一下什么是Http协议?

    对器客户端和 服务器端之间数据传输的格式规范,格式简称为“超文本传输协议”。

    2、什么是Http协议无状态协议?怎么解决Http协议无状态协议?(曾经去某创业公司问到)

    • 无状态协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息
    • 无状态协议解决办法: 通过1、Cookie 2、通过Session会话保存。

    3、说一下Http协议中302状态(阿里经常问)

    • http协议中,返回状态码302表示重定向。
    • 这种情况下,服务器返回的头部信息中会包含一个 Location 字段,内容是重定向到的url。

    4、Http协议有什么组成?

      请求报文包含三部分:

    • 请求行:包含请求方法、URI、HTTP版本信息
    • 请求首部字段
    • 请求内容实体

      响应报文包含三部分:

    • 状态行:包含HTTP版本、状态码、状态码的原因短语
    • 响应首部字段
    • 响应内容实体

    说一下网络传输的过程

    5、Http协议中有那些请求方式?

    • GET: 用于请求访问已经被URI(统一资源标识符)识别的资源,可以通过URL传参给服务器
    • POST:用于传输信息给服务器,主要功能与GET方法类似,但一般推荐使用POST方式。
    • PUT: 传输文件,报文主体中包含文件内容,保存到对应URI位置。
    • HEAD: 获得报文首部,与GET方法类似,只是不返回报文主体,一般用于验证URI是否有效。
    • DELETE:删除文件,与PUT方法相反,删除对应URI位置的文件。
    • OPTIONS:查询相应URI支持的HTTP方法。

    6、Http协议中Http1.0与1.1区别?

    • 在http1.0中,当建立连接后,客户端发送一个请求,服务器端返回一个信息后就关闭连接,当浏览器下次请求的时候又要建立连接,显然这种不断建立连接的方式,会造成很多问题。
    • 在http1.1中,引入了持续连接的概念,通过这种连接,浏览器可以建立一个连接之后,发送请求并得到返回信息,然后继续发送请求再次等到返回信息,也就是说客户端可以连续发送多个请求,而不用等待每一个响应的到来。

    7、get与post请求区别?(初级程序员必备问题)

    区别一:

    • get重点在从服务器上获取资源。
    • post重点在向服务器发送数据。

    区别二:

    • get传输数据是通过URL请求,以field(字段)= value的形式,置于URL后,并用"?"连接,多个请求数据间用"&"连接,如http://127.0.0.1/Test/login.action?name=admin&password=admin,这个过程用户是可见的。
    • post传输数据通过Http的post机制,将字段与对应值封存在请求实体中发送给服务器,这个过程对用户是不可见的。

    区别三:

    • Get传输的数据量小,因为受URL长度限制,但效率较高。
    • Post可以传输大量数据,所以上传文件时只能用Post方式。

    区别四:

    • get是不安全的,因为URL是可见的,可能会泄露私密信息,如密码等。
    • post较get安全性较高。

    区别五:

    • get方式只能支持ASCII字符,向服务器传的中文字符可能会乱码。
    • post支持标准字符集,可以正确传递中文字符。

    9、常见Http协议状态?

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    200:请求被正常处理
     
    204:请求被受理但没有资源可以返回
     
    206:客户端只是请求资源的一部分,服务器只对请求的部分资源执行GET方法,相应报文中通过Content-Range指定范围的资源。
     
    301:永久性重定向
     
    302:临时重定向
     
    303:与302状态码有相似功能,只是它希望客户端在请求一个URI的时候,能通过GET方法重定向到另一个URI上
     
    304:发送附带条件的请求时,条件不满足时返回,与重定向无关
     
    307:临时重定向,与302类似,只是强制要求使用POST方法
     
    400:请求报文语法有误,服务器无法识别
     
    401:请求需要认证
     
    403:请求的对应资源禁止被访问
     
    404:服务器无法找到对应资源
     
    500:服务器内部错误
     
    503:服务器正忙

    10、Http协议首部字段?

    a、请求行

    请求的第一行是“方法、URL、协议/版本”:

    POST http://xg.mediportal.com.cn/health/sms/verify/telephone HTTP/1.1

    以上代码中“POST”代表请求方法,“http://xg.mediportal.com.cn/health/sms/verify/telephone”表示URI,“HTTP/1.1代表协议和协议的版本。

    根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1目前支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。

     

    GET

    请求获取由Request-URI所标识的资源

    POST

    在Request-URI所标识的资源后附加新的数据

    HEAD

    请求获取由Request-URI所标识的资源的响应消息报头

    OPTIONS

    请求查询服务器的性能,或查询与资源相关的选项和需求

    PUT

    请求服务器存储一个资源,并用Request-URI作为其标识

    DELETE

    请求服务器删除由Request-URI所标识的资源

    TRACE

    请求服务器回送收到的请求信息,主要用语测试或诊断

    b、请求头(请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等)

    • Content-Type

      是返回消息中非常重要的内容,表示后面的文档属于什么MIME类型。Content-Type: [type]/[subtype]; parameter。例如最常见的就是text/html,它的意思是说返回的内容是文本类型,这个文本又是HTML格式的。原则上浏览器会根据Content-Type来决定如何显示返回的消息体内容

      Host

      指定请求资源的Intenet主机和端口号,必须表示请求url的原始服务器或网关的位置。HTTP/1.1请求必须包含主机头域,否则系统会以400状态码返回

      Accept

      浏览器可接受的MIME类型

      Accept-Charset

      浏览器可接受的字符集

      Accept-Encoding

      浏览器能够进行解码的数据编码方式,比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间

      Accept-Language

      浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到

      Authorization

      授权信息,通常出现在对服务器发送的WWW-Authenticate头的应答中

      Connection

      表示是否需要持久连接。如果Servlet看到这里的值为“Keep- Alive”,或者看到请求使用的是HTTP1.1(HTTP 1.1默认进行持久连接),它就可以利用持久连接的优点,当页面包含多个元素时(例如Applet,图片),显著地减少下载所需要的时间。要实现这一点,Servlet需要在应答中发送一个Content-Length头,最简单的实现方法是:先把内容写入 ByteArrayOutputStream,然后在正式写出内容之前计算它的大小

      Content-Length

      表示请求消息正文的长度

      Cookie

      这是最重要的请求头信息之一

      From

      请求发送者的email地址,由一些特殊的Web客户程序使用,浏览器不会用到它

      Host

      初始URL中的主机和端口

      If-Modified-Since

      只有当所请求的内容在指定的日期之后又经过修改才返回它,否则返回304“Not Modified”应答

      Pragma

      指定“no-cache”值表示服务器必须返回一个刷新后的文档,即使它是代理服务器而且已经有了页面的本地拷贝

      Referer

      包含一个URL,用户从该URL代表的页面出发访问当前请求的页面

      User-Agent

      浏览器类型,如果Servlet返回的内容与浏览器类型有关则该值非常有用

      UA-Pixels,UA-Color,UA-OS,UA-CPU

      由某些版本的IE浏览器所发送的非标准的请求头,表示屏幕大小、颜色深度、操作系统和CPU类型

     常见的MIME类型如下:

    •     text/html : HTML格式
    •     text/plain :纯文本格式      
    •     text/xml :  XML格式
    •     image/gif :gif图片格式    
    •     image/jpeg :jpg图片格式 
    •     image/png:png图片格式

      以application开头的媒体格式类型:

    •    application/xhtml+xml :XHTML格式
    •    application/xml     : XML数据格式
    •    application/atom+xml  :Atom XML聚合格式    
    •    application/json    : JSON数据格式
    •    application/pdf       :pdf格式  
    •    application/msword  : Word文档格式
    •    application/octet-stream : 二进制流数据(如常见的文件下载)
    •    application/x-www-form-urlencoded : <form encType=””>中默认的encType,form表单数据被编码为key/value格式发送到服务器(表单默认的提交数据的格式)

       另外一种常见的媒体格式是上传文件之时使用的:

    •     multipart/form-data : 需要在表单中进行文件上传时,就需要使用该格式

    3)请求正文

    请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:

    telephone=15527177736&userType=1&

    http响应格式

    HTTP应答与HTTP请求相似,HTTP响应也由3个部分构成,分别是:

    1、状态行

    2、响应头(Response Header)

    3、响应正文

    HTTP/1.1 200 OK   //状态行
    Server: nginx
    Date: Tue, 31 May 2016 02:09:24 GMT
    Content-Type: application/json;charset=UTF-8
    Connection: keep-alive
    Vary: Accept-Encoding
    Access-Control-Allow-Origin: *
    Access-Control-Allow-Headers: X-Requested-With,access_token,access-token,content-type,multipart/form-data,application/x-www-form-urlencoded
    Access-Control-Allow-Methods: GET,POST,OPTIONS
    Content-Length: 49

    {"resultCode":1,"resultMsg":"手机号未注册"}   //正文

    (1)状态行

    由协议版本、数字形式的状态代码、及相应的状态描述,各元素之间以空格分隔。

    状态代码:

    状态代码由3位数字组成,表示请求是否被理解或被满足。

    状态描述:

    状态描述给出了关于状态代码的简短的文字描述。

    状态代码的第一个数字定义了响应的类别,后面两位没有具体的分类。

    第一个数字有五种可能的取值:

    - 1xx:   指示信息—表示请求已接收,继续处理。

    - 2xx:   成功—表示请求已经被成功接收、理解、接受。

    - 3xx:   重定向—要完成请求必须进行更进一步的操作。

    - 4xx:   客户端错误—请求有语法错误或请求无法实现。

    - 5xx: 服务器端错误—服务器未能实现合法的请求。

    状态代码 状态描述    说明

       200  OK    客户端请求成功

       400  Bad Request   由于客户端请求有语法错误,不能被服务器所理解。

       401  Unauthonzed   请求未经授权。这个状态代码必须和WWW-Authenticate报头域一起使用

       403   Forbidden   服务器收到请求,但是拒绝提供服务。服务器通常会在响应正文中给出不提供服务的原因

       404   Not Found   请求的资源不存在,例如,输入了错误的URL。

       500  Internal Server Error 服务器发生不可预期的错误,导致无法完成客户端的请求。

      503  Service Unavailable   服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常

    (2)响应头 

    响应头可能包括:

    Location: 

    Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务 器端可以发回Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源。当我们在JSP中使用重定向语句的时候,服务器 端向客户端发回的响应报头中,就会有Location响应报头域。

    Server:  

    Server响应报头域包含了服务器用来处理请求的软件信息。它和User-Agent请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户 端软件(浏览器)和操作系统的信息。下面是Server响应报头域的一个例子:Server: Apache-Coyote/1.1

    WWW-Authenticate:

    WWW-Authenticate响应报头域必须被包含在401(未授权的)响应消息中,这个报头域和前面讲到的Authorization请求报头域是 相关的,当客户端收到401响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了 Authorization报头域的请求,下面是WWW-Authenticate响应报头域的一个例子:WWW-Authenticate: Basic realm="Basic Auth Test!"

    从这个响应报头域,可以知道服务器端对我们所请求的资源采用的是基本验证机制。

    Content-Encoding

    Content-Encoding实体报头域被使用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容编码,因而要获得Content- Type报头域中所引用的媒体类型,必须采用相应的解码机制。Content-Encoding主要用语记录文档的压缩方法,下面是它的一个例子: Content-Encoding: gzip。如果一个实体正文采用了编码方式存储,在使用之前就必须进行解码。

    Content-Language:

    Content-Language实体报头域描述了资源所用的自然语言Content-Language允许用户遵照自身的首选语言来识别和区分实体。 如果这个实体内容仅仅打算提供给丹麦的阅读者,那么可以按照如下的方式设置这个实体报头域:Content-Language: da。

    如果没有指定Content-Language报头域,那么实体内容将提供给所以语言的阅读者。

    Content-Length

    Content-Length实体报头域用于指明正文的长度,以字节方式存储的十进制数字来表示,也就是一个数字字符占一个字节,用其对应的ASCII码存储传输。

           要注意的是:这个长度仅仅是表示实体正文的长度,没有包括实体报头的长度。

    Content-Type :

         Content-Type实体报头域用语指明发送给接收者的实体正文的媒体类型。例如:

    Content-Type: text/html;charset=ISO-8859-1

       Content-Type: text/html;charset=GB2312

    Last-Modified :

         Last-Modified实体报头域用于指示资源最后的修改日期及时间。

    Expires :

         Expires实体报头域给出响应过期的日期和时间。通常,代理服务器或浏览器会缓存一些页面。当用户再次访问这些页面时,直接从缓存中加载并显示给用 户,这样缩短了响应的时间,减少服务器的负载。为了让代理服务器或浏览器在一段时间后更新页面,我们可以使用Expires实体报头域指定页面过期的时 间。当用户又一次访问页面时,如果Expires报头域给出的日期和时间比Date普通报头域给出的日期和时间要早(或相同),那么代理服务器或浏览器就 不会再使用缓存的页面而是从服务器上请求更新的页面。不过要注意,即使页面过期了,也并不意味着服务器上的原始资源在此时间之前或之后发生了改变。

          Expires实体报头域使用的日期和时间必须是RFC 1123中的日期格式,例如:

     Expires: Thu, 15 Sep 2005 16:00:00 GMT

           HTTP1.1的客户端和缓存必须将其他非法的日期格式(也包括0)看作已过期。例如,为了让浏览器不要缓存页面,我们也可以利用Expires实体报头 域,设置它的值为0,如下(JSP):response.setDateHeader("Expires",0);

    11、Http与Https优缺点?

    • 通信使用明文不加密,内容可能被窃听,也就是被抓包分析。
    • 不验证通信方身份,可能遭到伪装
    • 无法验证报文完整性,可能被篡改
    • HTTPS就是HTTP加上加密处理(一般是SSL安全通信线路)+认证+完整性保护

    12、Http优化

    • 利用负载均衡优化和加速HTTP应用
    • 利用HTTP Cache来优化网站

    13、Http协议有那些特征?

    1、支持客户/服务器模式;2、简单快速;3、灵活;4、无连接;5、无状态。

    摘自:https://www.cnblogs.com/zhou-test/p/9803478.html

    作者:gtea 博客地址:https://www.cnblogs.com/gtea
  • 相关阅读:
    JObject提取Json字符串中某字段的值
    将DataTable导出为Excel文件的方法
    剑指offer-面试题39-数组中出现次数超过一半的数字-快速排序
    剑指offer-拓展训练-N皇后的问题-全排列
    剑指offer-拓展训练-字符的所有组合-全组合
    剑指offer-面试题38-字符串的排列-全排列
    剑指offer-面试题36-二叉搜索树与双向链表-中序遍历
    java多线程技能-使用多线程-继承Thread类
    剑指offer-面试题35-复杂链表的复制-链表
    剑指offer-面试题34-二叉树中和为某一值的路径-二叉树遍历
  • 原文地址:https://www.cnblogs.com/gtea/p/12801460.html
Copyright © 2020-2023  润新知