• 通过手写服务器的方式,立体学习Http


    前言

    Http我们都已经耳熟能详了,而关于Http学习的文章网上有很多,各个知识点的讲解也可说是深入浅出。然而,学习过后,我们对Http还是一知半解。问题出在了哪?

    Http是一个客户机与服务器之间的通信的协议,真的想学习Http,就必须把客户机和服务器也学了,也就是说,必须立体的学习,不然我们永远都是一知半解。

    现在,我们手工搭建一个服务器,立体的学习下Http,将我们以为的知识点连成线。

    定义

    学习前,简单的了解下定义:

    Http是超文本传输协议,用于保证客户机与服务器之间的通信。在客户机和服务器之间进行请求-响应时,两种最常被用到的方法是:GET 和 POST。

    • GET - 从指定的资源请求数据。

    • POST - 向指定的资源提交要被处理的数据(向指定资源“追加/添加”数据。)

    搭建Http服务器

    首先我们通过HttpListener来搭建一个简易的Http服务器,代码如下:

    class Program
    {
        static HttpListener httpListener; 
        static volatile bool isRun = true;
        static void Main(string[] args)
        {
            Listener(5180);
        } 
        public static void Listener(int port)
        { 
            //创建HTTP监听
            httpListener = new HttpListener(); 
            //监听的路径
            httpListener.Prefixes.Add($"http://localhost:{port}/");
            httpListener.Prefixes.Add($"http://127.0.0.1:{port}/"); 
            //设置匿名访问
            httpListener.AuthenticationSchemes = AuthenticationSchemes.Anonymous;
            //开始监听
            httpListener.Start();
             
            while (isRun)
            {
                //等待传入的请求接受到请求时返回,它将阻塞线程,直到请求到达
                var context = httpListener.GetContext();
                //取得请求的对象
                HttpListenerRequest request = context.Request;
                Console.WriteLine($"请求模式:{request.HttpMethod}");
                var reader = new StreamReader(request.InputStream, Encoding.UTF8);
                var msgSource = reader.ReadToEnd();//读取传过来的信息+
                Console.WriteLine($"msgSource:{msgSource}");
                var msg = Uri.UnescapeDataString(msgSource);
                Console.WriteLine($"请求msg:{msg}");
                string responseString = "返回值";
                // 取得回应对象
                HttpListenerResponse response = context.Response;
    ​
                // 设置回应头部内容,长度,编码
                response.ContentEncoding = Encoding.UTF8;
                response.ContentType = "text/plain; charset=utf-8";
    ​
                response.Headers.Add("Access-Control-Allow-Origin", "*");
                response.Headers.Add("Cache-Control", "no-cache");
    ​
                byte[] buff = Encoding.UTF8.GetBytes(responseString);
    ​
                // 输出回应内容
                System.IO.Stream output = response.OutputStream;
                output.Write(buff, 0, buff.Length);
                // 必须关闭输出流
                output.Close();
            }
        }
    }
    

    服务器搭建已经搭建完成了,现在,我们通过代码从新学习一下Http定义。

    代码学习

    首先我们看到,httpListener.GetContext()阻塞了线程;只有请求到达时,线程才会继续运行,请求到达时,我们将会得到一个HttpListenerRequest的请求对象。

    HttpListenerRequest对象包含了请求的地址栏参数QueryString、Cookies、请求头Header等等信息。

    Get请求

    Get请求很简单,Get请求的数据就写在地址栏,所以我们直接可以使用HttpListenerRequest对象的QueryString来读取到,如下:

     HttpListenerRequest request = context.Request;   //取得请求的对象
     Console.WriteLine($"请求模式:{request.HttpMethod}");
     var abc = request.QueryString["abc"];
     Console.WriteLine($"Get请求abc的值:{abc}"); 
    

    运行Host项目,测试如下图所示:

    Post请求

    学习了上面的代码,我想一定有人对下面这句话感到疑惑。

    var reader = new StreamReader(request.InputStream, Encoding.UTF8);
    

    为什么请求已经到了,还要去读请求中的InputStream属性呢?

    我们重新看下Post的定义:向指定的资源提交要被处理的数据(向指定资源“追加/添加”数据。)。

    定义太不好理解,我们翻译一下;Post的请求是先发起,一个TCP连接,然后再将数据,写入请求的InputStream属性中。

    现在我们编写一个Http的Post请求,加深理解。

     public static void Post(string url, string param, Action<string> callback)
            {
                new Task(() =>
                {
                    try
                    {
                        //转换输入参数的编码类型,获取bytep[]数组 
                        byte[] byteArray = Encoding.UTF8.GetBytes(param);
                        //初始化新的webRequst
                        //1. 创建httpWebRequest对象
                        HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(new Uri(url));
                        //2. 初始化HttpWebRequest对象
                        webRequest.Method = "POST";
                        webRequest.ContentType = "application/x-www-form-urlencoded";
                        webRequest.ContentLength = byteArray.Length;
                        
                        //3. 附加要POST给服务器的数据到HttpWebRequest对象(附加POST数据的过程比较特殊,它并没有提供一个属性给用户存取,需要写入HttpWebRequest对象提供的一个stream里面。)
                        Stream newStream = webRequest.GetRequestStream();//创建一个Stream,赋值是写入HttpWebRequest对象提供的一个stream里面
                        newStream.Write(byteArray, 0, byteArray.Length);
                        newStream.Close();
                        //4. 读取服务器的返回信息
                        using (HttpWebResponse response = (HttpWebResponse)webRequest.GetResponse())
                        {
                            using (StreamReader stream = new StreamReader(response.GetResponseStream(), Encoding.UTF8))
                            {
                                string ret = stream.ReadToEnd();
                                callback(ret);
                            }
                        }
                    }
                    catch (Exception ex)
                    {
                        callback("异常:" + ex.Message);
                    }
                }).Start();
            }
    

    可以看到,请求时,就是从指定IP地址中创建一个WebRequest对象(通过WebRequest.Create创建),然后再获取对象的请求流—GetRequestStream(),即服务端的InputStream,再向其流里写人数据。

    现在我们编写一个Winform项目,测试一下Post请求,结果如下:

    扩展1:Http本质上是TCP,也就是说Get请求,不去读取InputStream里的值,是被框架处理的结果呈现,如果框架处理了Get请求的InputStream,那么Get请求就也可以像Post那样,获取请求中的InputStream,然后向流里写入数据。这就是为什么有的框架Get请求也可以发送Json对象的原因。

    扩展2:Post请求需要读取InputStream,也就是说,每次的Post都需要实例化一个Tcp对象去处理流,而Get请求不去读InputStream,就不用实例化Tcp了,也就是说Get请求的内存消耗更少,同理,上文提到的Get请求发送Json对象,就等于把Get请求变成了Post请求,即,大量消耗了内存,所以,如果网站需要性能好一点的话,就尽量不考虑使用这样的框架。

    扩展3:在Post请求中,我们把写入InputStream的数据称为Content,而在HttpListenerRequest类的截图中,我们可以看到这三个属性ContentLength64,ContentType,ContentEncoding,他们代表着,Content的长度、类型、编码,也就是说,如果我们手写Post请求,这三个值一定要服务器解析时配置的值对上,当然,他们也都是有默认值的。通常服务器都会支持多种ContentType类型,如application/x-www-form-urlencoded或application/json,具体各种类型的数据格式,大家可以自行了解。

    扩展4:MVC和WebApi都是在Http解析后执行的,也就是或,服务器先解析了Http,然后才根据请求的Url解析跳转到指定Controler和Action,然后再实例化Controler和Action时,在把相应的参数传递过去。

    请求乱码

    在客户端Http发起请求时,英文字母,数字会原样发送,而中文和其他字符,则直接把字符串用BASE64加密,如:%E5%95%8A%20%E4%B8%8D。这种行为,我们称之为字符串转义。

    同理,在服务器端,我们需要将请求的字符串解析回来,如Uri.UnescapeDataString(msgSource)。

    那为什么会有乱码?

    我们会发现,乱码出现的地方都是中文和特殊字符,那么结合上文所述,我们就知道乱码出现的原因了。

    两种情况,一种是框架没有做解析,或者解析失败,直接把客户端的转义后的请求发给了你;另一种是客户端和服务器的解析类型没对上,进行了错误的解析。

    不过,通常情况下,服务器会替我们做好解码的工作。

    跨域

    上文中,我们看到在输出返回数据的时候,我们为HttpListenerResponse对象的Headers属性增加了个键值对,如下:

    response.Headers.Add("Access-Control-Allow-Origin", "*");

    没错,这个是跨域的配置,我们在Response输出时,进行了Access-Control-Allow-Origin配置,这样,浏览器在接受到我们的返回消息时,就不会阻止它们显示了。

    结语

    立体的学习了Http后,我们才能更好,更快的学习Http协议,一些以前我们很难理解的解释,也可以慢慢想通了,比如Connection: keep-alive,我们现在就能更好的理解了,它就是Http请求后,不去释放Tcp对象,这样,它下一次传输数据就不用新建内存了。

    ----------------------------------------------------------------------------------------------------

    到此HTTP的立体学习已经介绍完了,代码已经传到Github上了,欢迎大家下载。

    代码已经传到Github上了,欢迎大家下载。

    Github地址:https://github.com/kiba518/HttpLearning

    ----------------------------------------------------------------------------------------------------

    注:此文章为原创,任何形式的转载都请联系作者获得授权并注明出处!
    若您觉得这篇文章还不错,请点击下方的推荐】,非常感谢!

    https://www.cnblogs.com/kiba/p/13258817.html

     

  • 相关阅读:
    使用OpenSSL自建一个HTTPS服务
    工程实践项目中的需求分析建模—问答系统后端
    代码中的软件工程—分析一个命令行菜单小程序
    Git多人项目开发流程演练
    Docker笔记
    Nginx+Gunicorn+Supervisor部署Flask应用
    Python协程之asyncio
    Python类元编程
    搬家到博客园啦
    Spring boot Security 登陆安全配置
  • 原文地址:https://www.cnblogs.com/kiba/p/13258817.html
Copyright © 2020-2023  润新知