• WebClient读取网络数据


    WebClient读取网络数据

        C#读取网络文件数据,可以由下面这个函数实行:System.Net.WebClient类可以支持直接从网络上读取数据,下面列举下有用的方法:

    ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

        WebClient.DownloadData (String)                                  以 Byte 数组形式通过指定的 URI 下载资源

        WebClient.DownloadData (Uri)                                       以 Byte 数组形式通过指定的 URI 下载资源

        WebClient.DownloadFile (String, String)                        将具有指定 URI 的资源下载到本地文件

        WebClient.DownloadFile (Uri, String)                             将具有指定 URI 的资源下载到本地文件

        WebClient.DownloadString (String)                                以 String 形式下载指定的资源

        WebClient.DownloadString (Uri)                                     以 Uri 形式下载指定的资源

    --------------------------------------------------------------------------------------------------------------------------------------------------------------------------

         对于以上这些方法,均有xxxAsync方法与之对应,目的是使得xxx方法不会阻止调用线程。如WebClient.DownloadFileAsync (Uri, String)方法,就是异步下。

        其中,WebClient.DownloadData (Uri) 方法返回Byte数组,容易出现中文乱码问题,因为中文是双字节数据,而返回byte类型,因此这时候,中文便容易出现乱码,解决方案可能是转换为unicode什么的吧。所以个人建议用WebClient.DownloadString(Uri),如果此时还出现乱码问题,便是字符集问题了,可以用

                                   WebClient client = new WebClient();
                                   string s = client.DownloadString("http://www.cnblogs.com");

                                   s=Encoding.UTF8.GetString(Encoding.Default.GetBytes(s);

    这样便可以了。

    ----------------------

    c#利用WebClient和WebRequest获取网页源代码的比较

    前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码。下面分别说明这两种方法的实现。

    WebClient类获取网页源代码

    WebClient类

      WebClient类位于System.Net命名空间下,WebClient类提供向URI标识的任何本地、Intranet或Internet资源发送数据以及从这些资源接收数据的公共方法。

    源代码

    ///引用命名空间
    using System.IO;
    using System.Net;
    using System.Text;


    PageUrl = "http://www.webkaka.com"; //需要获取源代码的网页
    WebClient wc = new WebClient(); // 创建WebClient实例提供向URI 标识的资源发送数据和从URI 标识的资源接收数据
    wc.Credentials = CredentialCache.DefaultCredentials; // 获取或设置用于对向 Internet 资源的请求进行身份验证的网络凭据。

    ///方法一:
    Encoding enc = Encoding.GetEncoding("GB2312"); // 如果是乱码就改成 utf-8 / GB2312
    Byte[] pageData = wc.DownloadData(PageUrl); // 从资源下载数据并返回字节数组。
    ContentHtml.Text = enc.GetString(pageData); // 输出字符串(HTML代码),ContentHtml为Multiline模式的TextBox控件
       
    /// 方法二:
    /// ***************代码开始**********
    /// Stream resStream = wc.OpenRead(PageUrl); //以流的形式打开URL
    /// Encoding enc = Encoding.GetEncoding("GB2312"); // 如果是乱码就改成 utf-8 / GB2312
    /// StreamReader sr = new StreamReader(resStream,enc); //以指定的编码方式读取数据流
    /// ContentHtml.Text = sr.ReadToEnd(); //输出(HTML代码),ContentHtml为Multiline模式的TextBox控件
    /// resStream.Close();
    /// **************代码结束********
    /// 
    wc.Dispose();



    WebRequest类获取网页源代码

    WebRequest类

    WebRequest类是.NET Framework中“请求/响应”模型的abstract基类,用于访问Internet数据。使用WebRequest类请求/响应模型的应用程序可以用协议不可知的方式从Internet请求数据,在这种方式下,应用程序处理WebRequest类的实例,而协议特定的子类则执行请求的具体细节,请求从应用程序发送到某个特定的URI,如服务器上的网页。URI从一个为应用程序注册的WebRequest子类列表中确定要创建的适当子类。注册WebRequest子类通常是为了处理某个特定的协议(如HTTP或FTP),但是也可以注册它以处理对特定服务器或服务器上的路径的请求。

    WebRequest类中最常用的是Create方法,Create方法用于为指定的URI方案初始化新的WebRequest实例。

      语法:

    public static WebRequest Create
    (
      string requestUriString
    )
      参数:

      requestUriString:标识Internet资源的URI。

      返回值:特定URI方案的WebRequest子类。

      注意:Create方法将运行时确定的WebRequest类的子类作为与requestUri最接近的注册匹配项返回。例如,当以http://开头的URI在requestUri中传递时,由Create返回一个HttpWebRequest。如果改为传递以file://开头的URI,则Create方法将返回FileWebRequest实例。.NET Framework包括对http://和file:// URI方案的支持。


    WebResponse类

      WebResponse类是abstract基类,协议特定的响应类从该抽象基类派生。应用程序可以使用 WebResponse类的实例以协议不可知的方式参与请求和响应事务,而从WebResponse类派生的协议特定的类携带请求的详细信息。

      在WebResponse类中最常用的是GetResponse方法,GetResponse方法用于当在子类中被重写时,返回对 Internet 请求的响应

      语法:

      public virtual WebResponse GetResponse ()

      返回值:包含对Internet请求的响应的WebResponse。


    源代码

    ///引用命名空间
    using System.IO;
    using System.Net;
    using System.Text;

    PageUrl = "http://www.webkaka.com"; //需要获取源代码的网页
    WebRequest request = WebRequest.Create(PageUrl); //WebRequest.Create方法,返回WebRequest的子类HttpWebRequest
    WebResponse response = request.GetResponse(); //WebRequest.GetResponse方法,返回对 Internet 请求的响应
    Stream resStream = response.GetResponseStream(); //WebResponse.GetResponseStream 方法,从 Internet 资源返回数据流。 
    Encoding enc = Encoding.GetEncoding("GB2312"); // 如果是乱码就改成 utf-8 / GB2312
    StreamReader sr = new StreamReader(resStream, enc); //命名空间:System.IO。 StreamReader 类实现一个 TextReader (TextReader类,表示可读取连续字符系列的读取器),使其以一种特定的编码从字节流中读取字符。 
    ContentHtml.Text = sr.ReadToEnd(); //输出(HTML代码),ContentHtml为Multiline模式的TextBox控件
    resStream.Close(); 
    sr.Close();
  • 相关阅读:
    构建之法 团队和流程
    构建之法之个人技术和流程重点介绍
    几种数据库连接
    Ckidt
    hibernate_04_hibernate多对多的关系映射
    hibernate_03_hibernate一对多的关系映射
    hibernate_02_hibernate的入门
    hibernate_01_SSH环境搭建
    SpringBoot_05_ssm拦截器和默认欢迎页面的设置
    SSM14-通过AOP实现日志记录
  • 原文地址:https://www.cnblogs.com/anduinlothar/p/2662222.html
Copyright © 2020-2023  润新知