Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用

Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
简介

本文介绍net处理html页面元素的工具类(HtmlAgilityPack.dll)的使用，用途比较多的应该是例如采集类的功能，采集到的html字符串要怎样处理是一个头痛的问题，如果是截取就太麻烦了而且容易出错。所有就用到本文的第三方dll来处理了。

下载

下载地址：http://htmlagilitypack.codeplex.com/

点击“download”按钮直接下载。

使用

1.添加HtmlAgilityPack.dll引用（引用类using HtmlAgilityPack;）。

2.简单根据html中input的id获取value代码如下：
```
// 模拟用户请求
WebClient webClient = new WebClient();
webClient.Encoding = System.Text.Encoding.UTF8;
string htmlContext = webClient.DownloadString("http://stone_w.cnblogs.com/");
webClient.Credentials = CredentialCache.DefaultCredentials; // 添加授权证书
webClient.Headers.Add("User-Agent", "Microsoft Internet Explorer");
webClient.Headers.Add("Host", "www.cnblogs.com");

// 获取html元素（htmlContext为html页面字符串）
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(htmlContext);  // 加载html页面
HtmlNode navNode = htmlDoc.GetElementbyId("id名称");
Response.Write(navNode.Attributes["value"].Value);
```
总结

HtmlAgilityPack可以根据id查询value，还可以获取单个元素节点，都是HtmlDocument类的内置方法，大家可以试着练练。谢谢完~
关注下面二维码，订阅更多精彩内容。

关注公众号（加好友）：

作者：王磊的博客
出处： http://vipstone.cnblogs.com/
相关阅读:
Redis 常用配制参数
 CentOS 7 环境下配制 Redis 服务
 Mysql ERROR 1032 (HY000): Can't find record in TABLE
Linux下利用Shell使PHP并发采集淘宝产品
 Linux C连接Mysql
PHP采集淘宝商品
 关于Certificate、Provisioning Profile、App ID的介绍及其之间的关系
 mac下svn无法上传.a文件的问题
 armv6, armv7, armv7s的区别
 【转】图片处理：颜色矩阵和坐标变换矩阵
原文地址：https://www.cnblogs.com/vipstone/p/2701869.html

Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用

简介

下载

使用

总结