简单的说,就是解析html文档的,以前发送一个get请求获取一个页面的html文本后,想要获取里面的数据都是使用正则表达式.(非常的苦逼),
现在用这个获取就very easy! 安装的话在Nu Get上搜索Jumony.Core 下载即可.
具体介绍:http://www.cnblogs.com/Ivony/p/3447536.html
来个简单的Demo,获取博客园C#分类的所有文章标题
著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:卷猫 链接:http://anneke.cn/ArticleInfo/Detial/20 来源:Anneke.cn namespace JumonyCoreDemo { class Program { static void Main(string[] args) { //从指定的地址加载html文档 IHtmlDocument source = new JumonyParser().LoadDocument("http://www.cnblogs.com/cate/csharp"); var aLinks = source.Find(".titlelnk");//按照css选择器搜索符合要求的元素 foreach (var aLink in aLinks) { //<a>Hello</a> 获取hello Console.WriteLine(aLink.InnerText()); //获取 a标签和它的父节点 <h3><a>Hello</a></h3> Console.WriteLine(aLink.Parent()); //<a>Hello</a> 获取hello Console.WriteLine(aLink.InnerHtml()); //获取指定属性名的值 value和AttributeValue都可以获取,但区别是value当 当前属性对象为null时不会抛出异常 Console.WriteLine(aLink.Attribute("href").Value()); Console.WriteLine(aLink.Attribute("href").AttributeValue); } Console.ReadKey(); } } }
熟悉html css的非常容易上手,不得不说真的好用
Demo下载:https://github.com/zhenzhenkeai/JumonyCoreDemo