• 以读取博客园随笔备份为例 将xml 序列化成json,再序列化成对象


    资源下载https://files.cnblogs.com/codealone/ConsoleApplication2.zip

    Json查看工具:https://files.cnblogs.com/codealone/JsonView.zip

    博客园随笔备份之后,得到的文件格式如下:

      

      我们要读取上述xml,主要是获得channel节点下的所有内容,在平时的工作过程中,觉得json数据要比xml更加容易操作些,于是想,能不能将其转换成json格式,进一步转换成对象。下一步的工作则是将 rss节点下的内容,转换为json。

      主要代码如下:

                var xml = File.ReadAllText(@"D:\cnblogs.xml");//该xml为博客园随笔备份文件
                XmlDocument doc = new XmlDocument();
                doc.LoadXml(xml);
                //获取rss节点下的内容
                var channelXml = doc.SelectSingleNode("rss").InnerXml;
                //进一步细化xml格式,内容仅为rss节点下的内容
                doc.LoadXml(channelXml);
                //将xml序列化成json,并且去掉根节点
                var json = JsonConvert.SerializeXmlNode(doc,Newtonsoft.Json.Formatting.None,true);

    此时json的内容如下:
        

     此时由xml到json的转换就完成了,下一步,则是如何将json转换成对象。通过查看上述json的结构,将每个节点看作一个对象,很容易定义出数据结构,具体如下:

           public class Channel
            {
                public string title { get; set; }
                public string link { get; set; }
                public string description { get; set; }
                public string language { get; set; }
                public string lastBuildDate{ get; set; }
                public string pubDate { get; set; }
                public string ttl { get; set; }
                public List<Channel_Item> item { get; set; }
            }
    
            public class Channel_Item
            {
                public string title { get; set; }
                public string link { get; set; }
                public string author { get; set; }
                public string pubDate { get; set; }
                public string guid { get; set; }
                public Item_Description description { get; set; }
            }
    
            public class Item_Description
            {
                //默认以变量名称作为json序列化的节点,由于该节点内容不符合变量定义规范,则显示指定即可
                [JsonProperty("#cdata-section")]
                public string content { get; set; }
            }

    最后一步,则是将刚刚得到的json序列化成我们定义的数据结构:

                var channel = JsonConvert.DeserializeObject<Channel>(json);

    到此为止,我们将xml转换成对象的工作就完成了,打印读取的内容:

      

    问题:

      在实际的测试过程中,发现如果备份文件中,仅有一个item节点的时候,序列化后的json item部分如下: 

    {
        "item": {
            "title": "测试",
            "link": "http://www.cnblogs.com/codealone/archive/2013/04/14/3020195.html",
            "author": "冲动",
            "pubDate": "Sun, 14 Apr 2013 04:37:00 GMT",
            "guid": "http://www.cnblogs.com/codealone/archive/2013/04/14/3020195.html"
        }
    }

    此时是不可以直接序列化成List<Channel_Item>对象,针对此情况,不想更多的去改变代码,在item仅有一个的时候,手动添加一个空节点,此时对应的json为:

    "item": [
        {
          "title": "测试",
          "link": "http://www.cnblogs.com/codealone/archive/2013/04/14/3020195.html",
          "dc:creator": {
            "@xmlns:dc": "http://purl.org/dc/elements/1.1/",
            "#text": "冲动"
          },
          "author": "冲动",
          "pubDate": "Sun, 14 Apr 2013 04:37:00 GMT",
          "guid": "http://www.cnblogs.com/codealone/archive/2013/04/14/3020195.html",
          "description": {
            "#cdata-section": "<p>测试内容</p>"
          }
        },
        null
      ]

    上述json格式就可以轻松的序列化成List<Channel_Item>对象了。

  • 相关阅读:
    前端模板网站
    python之进程,线程,协程
    Docker学习之dockerhub
    Docker学习04
    Docker学习03
    http://mrdede.com/(织梦先生)
    爬取图片
    requests实战之药监总局数据爬取
    requests实战之豆瓣电影爬取
    requests实战之网页采集器
  • 原文地址:https://www.cnblogs.com/codealone/p/3020161.html
Copyright © 2020-2023  润新知