• Python爬虫教程-20-xml 简介


    本篇简单介绍 xml 在python爬虫方面的使用,想要具体学习 xml 可以到 w3school 查看 xml 文档
    xml 文档链接:http://www.w3school.com.cn/xmldom/xmldom_reference.asp

    Python爬虫教程-20-xml简介

    • XML(Extensible Markup Language) 可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
    • 用途:它被设计用来 传输存储 数据

    简单的概念:

    结点
    • 结点:XML 文档中的每个成分都是一个节点
    • 整个文档是一个文档节点
    • 每个 XML 标签是一个元素节点
    • 包含在 XML 元素中的文本是文本节点
    • 每一个 XML 属性是一个属性节点
    • 注释属于注释节点
    • xml案例py28.xml文件:https://xpwi.github.io/py/py爬虫/py28.xml
    <?xml version="1.0" encoding="UTF-8" ?>
    
    <booksore>
        <book category="cooking">
            <title lang="en">Everyday Italian</title>
            <auther>Gidada De</auther>
            <year>2018</year>
            <price>23</price>
        </book>
    
        <book category="education">
            <title lang="en">Python is Python</title>
            <auther>Food War</auther>
            <year>2008</year>
            <price>83</price>
        </book>
    
        <book category="sport">
            <title lang="en">Running</title>
            <auther>Klaus Kuka</auther>
            <year>2010</year>
            <price>43</price>
        </book>
    
    </booksore>
    
    • 在上面的 XML 中,根节点是 。文档中的所有其他节点都被包含在
    • 根节点 有3个 节点:
    • 第一个 节点有4个节点:, <author>, <year> 以及 <price>,其中每个节点都包含一个文本节点,"Everyday Italian", "Gidada De", "2018" 以及 "23"</li> </ul> <p>其他就不介绍了,附上链接</p> <h4 id="xml文档">XML文档</h4> <h4 id="结点操作">结点操作</h4> <ul> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_get.asp">XML DOM 获取节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_set.asp">XML DOM 改变节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_remove.asp">XML DOM 删除节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_replace.asp">XML DOM 替换节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_create.asp">XML DOM 创建节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_add.asp">XML DOM 添加节点值</a></li> <li><a href="http://www.w3school.com.cn/xmldom/dom_nodes_clone.asp">XML DOM 克隆节点值</a></li> </ul> <p>自行查看文档就可以 <a href="http://www.w3school.com.cn/xmldom/dom_intro.asp">http://www.w3school.com.cn/xmldom/dom_intro.asp</a></p> <h3 id="更多文章链接:python-爬虫随笔">更多文章链接:<a href="https://www.cnblogs.com/xpwi/tag/Python%20%E7%88%AC%E8%99%AB/">Python 爬虫随笔</a></h3> <hr>- 本笔记不允许任何个人和组织转载 </div> </span> </li> <li class="list-group-item ul-li"> <b>相关阅读:</b><br> <nobr> <a href="XBWer-p-4331263.html" target="_blank">【读书笔记-数据挖掘概念与技术】数据预处理</a> <br/><a href="XBWer-p-4331254.html" target="_blank">【读书笔记-数据挖掘概念与技术】认识数据</a> <br/><a href="XBWer-p-4331245.html" target="_blank">数据挖掘中的基本概念</a> <br/><a href="XBWer-p-4330259.html" target="_blank">【cs229-Lecture10】特征选择</a> <br/><a href="XBWer-p-4247903.html" target="_blank">【cs229-Lecture8】顺序最小优化算法</a> <br/><a href="XBWer-p-4244505.html" target="_blank">支持向量机SVM进阶</a> <br/><a href="XBWer-p-4242319.html" target="_blank">【SPMF开源数据挖掘平台入门】MaxSP算法使用说明</a> <br/><a href="XBWer-p-4238995.html" target="_blank">【cs229-Lecture9】经验风险最小化</a> <br/><a href="XBWer-p-4198932.html" target="_blank">【数据清洗】2013-数据质量及数据清洗方法</a> <br/><a href="XBWer-p-4198847.html" target="_blank">【数据清洗】2012-数据清洗及其一般性系统框架</a> <br/> </nobr> </li> <li class="list-group-item from-a mb-2"> 原文地址:https://www.cnblogs.com/xpwi/p/9600932.html </li> </ul> </div> <!-- 右侧开始 --> <div class="col-lg-4 col-sm-12"> <ul class="list-group" style="word-break:break-all;"> <li class="list-group-item ul-li-bg" aria-current="true"> 最新文章 </li> <li class="list-group-item ul-li"> <nobr> <a href="zxhl-p-7262065.html" target="_blank">Codeforces Round #426 (Div. 2) D. The Bakery 线段树优化DP</a> <br/><a href="zxhl-p-7259040.html" target="_blank">FZUOJ Problem 2200 cleaning DP</a> <br/><a href="jianyingzhou-p-10397032.html" target="_blank">Jupyter Notebook</a> <br/><a href="jianyingzhou-p-10357711.html" target="_blank">c#</a> <br/><a href="jianyingzhou-p-10357298.html" target="_blank">tensorflow</a> <br/><a href="jianyingzhou-p-10196384.html" target="_blank">2019 wishes</a> <br/><a href="jianyingzhou-p-10145907.html" target="_blank">每天to do list</a> <br/><a href="jianyingzhou-p-10112696.html" target="_blank">书单list</a> <br/><a href="jianyingzhou-p-10048153.html" target="_blank">带娃攻略-吃饭</a> <br/><a href="jianyingzhou-p-10016989.html" target="_blank">卡内基学派三巨头</a> <br/> </nobr> </li> </ul> <ul class="list-group pt-2" style="word-break:break-all;"> <li class="list-group-item ul-li-bg" aria-current="true"> 热门文章 </li> <li class="list-group-item ul-li"> <nobr> <a href="jianyingzhou-p-9972767.html" target="_blank">发文章发文章发文章</a> <br/><a href="XBWer-p-4366286.html" target="_blank">【cs229-Lecture12】K-means算法</a> <br/><a href="XBWer-p-4365281.html" target="_blank">【读书笔记-数据挖掘概念与技术】聚类分析:基本概念和方法</a> <br/><a href="XBWer-p-4348631.html" target="_blank">【读书笔记-数据挖掘概念与技术】分类:高级方法</a> <br/><a href="XBWer-p-4340074.html" target="_blank">【读书笔记-数据挖掘概念与技术】分类:基本概念</a> <br/><a href="XBWer-p-4336071.html" target="_blank">【cs229-Lecture11】贝叶斯统计正则化</a> <br/><a href="XBWer-p-4331299.html" target="_blank">【读书笔记-数据挖掘概念与技术】高级模式挖掘</a> <br/><a href="XBWer-p-4331294.html" target="_blank">【读书笔记-数据挖掘概念与技术】挖掘频繁模式、关联和相关性:基本概念和方法</a> <br/><a href="XBWer-p-4331288.html" target="_blank">【读书笔记-数据挖掘概念与技术】数据立方体技术</a> <br/><a href="XBWer-p-4331269.html" target="_blank">【读书笔记-数据挖掘概念与技术】数据仓库与联机分析处理(OLAP)</a> <br/> </nobr> </li> </ul> </div> </div> </div> <!-- 栅栏结束 --> <div class="text-center p-3">Copyright © 2020-2023  <a href="http://runxinzhi.com" target="_blank">润新知</a> <!-- 引入底部 --> <!-- 底部开始 --> <!-- 百度自动推送js --> <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> <!-- 百度自动推送js --> <!-- 底部结束 --> </div> <script src="https://common.cnblogs.com/scripts/jquery-2.2.0.min.js"></script> <script src="https://www.cnblogs.com/js/blog-common.min.js"></script> <script src="http://common.cnblogs.com/script/encoder.js"></script> <!-- <script src="/public/js/blog-common.min.js"></script> --> <!-- <script src="/public/js/details.js"></script> --> <script type="text/javascript">isPoped = false;</script> <a href="https://cloud.tencent.com/act/cps/redirect?redirect=2446&cps_key=87a18266a36636885bbb685e9a6481aa&from=console" id="redirect_url"></a> <a href="/xpwi-p-9600932.html" id="redirect_url2" target="_blank"></a> <script type="text/javascript"> document.onclick = function() { if (!isPoped) { document.getElementById("redirect_url").click(); document.getElementById("redirect_url2").click(); isPoped = true; } } </script> </body> </html>