这两天看Scrapy,看到item这个东西,觉得有点抽象,查了一下,有点明白了。
Item 是保存爬取到的数据的容器;其使用方法和python字典类似, 并且提供了额外保护机制来避免拼写错误导致的未定义字段错误。
爬取的主要目标就是从非结构性的数据源提取结构性数据,例如网页。 Scrapy提供 Item 类来满足这样的需求。
Item 对象是种简单的容器,保存了爬取到得数据。 其提供了 类似于词典(dictionary-like) 的API以及用于声明可用字段的简单语法。
来源于:
http://scrapy-chs.readthedocs.org/zh_CN/latest/intro/tutorial.html#item
http://blog.csdn.net/iloveyin/article/details/41309609