【Python3爬虫】Scrapy入门教程

【Python3爬虫】Scrapy入门教程
Python版本：3.5 系统：Windows

一、准备工作

需要先安装几个库（pip，lxml，pywin32，Twisted，pyOpenSSL），这些都比较容易，如果使用的是Pycharm，就可以更方便的安装模块，在settings里可以选择版本进行下载。

如果在命令行模式下输入pip -V出现 'pip' 不是内部或外部命令，也不是可运行的程序或批处理文件，先确保自己在环境变量中配置E:Python3.5Scripts，如果环境变量配置没有问题，但还是出现 'pip' 不是内部或外部命令，也不是可运行的程序或批处理文件，可以在命令行模式下输入python -m pip install --upgrade pip，这步操作之后应该就没问题了。

二、安装scrapy库

在E盘新建一个Scrapy文件夹，然后进入文件夹，shift+鼠标右键，然后打开命令窗口。

在命令行窗口里输入pip install scrapy，就会安装scrapy的最新版本，安装好了之后输入scrapy -h查看相应信息。

三、创建项目

在开始爬取之前，我们必须创建一个新的Scrapy项目。进入我们打算存储代码的目录中，运行下列命令:：
```
scrapy startproject Test
```
该命令将会创建包含下列内容的Test 目录:
```
Test/
    Test/
        __init__.py
    items.py
    pipelines.py
    settings.py
    spiders/
    __init__.py
```
这些文件分别是：

Test/: 该项目的python模块。之后您将在此加入代码。

Test/items.py: 项目中的item文件.

Test/pipelines.py: 项目中的pipelines文件.

Test/settings.py: 项目的设置文件.

Test/spiders/: 放置spider代码的目录.

做完上述准备工作之后，就可以开始写我们的第一个scrapy项目了。（n_n）
相关阅读:
【Linux编程】socket编程
 虚函数相关问题分析
 Android使用ShowcaseView加入半透明操作提示图片的方法
 好的Unix工具的九大启发
 Android ADB工具-截图和录制视频(五)
（三）ng-app的使用困惑和angularJS框架的自己主动载入
 spark一些入门资料
 jQuery -> 怎样【先创建、再改动、后加入】 DOM元素
 centos平台openstack spice配置
 openstack 启用spice
原文地址：https://www.cnblogs.com/TM0831/p/9370845.html

【Python3爬虫】Scrapy入门教程

Python版本：3.5 系统：Windows

一、准备工作

二、安装scrapy库

三、创建项目