• Python的虚拟机安装已经如何配置Scrapy for Mac


    时间:2018年2月21日

    因为时间问题,以下笔记就粗略记录。仅作为个人笔记为用

    安装virtualenv和virtualenvwrapper

    如何安装的细节下面这篇也有介绍,包括如何使用切换虚拟机也有介绍

    http://blog.csdn.net/xshalk/article/details/47301339

    其中如何找 .bash_profile文件

      在Finder用快捷键command+shift+G输入打开目录~/
      再快捷键:shift+comman+. 显示隐藏文件即可找到这个文件
      修改保存之后,再在终端命令行运行 source ~/.bash_profile,就会执行这个文件

    后来在安装过程遇到一些问题,再经过百度,下面这篇可以解决python路径的问题

    https://www.jianshu.com/p/2999e258cbf9

    另外,创建不需要任何包的虚拟环境 mkvirtualenv --no-site-packages venv

    接着步骤就是:workon虚拟环境,pip3 install 一系列包,

    然后cd进入到需要创建项目的目录下创建项目,

    再cd进入项目根目录创建一个爬虫的py文件,

    注意,这里下面截图有个小错误:scrapy genspider name url,这里的url不需要“http://”:

    然后就是用pycharm来open这个项目,并且要记得重新选择虚拟环境配置,直接就选前面workon选中的虚拟环境。

     

    然后是调试技巧,在scrapy.cfg同级目录下新建main.py文件

    然后代码如下:

     1 # 通过这个文件来调试,可以提高开发效率
     2 
     3 from scrapy.cmdline import execute
     4 
     5 import sys
     6 import os
     7 
     8 '''
     9 设置工程的目录
    10 os.path.abspath(__file__) 获取当前文件的目录
    11 
    12 os.path.dirname(file的全路径) 获取当前file的父目录 
    13 
    14 打印测试
    15 print(os.path.abspath(__file__))
    16 print(os.path.dirname(os.path.abspath(__file__)))
    17 
    18 '''
    19 
    20 # print(os.path.abspath(__file__))
    21 # print(os.path.dirname(os.path.abspath(__file__)))
    22 sys.path.append(os.path.dirname(os.path.abspath(__file__)))
    23 
    24 
    25 # path = os.path.dirname(os.path.abspath(__file__))+"/ArticleSpider"
    26 # sys.path.append(path)
    27 # print(sys.path)
    28 
    29 '''执行命令的方法 —— 查询股票名字代码列表'''
    30 # execute("scrapy crawl quote_eastmoney_com".split())
    31 
    32 '''执行命令的方法 —— 查询股票名字代码列表'''
    33 execute("scrapy crawl data_eastmoney_com_hsgtcg".split())
  • 相关阅读:
    Spring MVC之@RequestMapping 详解
    Liferay 6.1开发学习
    学习软件产品包装
    gzip优化网络传输量提高传输效率[转]
    spring mvc事务注解
    Spring MVC 注解[转]
    WebMagic的设计参考了业界最优秀的爬虫Scrapy
    springMVC 注解版
    微信开放JS-SDK,助力网页开发
    解救设计师的8大神器
  • 原文地址:https://www.cnblogs.com/goodboy-heyang/p/8456924.html
Copyright © 2020-2023  润新知