• Python_scrapyRedis零散


    1.

    # Redis
    
    1.解压,配环境变量
    
    2.win上设置自启动
    
        redis-server --service-install D:
    edis
    edis.windows.conf --loglevel verbose
    
    3.启动redis
    
        redis-server E:
    edis
    edis-latest
    edis.windows.conf
    
    4.进入数据库,另起一个cmd框
    
        redis-cli -h 127.0.0.1 -p 6379
    
    5.在 redis.windows.conf 中解注 “requirepass foobared”   将foobared改为密码;注:不能有空格
    
    6.重开始登陆 
    
        redis-cli -h 127.0.0.1 -p 6379 -a 123456
    ---
    
    ## 1.非关系型数据库 Nosql(not noly sql)不是典型数据库 / Key-Values存储系统
    
    - momgoDB 的优势:支持多种查询和支持创建索引
    - Redis 速度极快,价格高;持久化和热备时候消耗大量带宽和运力  → 5种数据类型的几种常用方法,默认不支持查询,可以在键上设置
    
    注:memcached 是sql中继器,不算Nosql
    
    redis的字符类型
    
    1.string
    
    2.hash
    
    3.lsit
    
    4.set
    
    ---
    十大算法 快速排序、
    多进程多线程
    
    ---
    购物车 以前是session,现在是redis
    功能:
    
        商品展示
        购物车操作
        添加删除商品
        结算
        ...
    
    ---
    ## scrapy
    
    ### 1.解释scrapy的工作流程
    
    ### 2.scrapy的优势
    
        scrapy自带多进程,能执行整站采集,自动调度器
    
    ### 3.多主机爬虫架构
    
        待整理:...
        一个起始spider(共享主队列)
        一个主机多个从机
        分布式进程
    
    ### 在scrapy中使用redis,,去重
    
        “指纹”:当前对象的唯一标示
        redis每次执行前检查指纹是否存在,再进行添加任务
    
    ### 分布式防止终端
    
    ### 如何实现架构?
    
        scrapy自带框架
    
    ## scrapy-redis 的分布式实现
    
        master  主机
        slave    副机
        可移植性好
        
    ## 
  • 相关阅读:
    POJ 1988 Cube Stacking(带权并查集)
    POJ 1414 Life Line(搜索)
    POJ 3468 A Simple Problem with Integers (线段树多点更新模板)
    二叉树前序遍历+中序遍历->后序遍历
    POJ 1061 青蛙的约会(扩展欧几里得)
    XDOJ 1020 ACMer去刷题吧(基础dp)
    POJ 2823 Sliding Window (线段树区间查询)
    线段树学习(一)
    UVA 294 Divisors( 因子分解)
    YYN图论学习路线(推荐)
  • 原文地址:https://www.cnblogs.com/hellangels333/p/9046563.html
Copyright © 2020-2023  润新知