• pipeline详解


    一.  pipeline设计模式简介

    pipeline模式又称为流水线模式,pipeline又称为管道,是一种在计算机普遍使用的技术,举个最普遍的例子,如下图所示cpu流水线,一个流水线分为4个部分,每个部分可以独立工作,于是可以处理多个数据流。linux管道也是一个常用的管道技术,其字符处理功能十分强大,在面试过程中长被问到。在分布处理领域,由于管道模式是数据驱动,而目前流行的spark分布式处理平台也是数据驱动的,两者非常合拍,于是在park的新的api里面pipeline模式得到了广泛的应用。还有java web中的struct的filter,netty的pipeline, 无处不见的pipeline模式。
    解决的问题: 
    有时一些线程的步骤比较冗长,而且由于每个阶段的结果与下阶段的执行有关系,又不能分开
    解决思路
    可以将任务的处理分解为若干个处理阶段,上一个阶段任务的结果交给下一个阶段来处理,这样每个线程的处理是并行的,可以充分利用资源提高计算效率
    

      

    二.  相关概念

    管道模型包含两个部分: pipeline管道,valve阀门(也称为hander)
    pipeline管道,可以比作生产车间生产线,在这里可以认为是容器的逻辑处理总线
    valve 阀门,可以比作生产线上的工人,负责完成各自的部分工作。阀门也可以叫做handler处理者
    

      

    三.  python开发pipeline功能

    使用python 开发pipeline功能,用fastcore模块
    
    学习连接:http://www.coolpython.net/informal_essay/21-03/py-pipeline.html
    #####################################
    
    from fastcore.transform import Pipeline
    
    def lower(string_input):
        """
        大写转小写
        :param string_input:
        :return:
        """
        return string_input.lower()
    
    def remove_(string_input):
        """
        去除空格
        :param string_input:
        :return:
        """
        return string_input.replace("-", " ")
    
    
    def strip(string_input):
        """
        去除回车字符
        :param string_input:
        :return:
        """
        return string_input.strip("\n")
    
    input_string = "IT-is-a-test\n"
    pipe = Pipeline([lower, remove_, strip])
    output = pipe(input_string)
    print(output)
    

      

    四.  jenkins中的pipeline

    jenkins中的pipeline使用groovy语言来开发
    groovy教程:https://www.w3cschool.cn/groovy/groovy_basic_syntax.html
    

      

    五.  elasticsearch中的pipeline

    elasticsearch是java语言开发的,elasticsearch的pipeline的使用实际上是调用elasticsearch的接口,pipeline功能也是java开发的
    
    
    elasticsearch的各种processor的用法
    https://www.elastic.co/guide/en/elasticsearch/reference/7.5/ingest-processors.html
    

      

  • 相关阅读:
    Leecode no.22 括号生成
    修改mysql数据库的时区
    Django 路由层之反向解析
    学习 Django 的几个教程网址
    leetcode周赛 242
    AcWing第二次热身赛
    AcWing夏季每日一题--最长公共子序列
    AcWIng夏季每日一题--序列最大收益
    leetcode周赛 241
    第十二届蓝桥杯C++ B组
  • 原文地址:https://www.cnblogs.com/zhuhaofeng/p/16296791.html
Copyright © 2020-2023  润新知