• StreamSets学习系列之StreamSets是什么?


        不多说,直接上干货!

      StreamSets是一个侧重数据集成、数据加工流程构建的平台,也是一个开源的产品。通过StreamSets,用户可以方便的接入不同的数据源,并且完成数据加工流程的构建。SteamSets有可视化的数据流构建工具,并且能够对运行态的数据应用进行监控。相对于CDAP,StreamSets更侧重于数据的接入和数据流的构建、监控和管理
     
     
     
     
     

      StreamSets数据操作平台是唯一旨在简化如何构建,执行和操作企业数据流的平台。构建在开源核心上,开发人员可以轻松构建批处理和流式数据流,而且代码少,而运营商使用云本地产品将数十或数百个数据流聚合到拓扑中,并通过实时可见性和性能控制集中管理。

      其官网地址:https://streamsets.com

      其对数据流采用pipeline方式进行处理,源端数据可以来自多个组件,kafka,directory,mysql,redis等,pipeline的destination也可以有丰富的终端组件,kafka,directory,mysql,redis,hdfs等,中间处理节点也有很多丰富的节点,待会儿搭建好之后就可以在 http://hadoop03:18630 的浏览器右端可以看到。

      每一个新的组件,我们的看看他长什么样的?接下来我们就可以在官网进行下载安装包(https://streamsets.com/opensource/),地址中选择自己平台需要的版本进行下载。

     
     
     

      StreamSets的官网
    https://streamsets.com/

     

     
     
     
     
     
     
     
     
     
    https://streamsets.com/products/sdc

     

     
     
     
     
     
     
     
     
     
    欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑
     
     
     

    同时,大家可以关注我的个人博客

       http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

       详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

      人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
      目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

          对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

     

     
     
     
     
     
     
     
     
     
  • 相关阅读:
    后台管理UI
    14.6.3.2 Configuring Multiple Buffer Pool Instances 配置多个Buffer Poll 实例:
    14.6.3.1 The InnoDB Buffer Pool
    innodb_buffer_pool_instances and innodb_buffer_pool_size的关系
    猪肉都被绑上了“家族标签”,大数据已波及到农牧业!
    14.6.2 Configuring InnoDB for Read-Only Operation
    jquery EasyUI datagrid重新加载传参问题
    分布式系统事务一致性解决方案
    面试题整理
    dump iot表
  • 原文地址:https://www.cnblogs.com/zlslch/p/9374759.html
Copyright © 2020-2023  润新知