• Apache Zeppelin是什么?


      

      不多说,直接上干货!

         Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化。背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo。

         Zeppelin是一个Apache的孵化项目.
    一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享)

    多用途笔记本

    可实现你所需要的: 
    数据采集 
    数据发现 
    数据分析 
    数据可视化和协作

    支持多种语言,默认是scala(背后是Spark shell),SparkSQL, Markdown 和 Shell。 
    这里写图片描述 
    甚至可以添加自己的语言支持。

    Apache Spark 集成

    Zeppelin 提供了内置的 Apache Spark 集成。你不需要单独构建一个模块、插件或者库。 
    Zeppelin的Spark集成提供了: 
    自动引入SparkContext 和 SQLContext 
    从本地文件系统或maven库载入运行时依赖的jar包。
    可取消job 和 展示job进度

    数据可视化

    一些基本的图表已经包含在Zeppelin中。可视化并不只限于SparkSQL查询,后端的任何语言的输出都可以被识别并可视化。 
    这里写图片描述

     

     

     

    动态表格

    Zeppelin 可以在你的笔记本中动态地创建一些输入格式。 
    这里写图片描述 
    更多关于动态表格

     

     

    协作

    Notebook 的 URL 可以在协作者间分享。 Zeppelin 然后可以实时广播任何变化,就像在 Google docs 中一样。 
    这里写图片描述

     

     

    发布

    Zeppelin 提供了一个 URL 用来仅仅展示结果,那个页面不包括 Zeppelin 的菜单和按钮。这样,你可以轻易地将其作为一个iframe集成到你的网站。 
    这里写图片描述

     

     

    100% 开源

    Apache Zeppelin (孵化中) 是 Apache2 许可软件。 请查看源码库 和 如何贡献

    Zeppelin 有着非常活跃的开发社区。加入邮件列表和在我们的问题跟踪上报告问题has a very active development community. Join the Mailing list and report issues on our Issue tracker.

    以上翻译自Apache Zeppelin (incubating)官网。 
    由于目前并不提供binary安装包,需要自己编译。

    如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 
    如果还可以执行PySpark代码和Spark代码呢?心动了吗? 
    如果还可以写Hive-SQL,Spark-SQL呢? 
    如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何? 
    如果还可以将SQL的结果在Web界面上可视化出来呢? 
    如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。

  • 相关阅读:
    python的编码判断_unicode_gbk/gb2312_utf8(附函数)
    stat文件状态信息结构体
    内核配置中 ramdisk 大小修改
    mount命令详解
    dirent和DIR 结构体 表示文件夹中目录内容信息
    nandwrite 参数
    mke2fs 制作ext2文件系统image
    ext2文件系统错误
    照度/感光度(Lux)
    摄像机的几个重要的技术指标
  • 原文地址:https://www.cnblogs.com/zlslch/p/6949890.html
Copyright © 2020-2023  润新知