• Datahub 0.8.5发布! 通用的元数据搜索和发现工具


    近期Datahub 发布了最新的版本0.8.5,作为LinkedIn开源的通用的元数据搜索和发现工具。Datahub近一年来有了巨大的发展,也成为了很多公司进行元数据管理的调研方向并进行使用的选择。

    新功能

    0.8.5版本中datahub修复了各种稳定性的修复,并改进了多个数据源的元数据获取方式,包括mongodb、looker、hive、snowflake。

    在采用React重构前端以后,datahub的可视化功能得到了极大的提高。

    但对于功能方面的改进,DataHub 也没有停止。

    功能简介

    Datahub目前提供了如下功能:

    • 搜索:全文和高级搜索,搜索排名
    • 浏览:浏览可配置的层次结构
    • 架构:表格和 JSON 格式的表和文档架构
    • 粗粒谱系:支持数据集级别的谱系,下游/上游的表格和图形可视化
    • 所有权:显示数据集的所有者,查看您拥有的数据集
    • 数据集生命周期管理:弃用/取消弃用,表面删除的数据集并用“已删除”标记它
    • 机构知识:支持向任何数据集添加自由格式的文档

    而新的功能也在开发当中。根据开发路线图,细粒度的血缘关系也将会很快推出。

    架构

    不得不提到datahub的架构。

    datahub由datahub ingestion,datahub fraontend,datahub serving三部分构成。

    分为负责元数据的采集,存储与可视化展示。

    这种架构让datahub可以非常灵活的进行各种数据源的对接与功能改进。

    相信随着社区的不断活跃,datahub将在元数据管理领域大放异彩!

    大数据流动 将于近期持续推出datahub及其他元数据管理,数据血缘等数据治理的落地方案,与实践过程。欢迎大家关注~

    大数据流动 专注于大数据实时计算,数据治理,数据可视化等技术分享与实践。 请在后台回复关键字下载相关资料。相关学习交流群已经成立,欢迎加入~
  • 相关阅读:
    字符统计和滑动窗口
    字典树应用及用哈希表代替
    迷宫里的动态规划应用
    求所有排列中的第 i 个排列的问题
    最大子串和问题
    二分查找、变形及应用
    前 n 个数原址排序的问题
    LeetCode 32 括号匹配
    11.常用的API
    10.正则表达式
  • 原文地址:https://www.cnblogs.com/tree1123/p/14989404.html
Copyright © 2020-2023  润新知