• 我发起了一个 .Net 平台上的 开源项目 知识图谱 Babana Map 和 文本文件搜索引擎 Babana Search


    起因 也是 前几天 有 网友 在 群 里发了   知识图谱   相关的文章,

    还有 有 网友 问起   NLog -> LogStash -> Elastic Search  的 问题,

     

    所以, 像 Elastic Search 这样的, 应该算是一个 文本文件搜索引擎,

    我觉得 我们 写一个 文本文件搜索引擎 也没什么问题 。

     

    文本文件搜索引擎  是  粗粒度的 、 松散的   数据存储检索  系统 。

    数据 可以存放在 任意 的 文件 里, 文件 的 大小 是 任意的(可以存放任意数量的数据条目), 文件 的 数量 是 任意的, 文件 的 位置 是 任意的(可以是 不同的 文件夹 和 服务器) 。

     

    文本文件搜索引擎 需要 的 技术 如下 :

    1  文本分析(字符串分析),  可以参考 《SelectDataTable》  https://www.cnblogs.com/KSongKing/p/9455216.html    ,

    2  大规模并行计算,  可以参考 《.Net Core 应用方向 图谱》  https://www.cnblogs.com/KSongKing/p/10209880.html    ,

    3  数据存储 检索技术,  可以参考 《我发起了一个 .Net 平台上的 NewSql 数据库 BabanaDB》  https://www.cnblogs.com/KSongKing/p/10255420.html    ,

     

    但是 文本文件搜索引擎 和 NewSql 数据库 是 有区别 的 。

    传统的 关系数据库 和 NewSql 数据库 都是   紧密的 、 严格的 、 用于 实时交易 的 数据库 。

     

    知识图谱 应该是 在 文本文件搜索引擎 上 发展出来的 一些 高级功能 。

    文本文件搜索引擎 是 大规模并行计算 的 代表性应用 。

     

  • 相关阅读:
    redis哨兵高可用
    数据库主从搭建
    docker 补充
    docker 进阶操作
    docker 简介
    数据可视化(Matplotlib)
    数据操作
    pandas练习
    Pandas简介
    python mysql utf-8 latin
  • 原文地址:https://www.cnblogs.com/KSongKing/p/10293280.html
Copyright © 2020-2023  润新知