起因 也是 前几天 有 网友 在 群 里发了 知识图谱 相关的文章,
还有 有 网友 问起 NLog -> LogStash -> Elastic Search 的 问题,
所以, 像 Elastic Search 这样的, 应该算是一个 文本文件搜索引擎,
我觉得 我们 写一个 文本文件搜索引擎 也没什么问题 。
文本文件搜索引擎 是 粗粒度的 、 松散的 数据存储检索 系统 。
数据 可以存放在 任意 的 文件 里, 文件 的 大小 是 任意的(可以存放任意数量的数据条目), 文件 的 数量 是 任意的, 文件 的 位置 是 任意的(可以是 不同的 文件夹 和 服务器) 。
文本文件搜索引擎 需要 的 技术 如下 :
1 文本分析(字符串分析), 可以参考 《SelectDataTable》 https://www.cnblogs.com/KSongKing/p/9455216.html ,
2 大规模并行计算, 可以参考 《.Net Core 应用方向 图谱》 https://www.cnblogs.com/KSongKing/p/10209880.html ,
3 数据存储 检索技术, 可以参考 《我发起了一个 .Net 平台上的 NewSql 数据库 BabanaDB》 https://www.cnblogs.com/KSongKing/p/10255420.html ,
但是 文本文件搜索引擎 和 NewSql 数据库 是 有区别 的 。
传统的 关系数据库 和 NewSql 数据库 都是 紧密的 、 严格的 、 用于 实时交易 的 数据库 。
知识图谱 应该是 在 文本文件搜索引擎 上 发展出来的 一些 高级功能 。
文本文件搜索引擎 是 大规模并行计算 的 代表性应用 。