• Solr搜索引擎基础


    搜索引擎是指一个庞大的互联网资源数据库,如网页,新闻组,程序,图像等。它有助于在万维网上定位信息。

    用户可以通过以关键字或短语的形式将查询传递到搜索引擎中来搜索信息。 搜索引擎然后搜索其数据库并向用户返回相关链接。

    比如下面常用到两个搜索引擎 -

    百度、谷歌

    搜索引擎组件

    一般来说,搜索引擎有三个基本组件,如下所列 -

    • Web爬虫 - Web爬虫也称为蜘蛛或机器人。 它是一个收集网络信息的软件组件。
    • 数据库 - Web上的所有信息都存储在数据库中。它们包含大量的Web资源。
    • 搜索接口 - 此组件是用户和数据库之间的接口。它帮助用户搜索数据库。

    搜索引擎是如何工作的?

    任何搜索应用程序都需要执行以下一些或全部操作。

    步骤标题或名称描述
    1 获取原始内容 任何搜索应用程序的第一步是收集要进行搜索的目标内容。
    2 构建文档 从原始内容构建文档,让搜索应用程序可以很容易地理解和解释。
    3 分析文档 在索引开始之前,将对文档进行分析。
    4 索引文档 当文档被构建和分析后,下一步是对它们建立索引,以便可以基于特定键而不是文档的全部内容来检索该文档。索引类似于在书开始页或末尾处的目录索引,其中常见单词以其页码显示,使得这些单词可以快速跟踪,而不是搜索整本书。
    5 用于搜索的用户接口 当索引数据库就绪,应用程序可以执行搜索操作。 为了帮助用户进行搜索,应用必须提供用户接口,用户可以在其中输入文本并启动搜索过程
    6 构建查询 当用户做出搜索文本的请求,应用程序应该使用该文本来准备查询对象,然后可以使用该查询对象来查询索引数据库以获得相关的细节。
    7 搜索查询 使用查询对象,检查索引数据库以获取相关详细信息和内容文档。
    8 渲染结果 当收到所需的结果,应用程序应决定如何使用其用户界面向用户显示结果。

    看看下面的插图。 它显示了搜索引擎功能的总体视图。

    除了这些基本操作之外,搜索应用还可以提供管理 - 用户界面以帮助管理员基于用户简档控制搜索的级别。搜索结果分析是任何搜索应用程序的另一个重要和高级方面。

  • 相关阅读:
    【设计模式】6.模板方法模式
    【设计模式】5.原型模式
    【设计模式】4.工厂模式
    【设计模式】3.代理模式
    zookeeper集群的搭建
    zookeeper实现分布式锁的原理和一个小例子
    zookeeper配置管理实现原理----监听事件watch
    zookeeper的javaAPI操作(基于Curator的CRUD)
    java.lang.IllegalArgumentException: A HostProvider may not be empty!
    Zookeeper的安装和基本操作
  • 原文地址:https://www.cnblogs.com/youqc/p/9074144.html
Copyright © 2020-2023  润新知