• [转载]SharePoint 2013搜索学习笔记之搜索构架简单概述


    Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件。可以将这6种组件分别部署到Sharepoint场内的多个服务器上,组成适合需求的Sharepoint搜索场,搜索场的体系结构设计主要参考量是爬网内容量,微软根据爬网内容量不同将搜索场分为大型场,中型场和小型场,更多详细信息可参考: SharePoint Server 2013 中的搜索概述在SharePoint Server 2013 中规划企业搜索体系结构

     

    Sharepoint搜索引擎构架图

    内容量

    搜索体系结构

    0 - 1000 万个项

    小型搜索服务器场

    1000 万 - 4000 万个项

    中型搜索服务器场

    4000 万 - 1 亿个项

    大型搜索服务器场

    下图为一个小型搜索拓扑的例子,据微软测试可以支持1000万个项目,并测量出它每秒可以爬网 50 个文档,且每秒服务 10 个查询。对于每秒 50 个文档的爬网率,首次完全爬网中,需要搜索 55 个小时来爬网 1000 万个项目。

    小型场服务器拓扑

    以下为这个小型场的硬件需求说明:

    机服务器

    应用程序或数据库服务器

    存储量

    RAM

    处理器

    A、B

    带有查询处理和索引组件的应用程序服务器

    500 GB

    16 GB

    1.8 GHz 4x CPU 内核

    A、B

    带有爬网、搜索管理、分析和内容处理组件的应用程序服务器。

    200 GB

    8 GB

    1.8 GHz 4x CPU 内核

    A、B

    带有所有搜索数据库的数据库服务器。

    100 GB

    16 GB

    1.8 GHz 4x CPU 内核

    搜索组件说明:

    搜索组件名称

    说明

    爬网组件

    对内容源进行爬网可从已爬网项目中收集已爬网属性和元数据,并将此信息发送到内容处理组件

    内容处理组件

    转换已爬网项目并将其发送到索引组件。此组件还会将已爬网属性映射到托管属性

    分析处理组件

    执行搜索分析和使用情况分析

    索引组件

    从内容处理组件中搜索已处理的项目并将其写入搜索索引。此组件还可以处理传入查询、从搜索索引中检索信息并将结果集发送回查询处理组件

    查询处理组件

    分析传入查询。这有助于提高精确度、改进检索和提高相关性。查询将发送到索引组件,该组件将为查询返回一组搜索结果

    搜索管理组件

    运行搜索的系统进程,添加并初始化搜索组件的新实例

    搜索数据库说明:

    搜索数据库名称

    说明

    爬网数据库

    存储跟踪信息和有关已爬网项目(如文档和 URL)的历史信息。还将存储上一次爬网时间、上一次爬网 ID 和上一次爬网期间的更新类型(添加、更新、删除)等信息。

    链接数据库

    存储由内容处理组件提取的未处理信息和有关搜索单击的信息。分析处理组件将分析此信息。

    分析报告数据库

    存储使用情况分析的结果。

    搜索管理数据库

    存储搜索配置数据

    博客转自:《Sharepoint2013搜索学习笔记之搜索构架简单概述(一)》 

  • 相关阅读:
    mac系统xcode升级等软件更换appid账户
    touch id 开发
    iOS自动化编译
    cocopods 知识集合 及 一个 好的 国外iOS技术翻译站
    cocoapods 更新失败 bad response Not Found 404 (http://ruby.taobao.org/specs.4.8.gz)
    iOS流量监控
    火星信息安全研究院
    Xcode6.1标准Framework静态库制作方法。工程转Framework,静态库加xib和图片。完美解决方案。
    Linux各目录及每个目录的详细介绍
    Linux du命令
  • 原文地址:https://www.cnblogs.com/SanMaoSpace/p/5052288.html
Copyright © 2020-2023  润新知