• Hubbledotnet V0.8.3.6 版本性能测试报告


    测试数据

    论文标题和摘要信息,数据行数 400 万行,数据大小2.6GB

    测试环境

    Intel Core2 Duo T7100 1.8GHz

    2.0 GB of RAM

    硬盘转速为 5400 转

    普通笔记本电脑

    Hubbledotnet 0.8.3.6 版本 + 盘古分词 1.2 版本

    表结构

    image

    索引参数

    image

    这个参数设置索引时的并发线程数

    Step 为 5000。这个参数指明每次批量索引的行数。

    索引速度

    image

    400万数据,索引用时 8237秒,即每小时索引 174 万行。

    我忘记将盘古分词改成最新版本了,如果用最新的2.0.1.0 版本,索引速度应该还可以提高30%左右。

    索引文件大小

    image

    两个字段的索引文件大小总和为 624M

    内存占用

    image

    HubbleTask 服务在400万数据时占用内存为 180M 左右,这其中有50M左右为盘古分词占用,20M左右为.net 自身占用,索引实际占用内存为110M左右。

    查询速度

    查询单个字

    首次查询

    image

    用时320ms

    第二次查询

    image

    用时2.23ms

    首次翻页

    image

    用时295ms

    查询多个字

    采用 Match 方式首次查询

     image

    用时342ms

    采用 Contains 方式首次查询

    image

    用时132ms

    Contains 和 Match 的区别是Contains 对输入的单词分量按与方式匹配,Match是按或方式匹配。Contains 比 Match 更精确和快速。

  • 相关阅读:
    基于C/S模式的程序更新下载
    拓展方法
    主从级GridView
    using 的用法
    五大数据类型
    redis的主从复制原理及步骤
    redis的发布订阅
    redis的持久化
    redis的事务
    配置文件详解
  • 原文地址:https://www.cnblogs.com/eaglet/p/1756192.html
Copyright © 2020-2023  润新知