1.目标:以空间换时间,实现高效匹配定位,如自动补齐等
2.应用:如ik分词器字典树的构建
3.存储结构:多叉树
特点:每层按照字母的asccii进行排序,对叶子节点进行标记,方便快速定位,查找前缀,如查找前缀m,如果m节点下还有一个节点e,则m前缀可以匹配到my,me...
4.中文分词策略:ik等
5.中文分词后的存储方式:倒排索引
1.目标:以空间换时间,实现高效匹配定位,如自动补齐等
2.应用:如ik分词器字典树的构建
3.存储结构:多叉树
特点:每层按照字母的asccii进行排序,对叶子节点进行标记,方便快速定位,查找前缀,如查找前缀m,如果m节点下还有一个节点e,则m前缀可以匹配到my,me...
4.中文分词策略:ik等
5.中文分词后的存储方式:倒排索引