• C# 脏字过滤


    这两天突然想到了脏字过滤 就结合网上找到的资料自己写了一个,脏字数量700+(效率不是很高 测试在110多KB的情况下比replace快 3-4倍)

    测试结果图 单位:秒

    代码

    System.Text.StringBuilder sb = new System.Text.StringBuilder(text.Length);
                string filterText = "需要过滤的脏字 以|分开";//脏字 可根据自己的方式用分隔符
    
                string[] filterData = filterText.Split('|');
                foreach (var item in filterData)
                {
                    char value = item[0];
                    if (dicList.ContainsKey(value))
                        dicList[value].Add(item);
                    else
                        dicList.Add(value, new List<string>() { item });
                }
    
                int count = text.Length;
                for (int i = 0; i < count; i++)
                {
                    char word = text[i];
                    if (dicList.ContainsKey(word))//如果在字典表中存在这个key
                    {
                        int num = 0;//是否找到匹配的关键字  1找到0未找到
                        var data = dicList[word].OrderBy(g => g.Length);//把该key的字典集合按 字符数排序(方便下面从少往多截取字符串查找)
    
                        foreach (var wordbook in data)
                        {
                            if (i + wordbook.Length <= count)//如果需截取的字符串的索引小于总长度 则执行截取
                            {
                                string result = text.Substring(i, wordbook.Length);//根据关键字长度往后截取相同的字符数进行比较
                                if (result == wordbook)
                                {
                                    num = 1;
                                    sb.Append(GetString(result));
                                    i = i + wordbook.Length - 1;//比较成功 同时改变i的索引
                                    break;
                                }
                            }
                        }
                        if (num == 0)
                            sb.Append(word);
                    }
                    else
                        sb.Append(word);
                }
                return sb.ToString();
            }
            /// <summary>
            /// 替换星号
            /// </summary>
            /// <param name="value"></param>
            /// <returns></returns>
            private static string GetString(string value)
            {
                string starNum = string.Empty;
                for (int i = 0; i < value.Length; i++)
                {
                    starNum += "*";
                }
                return starNum;
            }
    
     

     还有待优化的地方 

    各位有更好的方法  还请分享指点一下   说明原理

  • 相关阅读:
    CE6内核启动过程新角度
    Eboot 中给nandflash分区实现
    Feedsky 上 csdn blog 订阅数排名 (zz)
    c# 枚举 enum 类型
    64bit系统下操作注册表的注意事项 ZZ
    良方治奇病,Visual Studio正则替换大法 (转)
    关于23种设计模式的有趣见解
    NHibernate快速指南(一)
    网站、数据库的衍变之路(二) (转)
    网站、数据库的衍变之路(一) (转)
  • 原文地址:https://www.cnblogs.com/yujiajun/p/keword_Filter.html
Copyright © 2020-2023  润新知