软件编程
位置:首页>> 软件编程>> C#编程>> C#敏感词过滤实现方法

C#敏感词过滤实现方法

作者:喻家军  发布时间:2022-11-28 12:00:31 

标签:C#,过滤

本文实例讲述了C#敏感词过滤实现方法。分享给大家供大家参考。具体如下:

这两天突然想到了敏感词过滤 就结合网上找到的资料自己写了一个,脏字数量700+(效率不是很高 测试在110多KB的情况下比replace快 3-4倍)
测试结果图 单位:秒

C#敏感词过滤实现方法

代码如下:


System.Text.StringBuilder sb = new System.Text.StringBuilder(text.Length);
string filterText = "需要过滤的脏字 以|分开";
//脏字 可根据自己的方式用分隔符
string[] filterData = filterText.Split('|');
foreach (var item in filterData)
{
 char value = item[0];
 if (dicList.ContainsKey(value))
  dicList[value].Add(item);
 else
  dicList.Add(value, new List<string>() { item });
}
int count = text.Length;
for (int i = 0; i < count; i++)
{
 char word = text[i];
 if (dicList.ContainsKey(word))//如果在字典表中存在这个key
 {
  int num = 0;//是否找到匹配的关键字 1找到0未找到
  var data = dicList[word].OrderBy(g => g.Length);
  //把该key的字典集合按 字符数排序(方便下面从少往多截取字符串查找)
  foreach (var wordbook in data)
  {
   if (i + wordbook.Length <= count)
   //如果需截取的字符串的索引小于总长度 则执行截取
   {
    string result = text.Substring(i, wordbook.Length);
    //根据关键字长度往后截取相同的字符数进行比较
    if (result == wordbook)
    {
     num = 1;
     sb.Append(GetString(result));
     i = i + wordbook.Length - 1;
     //比较成功 同时改变i的索引
     break;
    }
   }
  }
  if (num == 0)
   sb.Append(word);
 }
 else
  sb.Append(word);
}
return sb.ToString();
}
/// <summary>
/// 替换星号
/// </summary>
/// <param name="value"></param>
/// <returns></returns>
private static string GetString(string value)
{
string starNum = string.Empty;
for (int i = 0; i < value.Length; i++)
{
 starNum += "*";
}
return starNum;
}

还有待优化的地方

各位有更好的方法还请分享指点一下,说明原理

希望本文所述对大家的C#程序设计有所帮助。

0
投稿

猜你喜欢

手机版 软件编程 asp之家 www.aspxhome.com