该过滤敏感词汇方法,主要思路是遍历原文件,读取每行数据,查看是否存在敏感词,如果存在敏感词,替换为**,把修改后的内容的输出到临时文件中,即:不改变原有文件内容
当然也还有很多其他的方法,比如直接打印,或者源内容是字符串等,思路大概一致
#过滤敏感词汇 #读文件,输出带有敏感词汇进行*号替换 word_lib=['小白','小黑','小绿','小蓝','小红','小紫',] #敏感词汇 #过滤敏感词汇 def word_filter(word_lib,old_file,new_file): for i in old_file: #遍历原文件 for j in word_lib: #遍历词汇库 if j in i: #判断每行是否存在敏感词 i=i.replace(j,'**') #对应存在的敏感词进行替换 new_file.write(i) #敏感词替换的文件内容保存到临时文件 close_file(old_file) #关闭文件 close_file(new_file) #关闭文件 #打开文件 def open_file(filename,mode='r'): result=open(filename,mode,encoding='utf-8') return result #返回文件对象 #关闭文件 def close_file(file): file.close() word_filter(word_lib,open_file('a.txt'),open_file('c.txt','w')) #调取过滤敏感词函数