经常在写完爬虫爬取图片和视频类的二进制文件的时候,发现保存的时候,windows有些特殊字符是保存不了的。写一个函数直接替换成合法的文件名:
1 import re 2 def changeTitle(title): 3 """ 4 正则表达式替换windows文件不能存储的特殊字符 5 """ 6 pattern = re.compile(r'[\/\\\:\*\?\"\<\>\|]') # 要匹配的符号的正则表示形式 7 new_title = re.sub(pattern, '_' , title) # 替换的模式,第二个参数是要替换成的目标字符,第三个参数是要替换的title 8 return new_title
在写入文件到windows系统的时候,可以用这个函数先替换一下文件标题里的特殊字符。返回的new_title就可以保存在windows中了。