-
提取句子中中英文数字
u"([^u4e00-u9fa5u0030-u0039u0041-u005au0061-u007a])"
u4e00-u9fa5 汉字的unicode范围 u0030-u0039 数字的unicode范围 u0041-u005a 大写字母unicode范围 u0061-u007a 小写字母unicode范围 提取中文字符
string_code = re.sub(u"([^u4e00-u9fa5])","",string)
提取句子中中英文数字
u"([^u4e00-u9fa5u0030-u0039u0041-u005au0061-u007a])"
u4e00-u9fa5 | 汉字的unicode范围 |
---|---|
u0030-u0039 | 数字的unicode范围 |
u0041-u005a | 大写字母unicode范围 |
u0061-u007a | 小写字母unicode范围 |
提取中文字符
string_code = re.sub(u"([^u4e00-u9fa5])","",string)