好资源导航 » 文章资讯 » python正则过滤字母、中文、数字及特殊字符方法详解

python正则过滤字母、中文、数字及特殊字符方法详解

2023-08-01 17:58:04 208

去除数字，特殊字符，只保留汉字

importre

s='1123*#$中abc国'
str=re.sub('[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@，。?★、…【】《》？“”‘'！[\\]^_`{|}~\s]+',"",s)
#去除不可见字符
str=re.sub('[\001\002\003\004\005\006\007\x08\x09\x0a\x0b\x0c\x0d\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a]+','',x)
print(str)
#结果为：中国

去除特殊字符，只保留汉子，字母、数字

importre
string="123我123456abcdefgABCVDFF？/，。,.:;:''';'''[]{}()（）《》"
print(string)
123我123456abcdefgABCVDFF？/，。,.:;:''';'''[]{}()（）《》
sub_str=re.sub(u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a])","",string)
print(sub_str)
123我123456abcdefgABCVDFF

正则表达式说明

函数说明 sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl [^**] 表示不匹配此字符集中的任何一个字符 \u4e00-\u9fa5 汉字的unicode范围 \u0030-\u0039 数字的unicode范围 \u0041-\u005a 大写字母unicode范围 \u0061-\u007a 小写字母unicode范围 \uAC00-\uD7AF 韩文的unicode范围 \u3040-\u31FF 日文的unicode范围

更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

返回顶部
3162201930
czq8825@qq.com

python正则过滤字母、中文、数字及特殊字符方法详解

热门推荐

随机推荐