python去除删除数据中\u0000\u0001等unicode字符串的代码
py文件为utf-8格式
#!/usr/bin/envpython #-*-coding:utf-8-*- a="system\u0000" b=re.sub(u'\u0000',"",a) print(b)##b="system"
补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
【背景】
类似于:
\u3232\u6674的字符串,转换为对应的unicode字符。
【解决过程】
对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。
完整的python代码演示为:
#!/usr/bin/python #coding:utf-8 slashUStr="\\u0063\\u0072\\u0069\\u0066\\u0061\\u006E\\u0020\\u5728\\u8DEF\\u4E0A";#crifan在路上 decodedUniChars=slashUStr.decode("unicode-escape") print"decodedUniChars=",decodedUniChars;#decodedUniChars=crifan在路上
以上这篇python去除删除数据中\u0000\u0001等unicode字符串的代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。