python去除删除数据中u0000u0001等unicode字符串的代
码
py⽂件为utf-8格式
#!/usr/bin/env python
# -*- coding:utf-8 -*-
a = "system\u0000"
b = re.sub(u'\u0000', "", a)
print(b) ## b="system"
补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
【背景】
类似于:
\u3232\u6674 的字符串,转换为对应的unicode字符。
unicode所有字符【解决过程】
对应的,可以通过Python的decode函数去解码,其中⾃定原始字符串位unicode-ecape,就可以了。
完整的python代码演⽰为:
#!/usr/bin/python
#coding: utf-8
slashUStr = "\\u0063\\u0072\\u0069\\u0066\\u0061\\u006E\\u0020\\u5728\\u8DEF\\u4E0A"; #crifan 在路上
decodedUniChars = slashUStr.decode("unicode-escape")
print "decodedUniChars=",decodedUniChars; #decodedUniChars= crifan 在路上
以上这篇python去除删除数据中\u0000\u0001等unicode字符串的代码就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论