url%E4%BD%A0%E5%A5%BD编码问题
url链接粘贴下来后通常会出现类似%E4%BD%A0%E5%A5%BD的编码,⼀般来说⼀个中⽂字对应三个%编码的是utf-8, ⼀个中⽂字对应两个%编码的是GB2312。
decode 的作⽤是将其他编码的字符串转换成 Unicode 编码
encode 的作⽤是将Unicode编码转换成其他编码的字符串
在python⾥对url 的utf-8编码进⾏str.decode(‘utf-8’)是不起作⽤的,但urllib库⾥⾯有个urlencode函数,可以把key-value这样的键值对转换成url格式,返回的是a=1&b=2这样的字符串
urllib另外对字符串还单独提供 quote()函数 和 unquote()函数
quote()把字符串进⾏urlencode转换
import urllib
print urllib.quote("你好")
#%E4%BD%A0%E5%A5%BD
unquote()对urlencode后的字符串进⾏解码
import urllib
url编码和utf8区别print urllib.unquote("%E4%BD%A0%E5%A5%BD")
#你好

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。