Python撤消Unicode

发布于 2021-01-29 15:03:17

假设我有以下两个变量:

bob1 = u'bob\xf0\xa4\xad\xa2'

bob2 = 'bob\xf0\xa4\xad\xa2'

我怎样才能获得的价值bob1是价值bob2?也就是说,如何展开unicode格式,但保留十六进制的值?

如果我这样做:

bob1.encode('utf8')
'bob\xc3\xb0\xc2\xa4\xc2\xad\xc2\xa2'

那是不对的…

救命!

关注者
0
被浏览
86
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    U + 0000和U + 00FF之间的代码点以ISO 8859-1或Latin 1编码映射到相同的字节值。

    >>> u'bob\xf0\xa4\xad\xa2'.encode('latin-1')
    'bob\xf0\xa4\xad\xa2'
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看