python中的字符编码,将“ u2019”替换为“

发布于 2021-01-29 15:01:28

我尝试了多种方法将其编码为最终结果"BACK RUSHIN'",其中最重要的字符是右撇号'

我想要一种使用某些Python内置函数达到最终结果的方法,在这些函数中,普通字符串和unicode字符串之间没有区别。

这是我用来检索字符串的代码:
str(unicode(etree.tostring(root.xpath('path')[0],method='text', encoding='utf-8'),errors='ignore')).strip()

结果是:缺少'BACK RUSHIN'撇号'

另一种方法是: root.xpath('path/text()')

结果是:u'BACK RUSHIN\u2019'在python中。

最后,如果我尝试: u'BACK RUSHIN\u2019'.encode('ascii', 'replace')

结果是: 'BACK RUSHIN?'

请不要替换函数,我想使用pythons编解码器库。同样不打印字符串,因为它被保存在变量中。

谢谢

关注者
0
被浏览
52
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。
    >>> import unidecode
    >>> unidecode.unidecode(u'BACK RUSHIN\u2019')
    "BACK RUSHIN'"
    

    统一码



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看