非ASCII字符的SyntaxError

发布于 2021-01-29 19:17:50

我正在尝试解析包含某些非ASCII字符的xml,

代码如下

from lxml import etree
from lxml import objectify
content = u'<?xml version="1.0" encoding="utf-8"?><div>Order date                            : 05/08/2013 12:24:28</div>'
mail.replace('\xa0',' ')
xml = etree.fromstring(mail)

但它在行“ content = …”上显示了错误,例如

syntaxError: Non-ASCII character '\xc2' in file /home/projects/ztest/responce.py on line 3, 
but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

在终端中它正在工作,但是在Eclipse IDE上运行时却给我一个错误。

不知道该如何克服。

关注者
0
被浏览
47
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    您应该定义源代码编码,并将其添加到脚本顶部:

    # -*- coding: utf-8 -*-
    

    它在控制台和IDE中工作不同的原因可能是由于设置了不同的默认编码。您可以通过运行以下命令进行检查:

    import sys
    print sys.getdefaultencoding()
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看