使用Python处理CSV中的非标准美式英语字符和符号

发布于 2021-01-29 16:52:29

我有一个商店名称列表,其中有数千个名称,其中一些具有非标准的美国英语字符,这会造成问题。

例如,我的输入文件如下所示:

store_name
yéché
Ázak
ótndle

我希望输出文件看起来像这样(我想Googledocs做到了这一点,顺便说一句):

store_name  new_store_name 
yéché       yéché
Ázak        Ãzak
ótndle      ótndle

只有大约10条这样的规则将非标准的美国英语字符转换为这种格式,因此我仔细研究了并在excel中控制f来制作它们。但是我希望将来能够通过计算来执行类似的操作,并且只是想知道是否有使用Python进行此操作的快速方法。明确地说,我想做的是:

é become é
Á become Ãi
关注者
0
被浏览
52
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    您可以使用解码和编码

    print a
    péché
    Álak
    óundle
    
    print a.decode('latin9').encode('utf8'),
    péché
    Ãlak
    óundle
    

    我不得不做相反的事情…



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看