在熊猫数据框中搜索和替换点和逗号

发布于 2021-01-29 14:57:18

这是我的DataFrame:

d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df

       col1           col2
0   sku 1.1   9.876.543,21
1   sku 1.2            654
2   sku 1.3         321,01

col2中的数据是本地格式的数字,我想将其转换为:

      col2
9876543.21
       654
    321.01

我尝试过df['col2'] = pd.to_numeric(df['col2'], downcast='float'),它返回ValueError::无法解析位置0处的字符串“ 9.876.543,21”。

我也尝试过df = df.apply(lambda x: x.str.replace(',', '.')),它返回ValueError:无法将字符串转换为float:‘5.023.654.​​46’

谢谢你的帮助!

关注者
0
被浏览
98
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    如果可能的话,最好使用read_csv

    df = pd.read_csv(file, thousands='.', decimal=',')
    

    如果不可能,那么replace应该有所帮助:

    df['col2'] = (df['col2'].replace('\.','', regex=True)
                            .replace(',','.', regex=True)
                            .astype(float))
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看