如何从熊猫数据框中删除包含特定列中特定字符串的行?[重复]

发布于 2021-01-29 14:58:01

这个问题已经在这里有了答案

在熊猫中的DataFrame上搜索“不包含” (6个答案)

去年关闭。

我在python中有一个非常大的数据框,我想在特定列中删除所有具有特定字符串的行。

例如,我想在数据框的列C中删除所有具有字符串“ XYZ”作为子字符串的行。

可以使用.drop()方法以一种有效的方式来实现吗?

关注者
0
被浏览
82
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    pandas具有向量化的字符串操作,因此您可以过滤掉包含不需要的字符串的行:

    In [91]: df = pd.DataFrame(dict(A=[5,3,5,6], C=["foo","bar","fooXYZbar", "bat"]))
    
    In [92]: df
    Out[92]:
       A          C
    0  5        foo
    1  3        bar
    2  5  fooXYZbar
    3  6        bat
    
    In [93]: df[~df.C.str.contains("XYZ")]
    Out[93]:
       A    C
    0  5  foo
    1  3  bar
    3  6  bat
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看