如何检查Pandas DataFrame中的值是否为NaN

发布于 2021-01-29 15:00:16

在Python Pandas中,检查DataFrame是否具有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd.isnan,但是这会为每个元素返回一个布尔值的DataFrame。此处的帖子也无法完全回答我的问题。

关注者
0
被浏览
79
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    jwilner的反应是现场的。我一直在探索是否有更快的选择,因为根据我的经验,求平面数组的总和(奇怪)比计数快。这段代码似乎更快:

    df.isnull().values.any()
    

    在此处输入图片说明

    import numpy as np
    import pandas as pd
    import perfplot
    
    
    def setup(n):
        df = pd.DataFrame(np.random.randn(n))
        df[df > 0.9] = np.nan
        return df
    
    
    def isnull_any(df):
        return df.isnull().any()
    
    
    def isnull_values_sum(df):
        return df.isnull().values.sum() > 0
    
    
    def isnull_sum(df):
        return df.isnull().sum() > 0
    
    
    def isnull_values_any(df):
        return df.isnull().values.any()
    
    
    perfplot.save(
        "out.png",
        setup=setup,
        kernels=[isnull_any, isnull_values_sum, isnull_sum, isnull_values_any],
        n_range=[2 ** k for k in range(25)],
    )
    

    df.isnull().sum().sum()速度稍慢,但当然还有其他信息-的数量NaNs



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看