sys.getsizeof的深版本

发布于 2021-01-29 18:35:43

我想计算对象使用的内存。sys.getsizeof很大,但是很浅(例如,在列表上调用,它不包括列表元素占用的内存)。

我想写一个通用的“深度”版本sys.getsizeof。我了解“深层”的定义有些含糊;我对后跟copy.deepcopy定义感到非常满意。

这是我的第一次尝试:

def get_deep_sizeof(x, level=0, processed=None):
    if processed is None:
        # we're here only if this function is called by client code, not recursively
        processed = set()
    processed.add(id(x))
    mem = sys.getsizeof(x)
    if isinstance(x, collections.Iterable) and not isinstance(x, str):
        for xx in x:
            if id(xx) in processed:
                continue
            mem += get_deep_sizeof(xx, level+1, processed)
            if isinstance(x, dict):
                mem += get_deep_sizeof(x[xx], level+1, processed)
    return mem

它存在两个已知问题,并且存在许多未知问题:

  • 我不知道如何以捕获所有链接对象的方式遍历通用容器。因此,我使用进行了迭代in,并对字典的大小写进行了硬编码(包括值,而不仅仅是键)。显然,这不适用于字典等其他类。
  • 我不得不硬编码排除str(这是可迭代的,但没有任何其他对象的链接)。同样,如果有更多这样的对象,这将中断。

我怀疑使用in它不是一个好主意,但是我不确定还有其他方法。

关注者
0
被浏览
47
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    我认为Pympler已经打败了您。

    从他们的文档中

    >>> from pympler.asizeof import asizeof
    >>> obj = [1, 2, (3, 4), 'text']
    >>> asizeof(obj)
    176
    

    源代码可以在这里找到



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看