如何在pandas群中使用cumsum?

发布于 2021-01-29 19:35:48

我有

df = pd.DataFrame.from_dict({'id': ['A', 'B', 'A', 'C', 'D', 'B', 'C'], 'val': [1,2,-3,1,5,6,-2], 'stuff':['12','23232','13','1234','3235','3236','732323']})

  id   stuff  val
0  A      12    1
1  B   23232    2
2  A      13   -3
3  C    1234    1
4  D    3235    5
5  B    3236    6
6  C  732323   -2

我想val为每个运行一些id,所以所需的输出如下所示:

  id   stuff  val  cumsum
0  A      12    1   1
1  B   23232    2   2
2  A      13   -3   -2
3  C    1234    1   1
4  D    3235    5   5
5  B    3236    6   8
6  C  732323   -2  -1

这是我尝试的:

df['cumsum'] = df.groupby('id').cumsum(['val'])

df['cumsum'] = df.groupby('id').cumsum(['val'])

这是我得到的错误:

ValueError: Wrong number of items passed 0, placement implies 1
关注者
0
被浏览
100
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    您可以调用transform并传递cumsum函数以将该列添加到df中:

    In [156]:
    df['cumsum'] = df.groupby('id')['val'].transform(pd.Series.cumsum)
    df
    
    Out[156]:
      id   stuff  val  cumsum
    0  A      12    1       1
    1  B   23232    2       2
    2  A      13   -3      -2
    3  C    1234    1       1
    4  D    3235    5       5
    5  B    3236    6       8
    6  C  732323   -2      -1
    

    关于错误,您无法调用cumsumSeries groupby对象,其次,您将列名作为无意义的列表传递。

    所以这有效:

    In [159]:
    df.groupby('id')['val'].cumsum()
    
    Out[159]:
    0    1
    1    2
    2   -2
    3    1
    4    5
    5    8
    6   -1
    dtype: int64
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看