如何根据值计数过滤熊猫DataFrame?
我正在使用带有视频游戏的pandas
DataFrame的Python进行工作,每种游戏都有一种类型。我正在尝试删除流派少于DataFrame中某些流派的任何视频游戏,但是我不知道如何进行此操作。我确实找到了一个似乎与之相关的StackOverflow问题,但我根本无法破译该解决方案(可能是因为我从未听说过R,并且我对函数式编程的记忆充其量是生锈的)。
救命?
-
使用groupby过滤器:
In [11]: df = pd.DataFrame([[1, 2], [1, 4], [5, 6]], columns=['A', 'B']) In [12]: df Out[12]: A B 0 1 2 1 1 4 2 5 6 In [13]: df.groupby("A").filter(lambda x: len(x) > 1) Out[13]: A B 0 1 2 1 1 4
我建议阅读docs的split-combine-
section。