具有“ == True”和“ is True”的表达式给出不同的结果
我有以下MCVE:
#!/usr/bin/env python3
import pandas as pd
df = pd.DataFrame([True, False, True])
print("Whole DataFrame:")
print(df)
print("\nFiltered DataFrame:")
print(df[df[0] == True])
输出如下,这是我期望的:
Whole DataFrame:
0
0 True
1 False
2 True
Filtered DataFrame:
0
0 True
2 True
好的,但是PEP8样式似乎是错误的,它说:
E712与True的比较应该为if cond is True
或if cond
。所以我将其更改为is True
,==
True
但现在失败了,输出为:
Whole DataFrame:
0
0 True
1 False
2 True
Filtered DataFrame:
0 True
1 False
2 True
Name: 0, dtype: bool
到底是怎么回事?
-
这里的问题是
df[df[0] == True]
, 您没有将对象与进行比较True
。就像其他答案所说的那样,它
==
被重载pandas
以产生aSeries
而不是bool
像通常那样。[]
也过载,以解释Series
并给出过滤后的结果。该代码本质上等效于:series = df[0].__eq__(True) df.__getitem__(series)
因此,您离开这里 不会 违反PEP8
==
。
本质上,
pandas
给熟悉的语法提供了不寻常的语义-这就是造成混淆的原因。根据Stroustroup(第3.3.3节)所述,自从操作符重载发明以来,操作符重载就一直为此引起麻烦(并且他不得不认真考虑是否将其包含在C
++中)。看到C
++中更多地滥用它,Gosling在Java中跑到了另一个极端,完全禁止了它,事实证明那是一个极端。结果,现代语言和代码往往会出现运算符重载,但要密切注意不要过度使用它,并且语义要保持一致。