相当于SQL non-equi JOIN的Pandas

发布于 2021-01-29 14:56:38

因此,我有两个要合并在一起的数据框。

我要合并3列,其中2列很容易。

joined_df = pd.merge(df1, df2, how='left', on=['name', 'city'])

我希望这是使用第三列,但这将是一个比较,如下所示:

joined_df = pd.merge(df1, df2, how='left',
on=['name', 'city', 'df1.year' >= 'df2.year_min'])

不知道正确的语法在这里。

如果是SQL,对我来说将很容易。

SELECT * FROM df1
JOIN df2 on (df1.name = df2.name and df1.year = df2.year and df1.year > df2.year_min)

有帮助吗?

关注者
0
被浏览
78
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    熊猫merge只支持等联接。您需要添加第二步来过滤结果,如下所示:

    joined_df = df1.merge(df2, how='left', on=['name', 'city'])
    joined_df = joined_df[joined_df.year > joined_df.year_min]
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看