试图在python中创建分组变量

发布于 2021-01-29 14:09:54

我有一列年龄值,我需要将其转换为18-29、30-39、40-49、50-59、60-69和70+以上的年龄范围:

对于df“文件”中某些数据的示例,我有:

在此处输入图片说明

并希望到达:

在此处输入图片说明

我尝试了以下方法:

file['agerange'] = file[['age']].apply(lambda x: "18-29" if (x[0] > 16
                                       or x[0] < 30) else "other")

我宁愿不只是进行分组,因为存储桶的大小不是统一的,但如果可行的话,我会对此开放。

提前致谢!

关注者
0
被浏览
187
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    看来您正在使用Pandas库。它们包括执行此操作的功能:http : //pandas.pydata.org/pandas-
    docs/version/0.16.0/genic/pandas.cut.html

    这是我的尝试:

    import pandas as pd
    
    ages = pd.DataFrame([81, 42, 18, 55, 23, 35], columns=['age'])
    
    bins = [18, 30, 40, 50, 60, 70, 120]
    labels = ['18-29', '30-39', '40-49', '50-59', '60-69', '70+']
    ages['agerange'] = pd.cut(ages.age, bins, labels = labels,include_lowest = True)
    
    print(ages)
    
       age agerange
    0   81      70+
    1   42    40-49
    2   18    18-29
    3   55    50-59
    4   23    18-29
    5   35    30-39
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看