将熊猫系列从字符串转换为唯一的int id
发布于 2021-01-29 19:18:55
我在系列中有一个类别变量。我想为每个唯一值分配整数ID,并使用ID创建一个新的系列,从而有效地将字符串变量转换为整数变量。最紧凑/最有效的方法是什么?
关注者
0
被浏览
52
1 个回答
-
您可以使用pandas.factorize:
In [32]: s = pd.Series(['a','b','c']) In [33]: labels, levels = pd.factorize(s) In [35]: labels Out[35]: array([0, 1, 2])