PCA是否具有分类功能?

发布于 2021-01-29 17:05:26

据我了解,我认为PCA只能用于连续功能。但是,在尝试了解onehot编码和标签编码之间的区别时,是通过以下链接中的帖子获得的:

何时使用One Hot
Encoding,LabelEncoder和DictVectorizo​​r?

它指出,在PCA之后进行热编码是一种非常好的方法,这基本上意味着PCA被应用于分类特征。因此感到困惑,请在同一点上建议我。

关注者
0
被浏览
38
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    我不同意其他观点。

    虽然 您可以对二进制数据 (例如,单热编码数据) 使用PCA, 但这并不意味着它是一件好事,否则它将非常有效。

    PCA被设计用于 连续 变量。它试图最小化方差(=平方偏差)。当您拥有二进制变量时,平方差的概念会破裂。

    是的,您可以使用PCA。是的,您会得到一个输出。它甚至是最小二乘的输出-好像PCA不会对此类数据进行分段处理。它可以工作,但 意义
    远不如您希望的那样。并且据认为比例如频繁模式挖掘更没有意义。



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看