Python

使用sklearn进行因子加载

发布于 2021-01-29 17:11:29

我想要python中各个变量和主要成分之间的相关性。我在sklearn中使用PCA。我不理解分解数据后如何获得加载矩阵？我的代码在这里。

iris = load_iris()
data, y = iris.data, iris.target
pca = PCA(n_components=2)
transformed_data = pca.fit(data).transform(data)
eigenValues = pca.explained_variance_ratio_

http://scikit-
learn.org/stable/modules/generated/sklearn.decomposition.PCA.html
没有提到如何实现。

关注者

被浏览

1 个回答

面试哥 2021-01-29

为面试而生，有面试问题，就找面试哥。

我认为@RickardSjogren在描述特征向量，而@BigPanda在进行加载。

我用一种方法创建了这个PCA类loadings。

给出的载荷pca.components_ * np.sqrt(pca.explained_variance_)与多元线性回归中的系数更相似。我.T在这里不使用，因为在上面链接的PCA类中，组件已经转换。
numpy.linalg.svd产生的u, s, and vt，其中vt是Hermetian转置，所以你首先需要回v用vt.T。

还有另外一个重要的细节：组件上的符号（正/负）和装入的内容sklearn.PCA可能与R之类的软件包不同。

知识点

Python

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦

去下载看看