使用sklearn进行因子加载
我想要python中各个变量和主要成分之间的相关性。我在sklearn中使用PCA。我不理解分解数据后如何获得加载矩阵?我的代码在这里。
iris = load_iris()
data, y = iris.data, iris.target
pca = PCA(n_components=2)
transformed_data = pca.fit(data).transform(data)
eigenValues = pca.explained_variance_ratio_
http://scikit-
learn.org/stable/modules/generated/sklearn.decomposition.PCA.html没有提到如何实现。
-
我认为@RickardSjogren在描述特征向量,而@BigPanda在进行加载。
我用一种方法创建了这个PCA类
loadings
。给出的载荷
pca.components_ * np.sqrt(pca.explained_variance_)
与多元线性回归中的系数更相似。我.T
在这里不使用,因为在上面链接的PCA类中,组件已经转换。
numpy.linalg.svd
产生的u, s, and vt
,其中vt
是Hermetian转置,所以你首先需要回v
用vt.T
。还有另外一个重要的细节:组件上的符号(正/负)和装入的内容
sklearn.PCA
可能与R之类的软件包不同。