Sparse データの次元圧縮
どうやら、普通のPCAは使えないっぽい。MFとかTruncartedSVD とか使えばいいのか。
>>> from sklearn.decomposition import TruncatedSVD >>> from scipy import sparse as sp >>> X = sp.rand(1000, 1000, density=0.0001) >>> clf = TruncatedSVD(100) >>> Xpca = clf.fit_transform(X)