Sparse データの次元圧縮

どうやら、普通のPCAは使えないっぽい。MFとかTruncartedSVD とか使えばいいのか。

>>> from sklearn.decomposition import TruncatedSVD
>>> from scipy import sparse as sp

>>> X = sp.rand(1000, 1000, density=0.0001)

>>> clf = TruncatedSVD(100)
>>> Xpca = clf.fit_transform(X)

stackoverflow.com