Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Decomposition

Decomposition methods reduce the dimensionality of the data by projecting it onto a lower-dimensional subspace that captures the most variance or structure.

MethodDescription
PCAPrincipal Component Analysis — finds orthogonal axes of maximum variance
TruncatedSVDSingular Value Decomposition — works directly on sparse matrices

Both are documented on the same page: PCA / TruncatedSVD.

When to use

SituationMethod
Dense feature matrixPCA
Sparse data (e.g., TF-IDF text)TruncatedSVD
Visualisation in 2D / 3DPCA(n_components=2) or (n_components=3)
Noise reduction before modellingPCA with a variance threshold

Typical pipeline

import seraplot as sp
import numpy as np

pca = sp.PCA(n_components=2)
X_2d = pca.fit_transform(X)

print(f"Explained variance: {pca.explained_variance_ratio_}")

Les méthodes de décomposition réduisent la dimensionnalité des données en les projetant sur un sous-espace de dimension inférieure qui capture le maximum de variance ou de structure.

MéthodeDescription
PCAAnalyse en composantes principales — trouve les axes orthogonaux de variance maximale
TruncatedSVDDécomposition en valeurs singulières — fonctionne directement sur les matrices sparses

Les deux sont documentés sur la même page : PCA / TruncatedSVD.

Quand utiliser

SituationMéthode
Matrice densePCA
Données sparses (ex. : TF-IDF)TruncatedSVD
Visualisation en 2D / 3DPCA(n_components=2) ou (n_components=3)
Réduction de bruit avant modélisationPCA avec un seuil de variance

Pipeline typique

import seraplot as sp
import numpy as np

pca = sp.PCA(n_components=2)
X_2d = pca.fit_transform(X)

print(f"Variance expliquée : {pca.explained_variance_ratio_}")