DBSCAN Class

Signature

model = sp.DBSCAN(eps: float = 0.5, min_samples: int = 5)

model.fit(x: list[float], y: list[float]) -> None
model.fit_predict(x: list[float], y: list[float]) -> list[int]

model.labels_      -> list[int]
model.n_clusters_  -> int
model.n_noise_     -> int

Description

Low-level DBSCAN class for programmatic access to cluster labels. -1 labels indicate noise points (not part of any cluster).

Constructor Parameters

Parameter	Type	Default	Description
`eps`	`float`	`0.5`	Neighborhood distance threshold
`min_samples`	`int`	`5`	Minimum points to form a cluster core

Methods

`fit(x, y)`

Runs DBSCAN on the 2D data. Populates labels_, n_clusters_, and n_noise_.

Argument	Type	Description
`x`	`list[float]`	X coordinates
`y`	`list[float]`	Y coordinates

`fit_predict(x, y) -> list[int]`

Equivalent to calling fit(x, y) then returning labels_.

Attributes

Attribute	Type	Description
`labels_`	`list[int]`	Cluster label per point (`-1` = noise)
`n_clusters_`	`int`	Number of identified clusters
`n_noise_`	`int`	Number of noise points

Examples

Pipeline: cluster then visualize

import seraplot as sp

model = sp.DBSCAN(eps=1.0, min_samples=5)
model.fit(x_data, y_data)

color_groups = [str(lbl) for lbl in model.labels_]

chart = sp.build_scatter_chart(
    f"DBSCAN ({model.n_clusters_} clusters)",
    x_values=x_data,
    y_values=y_data,
    color_groups=color_groups,
)

Algorithmic Functioning

The DBSCAN class exposes the same Rust-backed algorithm as the chart variant.

For a point $p$, its $\epsilon$-neighbourhood is:

$$N_\epsilon(p) = \{q \in D : \|p - q\| \leq \epsilon\}$$

Core point: $|N_\epsilon(p)| \geq \text{min_samples}$
Border point: reachable from a core point but not itself a core point
Noise point: not reachable from any core point — label $-1$

SeraPlot builds a KD-tree for $O(\log n)$ radius queries and expands clusters via parallel BFS with SIMD distance acceleration. n_clusters_ counts only true clusters; noise points are excluded.

Description

Classe DBSCAN bas niveau pour un accès programmatique aux labels de cluster. Les points bruit ont le label -1.

Constructeur

Paramètre	Type	Défaut	Description
`eps`	`float`	`0.5`	Distance maximale de voisinage
`min_samples`	`int`	`5`	Nombre minimum de points pour une région dense

Méthodes

Méthode	Description
`fit(x, y)`	Ajuste le modèle
`fit_predict(x, y)`	Ajuste et retourne les labels

Attributs

Attribut	Description
`labels_`	Liste des labels par point (−1 = bruit)
`n_clusters_`	Nombre de clusters trouvés
`n_noise_`	Nombre de points bruit

Fonctionnement algorithmique

La classe DBSCAN expose le même algorithme Rust que la variante graphique.

Pour un point $p$, son $\epsilon$-voisinage est :

$$N_\epsilon(p) = \{q \in D : \|p - q\| \leq \epsilon\}$$

Point cœur : $|N_\epsilon(p)| \geq \text{min_samples}$
Point frontière : accessible depuis un point cœur, mais pas lui-même un point cœur
Point bruit : non accessible depuis aucun point cœur — label $-1$

SeraPlot construit un KD-tree pour des requêtes de rayon en $O(\log n)$ et étend les clusters par BFS parallèle avec accélération SIMD. n_clusters_ ne compte que les vrais clusters ; les points bruit en sont exclus.

SeraPlot Documentation

DBSCAN Class

Signature

Description

Constructor Parameters

Methods

`fit(x, y)`

`fit_predict(x, y) -> list[int]`

Attributes

Examples

Accessing labels

Pipeline: cluster then visualize

Algorithmic Functioning

See also

Description

Constructeur

Méthodes

Attributs

Fonctionnement algorithmique

Keyboard shortcuts

SeraPlot Documentation