top of page

L'algorithme DBSCAN

DBSCAN est un algorithme de densité, qui regroupe tous les points dans un même cluster s'ils sont à une distance prédéfinit d'au moins un des points du cluster.

​

L'algorithme décrit suit le principe de l'utilisation de la densité au lieu de la distance pour effectuer le clustering. Plutôt que de se baser sur la distance entre les points, cet algorithme considère la densité des points dans l'espace des données. Un point est considéré comme voisin d'un autre s'il se trouve à une distance inférieure à une valeur fixée appelée rayon. Ensuite, un point est considéré comme dense s'il a un nombre de voisins dépassant un certain seuil, défini par le nombre minimal de points nécessaires pour qu'un point soit considéré comme dense.

Les paramètres clés de cet algorithme sont le rayon, qui définit la distance seuil pour considérer les points comme voisins, et le nombre minimal de points synthétisés, qui spécifie le seuil de densité. Ces paramètres influencent la manière dont les clusters sont formés en déterminant la taille et la densité requises pour qu'un groupe de points soit considéré comme un cluster distinct.

​

Voici une visualisation itérative de DBSCAN :

image.png

Algorithme DBSCAN :

image.png

Algorithme DBSCAN vs K-Means (source : J. Han and M. Kamber) :

image.png
bottom of page