top of page

Introduction à la segmentation

La segmentation, ou clustering, vise à diviser un ensemble de données en groupes plus petits d'objets similaires. Ce processus cherche à maximiser l'homogénéité à l'intérieur de chaque groupe en minimisant la distance interne entre les membres du même groupe. Simultanément, il cherche à maximiser l'hétérogénéité entre les groupes en maximisant la distance externe entre les membres de différents groupes. Cette approche simplifie la représentation des données en réduisant leur complexité, mais elle entraîne également une perte de détails. Le niveau d'agrégation et le nombre de groupes, appelés clusters, sont des paramètres essentiels dans ce processus, influençant directement la manière dont les données sont organisées et interprétées.

Calcul de la distance entre deux groupes :

image.png

@ Le guide en science de données

 

Évaluation de la qualité des résultats :

image.png

Principaux algorithmes de clustering :

image.png

Comparaison de la performances des algorithmes :

image.png
bottom of page