Introduction à la segmentation
La segmentation, ou clustering, vise à diviser un ensemble de données en groupes plus petits d'objets similaires. Ce processus cherche à maximiser l'homogénéité à l'intérieur de chaque groupe en minimisant la distance interne entre les membres du même groupe. Simultanément, il cherche à maximiser l'hétérogénéité entre les groupes en maximisant la distance externe entre les membres de différents groupes. Cette approche simplifie la représentation des données en réduisant leur complexité, mais elle entraîne également une perte de détails. Le niveau d'agrégation et le nombre de groupes, appelés clusters, sont des paramètres essentiels dans ce processus, influençant directement la manière dont les données sont organisées et interprétées.
Calcul de la distance entre deux groupes :

@ Le guide en science de données
Évaluation de la qualité des résultats :

Principaux algorithmes de clustering :

Comparaison de la performances des algorithmes :
