Algorithme K-Medoids (PAM)
L'algorithme PAM (Partitioning Around Medoids) est une méthode de clustering qui nécessite de connaître à l'avance le nombre de groupes, représenté par k. L'objectif de PAM est de trouver un élément représentatif dans chaque cluster, appelé médoïde, qui minimise la distance moyenne avec les autres points du même groupe. Cette représentation aide à caractériser le groupe de manière concise et à interpréter ses caractéristiques principales.
​
PAM présente plusieurs particularités importantes. Tout d'abord, il implique le choix des points de départ, qui peuvent influencer la convergence de l'algorithme et la qualité des clusters obtenus. Ensuite, le choix de la métrique de distance est crucial car il détermine comment la similarité entre les points est mesurée, affectant ainsi la formation des clusters. Enfin, le choix du représentant de chaque cluster est essentiel, car il influence la façon dont le groupe est caractérisé et interprété.
En combinant ces éléments, PAM offre une approche robuste pour partitionner les données en clusters significatifs, en tenant compte de diverses considérations telles que le nombre de groupes, la distance entre les points et le choix des représentants des clusters.
​
Visualisation d'une segmentation PAM réussi :

@Le guide en science de données
Algorithme :

