Types de données et statistiques descriptives
Types de données
Les données rencontrées lors d'une analyse peuvent être de plusieurs types. Voici ci-dessous tous les types possibles, en fonction les méthodes de modélisations peuvent varier.

Statistique descriptive
Comme son nom l'indique, les statistiques descriptives servent à décrire un lot de données.
Moyenne, variance et écart-type :

La variance et l’écart-type sont des mesures de dispersions, elles mesurent la même chose, l’écart-type est égal à la racine de la variance, ainsi les écarts ne sont pas à la même échelle.
Covariance :

La covariance mesure la moyenne des produits des écarts des valeurs par rapport à la moyenne pour chaque série. Elle représente ainsi la quantité de variance commune entre deux variables. De fait, comme pour la variance, la covariance peut être quantifiée. Une covariance plus élevée indique que les deux variables partagent une portion plus importante de variance.
Corrélation :
Définition : La corrélation est une mesure statistique qui exprime la notion de liaison linéaire entre deux variables (ce qui veut dire qu'elles évoluent ensemble à une vitesse constante). C'est un outil courant permettant de décrire des relations simples sans s'occuper de la cause et de l'effet. (Source : Logiciel JMP)

Le coefficient de corrélation n’est rien d’autre que la covariance normalisée, cela permet d’interpréter facilement la relation en ayant une échelle comprise entre -1 et 1.
La corrélation possède plusieurs limites, tout d’abord elle ne donne aucune indication sur les causes et les effets à l’origine de la relation. Ensuite, elle ne peut s’effectuer qu’entre deux distributions. Finalement, elle ne permet pas d’analyser les relations curvilinéaires.