Survol statistique
Il existe plusieurs familles dans l'analyse statistique, les trois principales sont : les statistiques descriptives, les probabilités et l'inférence. Elles sont présentées ci-dessous. (source : Wheeler, Donald J. (2009) The four Questions of Data Analysis)
DESCRIPTION : Étant donné une collection de nombres, comment résumer d’une manière compréhensible, l’information contenue dans ces nombres ?

PROBABILITÉ : Étant donné univers de référence connu (population), que pouvons-nous dire à propos d’échantillons tirés de cet univers ?

INFÉRENCE : Étant donné un univers inconnu, étant donné un échantillon tiré de cet univers, étant donné que l’on connait tout de cet échantillon, que pouvons nous dire à propos de cet univers ?

Les sciences de données s’intéressent surtout à l’inférence.
​
Lorsqu'on fait une étude statistique, on peut se retrouver dans 2 cas. Soit dans une étude observationnelle, soit dans une étude expérimentale, cela entraine des protocoles différents. Le tableau ci-dessous présente les principales caractéristiques dans chaque cas.
