Les principales lois de probabilité usuelles utilisées en statistiques sont, suivant le type de variable :



Pour les variables discrètes qui ne peuvent prendre que des valeurs entières  (le nombre de malades, de personnes exposées…)

N: la taille de la population,
n: la taille de l'échantillon prélevé dans la population,
p: la proportion d'individus possédant le caractère étudié dans la population (proportion de malades, d'exposés….)

  • La loi Binomiale B(n,p) pour modéliser la présence d'un caractère donné (être malade, être exposé…) dans un échantillon, de paramètres:

n: nombre d'épreuves réalisées (taille de l'échatillon)
p: la probabilité d'avoir le caractère étudié (proportion de malades, d'exposés….)

  • La loi de Poisson P(λ), utilisée pour étudier les phénomènes rares (les maladies rares), de paramètre λ.



Pour les variables continues  (comme la plupart des dosages et mesures biologiques, comme la pression sanguine, le taux d'hémoglobine…)

  • La loi Normale N(μ,σ2), qui sert à modéliser des phénomènes qui fluctuent autour d'une valeur moyenne (comme le poids, la taille), de paramètres :

μ: moyenne

σ2: variance


  • La loi de Student T(k), utilisée par exemple dans les tests de comparaisons de deux moyennes, de paramètre:

k: nombre de degrés de liberté.


  • La loi du Chi-Deux Χ2(k), utilisée par exemple dans les tests de comparaison de proportions, de paramètre

k: nombre de degrés de liberté.



Toutes ces lois peuvent être approchées au final par la loi Normale, sous certaines conditions qui sont résumées en suivant:

Approximation_des_lois

 

Ainsi par exemple lorque la taille de la population étudiée, N est très grand par rapport à la taille de l'échantillon n (N >> n), la loi hypergéométrique peut être approchée par la loi Binomiale.
La loi de Poisson dont le paramètre  λ est plus grand que 18, peut être approchée par la loi Normale de moyenne μ égale à  λ, et de variance σ2 égale à  λ aussi.


 


 

Dans les messages à partir du 14 avril, "Les Tests de Comparaison", je résume les conditions d'application des tests statistiques de comparaison et d'indépendance qui utilisent ces lois.