Problématique

On étudie un caractère quantitatif donné noté X (tension artérielle, glycémie, âge des personnes interrogées…), dans 2 populations notées P1 et P2.

La moyenne (l'espérance) et la variance de X sont notées:
μ1 et σ1² dans la population P1 ;
μ2 et σ2² dans la population P2 .
Les moyennes μ1 et μ2 sont inconnues, et elles sont estimées par x1 et x2 sur un échantillon d'individus (de taille n1 et n2)  tiré dans chaque population P1 et P2.
Les variances σ1² et σ2² sont soit connues, soit inconnues et estimées respectivement par S1² et S2².

La question est de savoir si les moyennes estimées de X dans chaque échantillon sont égales, aux fluctuations d'échantillonnage près (c'est l'hypothèse nulle H͞0 pour un test bilatéral) ou si les deux moyennes sont statistiquement différentes (c'est l'hypothèse alternative H1).

C'est ce que l'on appelle un test d'homogéneité.


Tests à réaliser

  1. Si la taille des deux échantillons est plus grand que 30 individus (n > 30) et si les variances de X sont connues ou inconnues,
    alors on peut calculer la statistique U, à partir de σ², ou de S², qui sous l'hypothèse nulle suit une loi normale centrée réduite ( N(0,1) ).

    La statistique du test s'écrit:

    Statistique U 1

    Statistique U 2

  2. Si la taille de l'un des  deux échantillons est inférieure à 30 (n ≤ 30) et si X suit une loi normale alors:
    1. si les variances de X sont connues, on peut calculer la statistique U, à partir des σ², qui sous l'hypothèse nulle suit une loi normale centrée réduite (N(0,1)).
      La statistique du test s'écrit:
      Statistique U 1

    2. Si les variances de X sont inconnues, alors on applique un test F d'égalité des variances:
      • Si les variances sont égales, on peut calculer la statistique t, à partir de S, estimation de la variance commune, t suivant une loi de Student à n1+n2 - 1 degrés de liberté.
        La statistique du test s'écrit:
        Statistique t 1
        avec
        Calcul S

      • Si les variances sont différentes, on peut calculer la statistique t, à partir de S1² et S2², estimations des deux variances, t suivant une loi de Student à m degrés de liberté (c'est le test d'Aspin Welch).

        La statistique du test s'écrit:
        Statistique t 2
        Les dégrés de liberté m se calculent de la façon suivante:
        Calcul de m ddl
        avec:
        Calcul de C (m)


  3. Si la taille d'un des  deux échantillons est inférieure à 30 (n ≤ 30) et si X suit une loi inconnue alors:
    on applique le test non paramétrique de Mann-Whitney.


Application des tets avec les logiciels Epi Info ou R

 

Travaux-sur-les-blogs

 


Fiche récapitulative

 Comparaison de 2 moyennes