Vérifier l'hypothèse de normalité des données dans SPSS
- Marilyse Julien
- 17 janv. 2021
- 2 min de lecture
Plusieurs analyses en statistique requiert que les données soient approximativement normalement distribuées. Voici un tutoriel expliquant comment vérifier cette hypothèse dans SPSS.
La façon la plus simple de vérifier si des données sont approximativement normalement distribuées, est d'observer si l'histogramme a environ la forme d'une cloche.

De façon plus rigoureuse, voici les 5 critères qu'on peut utiliser pour vérifier si des données sont approximativement normalement distribuées :
Critère #1 : Vérifier que l'histogramme est en forme de cloche.
Critère #2 : Vérifier que la valeur p du test de Shapiro-Wilk n'est pas significative (p>0,05). L'hypothèse nulle de ce test est que les données sont normalement distributées, donc une valeur p non significative indique qu'il n'y a pas d’évidence d’anormalité.
Critère #3 : Vérifier la forme du graphique QQ ou Q-Q plot. Si les données sont approximativement normalement distribuées alors les points se situeront près de la ligne diagonale et il n'y aura pas de tendance (par exemple, on ne veut pas voir les données à l'une des extrémités du graphique s'éloigner progressivement de la diagonale).
Critère #4 : Vérifier que le coefficient d'asymétrie (skewness) est entre -1 et 1 et le coefficient d'aplatissement (kurtosis) est entre -2 et 2.
Critère #5 : Vérifier qu'il n'y a pas de données extrêmes (outliers). Cela peut être fait à partir de la boîte à moustaches (boxplot) en vérifiant qu'il n'y a pas de point à l'extérieur de l'extrémité des moustaches.
Voici comment vérifier ces 5 critères dans SPSS :
Étape 1) Sélectionnez Analyze > Descriptives Statistics > Explore...
Étape 2) Dans la nouvelle fenêtre, glisser la ou les variables pour lesquelles vous voulez vérifier l'hypothèse de normalité dans la section Dependent List. À noter que, si vos données contiennent des données manquantes et que vous allez analyser des variables simultanément (par exemple faire un test t entre deux échantillons indépendants), alors il est important de vérifier l'hypothèse de normalité pour les deux variables en même. De cette façon, seulement les données disponibles pour les deux variables seront considérées.

Étape 2) Assurez-vous que, dans la section Display, l'option Both est sélectionnée.
Étape 3) Cliquez sur Statistics... et sélectionnez Descriptives et Outliers. Cliquez sur Continue.

Étape 4) Cliquez sur Plots... et sélectionnez et assurez-vous que les options Histogram et Normality plots with tests sont sélectionnées. Cliquez sur Continue.

Étape 5) Vérifiez les 5 critères présentés plus haut!


Commentaires