Boîte 3 : Recherche quantitative > Module 4 - Les analyses statistiques
Boîte 3 : Recherche quantitative > Module 4 - Les analyses statistiques
Les statistiques sont un outil incontournable pour analyser, interpréter et présenter les données d’une étude. Ce module vous propose une initiation aux analyses statistiques, en vous guidant pas à pas à travers les méthodes les plus courantes et les ressources indispensables pour approfondir vos connaissances. Vous trouverez :
1. Le classique des analyses statistiques
Analyses descriptives : Moyennes, médianes, écarts-types, fréquences, pourcentages.
Analyses bivariées : Tests de corrélation, test du Chi², tests de Student et Mann-Whitney, ANOVA, Kruskal-Wallis.
2. Des ressources complémentaires
Un Prezi interactif : Un cours d’introduction aux statistiques, idéal pour visualiser les concepts et consolider vos bases théoriques.
Manuel d’apprentissage des statistiques avec JAMOVI : Un guide pratique et complet pour vous initier à l’utilisation de ce logiciel gratuit, tout en apprenant les bases des statistiques.
Un tableau récapitulatif des tests statistiques : Une ressource pratique pour identifier rapidement quel test appliquer selon la nature de vos variables (quantitatives, qualitatives, nominales, ordinales, etc.).
Analyses descriptives :
Les variables quantitatives seront décrites par leur moyenne et leur écart-type (ET) ou par leur médiane et leur Ecart Interquartile (IQR) selon la normalité de la distribution.
Les variables qualitatives seront exprimées en fréquences et pourcentages.
L'analyse descriptive permet de résumer et de présenter les caractéristiques principales des données, en fonction du type de variable (quantitative ou qualitative).
Pour les variables quantitatives (comme l’âge ou le poids) :
Si les données suivent une distribution normale (symétrique et sans valeurs extrêmes), on utilise la moyenne (valeur centrale) et l'écart-type (ET) (qui mesure la dispersion autour de la moyenne).
Si les données ne suivent pas une distribution normale (présence de valeurs extrêmes ou asymétrie), on utilise la médiane (valeur centrale qui divise la distribution en deux parties égales) et l'écart interquartile (IQR) (qui mesure la dispersion des 50 % des valeurs centrales).
Astuce pratique : On considère qu'une variable ne suit pas une distribution normale si elle est basée sur un petit nombre d’observations (moins de 30).
Pour les variables qualitatives (comme le sexe ou la profession) :
Elles sont présentées sous forme de fréquences (nombre de fois où une catégorie apparaît) et de pourcentages (proportion par rapport au total).
Exemple : 60 % des participants sont des femmes, 40 % sont des hommes.
Analyse des relations entre deux variables :
Entre variables quantitatives :
Corrélation mesurée par les coefficients de Pearson ou Spearman, selon la distribution des données.
Entre variables qualitatives :
Tests du Chi2 ou de Fisher, en fonction des effectifs.
Entre variables qualitatives nominales et quantitatives :
Tests de Student ou Mann-Whitney-Wilcoxon (pour deux modalités).
Tests ANOVA ou Kruskal-Wallis (pour plus de deux modalités).
L’analyse des relations examine si deux variables sont liées et de quelle manière.
Entre deux variables quantitatives (par ex. : âge et poids) :
On utilise des coefficients de corrélation pour mesurer la force et la direction de la relation.
Pearson : pour des données suivant une distribution normale.
Spearman : pour des données qui ne suivent pas une distribution normale.
Résultat : Un coefficient proche de +1 ou -1 indique une forte corrélation, tandis qu’un coefficient proche de 0 indique une absence de lien.
Entre deux variables qualitatives (par ex. : sexe et catégorie professionnelle) :
On utilise des tests statistiques pour déterminer si les proportions diffèrent entre les groupes.
Test du Chi² : utilisé si les effectifs sont suffisamment grands.
Test de Fisher : utilisé si les effectifs sont petits, en particulier si un effectif observé est inférieur à 5.
Entre une variable qualitative nominale (ex. : sexe) et une variable quantitative (ex. : poids) :
Pour comparer deux groupes :
Test de Student : si les données suivent une distribution normale.
Test de Mann-Whitney-Wilcoxon : si elles ne suivent pas une distribution normale.
Pour comparer plus de deux groupes (ex si le sexe comporte une modalité autre) :
Test ANOVA : si les données suivent une distribution normale.
Test de Kruskal-Wallis : si elles ne suivent pas une distribution normale.
Tests d’hypothèses :
Les tests seront effectués en bilatéral et considérés comme significatifs pour une p-valeur < 0,05.
Les tests statistiques servent à vérifier si les relations observées entre des variables sont dues au hasard ou à une véritable association.
Bilatéral : Cela signifie qu'on considère deux possibilités : une relation dans un sens (positive) ou dans l'autre (négative).
Seuil de significativité :
Une p-valeur < 0,05 signifie qu'il y a moins de 5 % de chance que le résultat soit dû au hasard.
Si la p-valeur est inférieure à ce seuil, on considère que le résultat est statistiquement significatif.
Pour aller plus loin
Les statistiques sont au cœur de toute démarche de recherche quantitative. Cette présentation à outils a pour objectif de vous initier aux concepts fondamentaux des analyses statistiques, pour vous permettre d’explorer vos données et de répondre efficacement à vos questions de recherche.
ntroduction aux statistiques
Comprendre ce que sont les statistiques, leur rôle dans la recherche, et leur utilité pour interpréter et donner du sens aux données recueillies. Les statistiques permettent de résumer des informations, de tester des hypothèses, et d’établir des relations entre des variables.
Les bases : les variables
Avant de se lancer dans les analyses, il est indispensable de bien identifier et différencier les variables (comme abordé dans la boîte sur la construction de questionnaire) :
Variables qualitatives (nominales et ordinales).
Variables quantitatives (continues et discrètes).
Les paramètres de position
Moyenne : Indicateur central qui résume les données quantitatives.
Médiane : Milieu de la distribution, particulièrement utile en cas de données asymétriques.
Apprendre à choisir l’indicateur le plus adapté selon vos données.
Les paramètres de dispersion
Écart-type (ET) : Mesure la variabilité des données autour de la moyenne.
Écart interquartile (IQR) : Indique la dispersion des données entre le 1er et le 3e quartile, idéal pour des distributions asymétriques ou comportant des valeurs extrêmes.
Ces outils permettent de comprendre la "dispersion" des données et leur degré de variabilité.
Présentation des données : tableaux et graphiques
Comment organiser vos données sous forme de tableaux clairs et concis.
Quels types de graphiques privilégier selon les variables étudiées : histogrammes, camemberts, boxplots, etc.
La visualisation des données est un point clé pour transmettre vos résultats de manière accessible.
Initiation aux analyses bivariées
Découvrez comment explorer les liens entre deux variables :
Pour deux variables qualitatives : test du Chi².
Pour une variable qualitative à deux modalités et une quantitative : test de Student ou test de Wilcoxon.
Pour deux variables quantitatives : calcul des corrélations (coefficients de Pearson ou de Spearman).
Ressources extérieures