L'analyse de variance (ANOVA) est une méthode statistique puissante qui décompose la variabilité observée dans un ensemble de données en composantes systématiques (liées aux facteurs étudiés) et aléatoires. Elle permet d'évaluer l'impact des variables indépendantes sur la variable dépendante dans une étude de régression.
Développés au début du XXe siècle, les tests t et z étaient couramment utilisés jusqu'en 1918, date à laquelle Ronald Fisher a introduit l'ANOVA, également appelée analyse de variance de Fisher. Cette méthode étend les tests t et z. Le terme s'est popularisé en 1925 avec le livre de Fisher, Statistical Methods for Research Workers. Initialement appliquée en psychologie expérimentale, elle s'étend aujourd'hui à de nombreux domaines complexes.
La statistique F se calcule comme suit :
F = MST / MSE
où :
L'ANOVA constitue la première étape pour identifier les facteurs influençant un ensemble de données. Elle est suivie de tests post-hoc pour analyser les effets significatifs, alignés sur des modèles de régression.
Elle compare simultanément plus de deux groupes, via la statistique F, pour évaluer la variabilité entre et au sein des échantillons. Sous l'hypothèse nulle, F ≈ 1. La distribution F dépend des degrés de liberté du numérateur et du dénominateur.
Un chercheur peut comparer les performances d'étudiants de plusieurs collèges pour détecter des écarts systématiques. En R&D, elle évalue l'efficacité de processus de production en termes de rentabilité.
L'ANOVA s'applique aux données expérimentales, manuellement ou via logiciels. Idéale pour petits échantillons égaux, elle minimise les erreurs de type I par rapport aux tests t multiples et analyse la variance par sources (sujets, groupes, etc.).
Les principaux types sont l'ANOVA unifactorielle (unidirectionnelle) et bifactorielle (bidirectionnelle). La MANOVA étend l'ANOVA à plusieurs variables dépendantes.
ANOVA à un facteur : Évalue l'effet d'un facteur sur une variable de réponse, testant les différences entre trois groupes ou plus.
ANOVA à deux facteurs : Analyse l'effet de deux facteurs indépendants et leur interaction, comme salaire et compétences sur la productivité.
[]