L'échantillonnage systématique est un type de méthode d'échantillonnage probabiliste dans laquelle les membres de l'échantillon d'une population plus large sont sélectionnés selon un point de départ aléatoire mais avec un intervalle périodique fixe. Cet intervalle, appelé intervalle d'échantillonnage, est calculé en divisant la taille de la population par la taille d'échantillon souhaitée. Bien que l'échantillon de population soit sélectionné à l'avance, l'échantillonnage systématique est toujours considéré comme aléatoire si l'intervalle périodique est déterminé à l'avance et que le point de départ est aléatoire.
Étant donné que l'échantillonnage aléatoire simple d'une population peut être inefficace et prendre du temps, les statisticiens se tournent vers d'autres méthodes, telles que l'échantillonnage systématique. Le choix d'une taille d'échantillon par une approche systématique peut être fait rapidement. Une fois qu'un point de départ fixe a été identifié, un intervalle constant est sélectionné pour faciliter la sélection des participants.
L'échantillonnage systématique est préférable à l'échantillonnage aléatoire simple lorsqu'il existe un faible risque de manipulation des données. Si un tel risque est élevé lorsqu'un chercheur peut manipuler la longueur de l'intervalle pour obtenir les résultats souhaités, une simple technique d'échantillonnage aléatoire serait plus appropriée.
L'échantillonnage systématique est populaire auprès des chercheurs et des analystes en raison de sa simplicité. Les chercheurs supposent généralement que les résultats sont représentatifs de la plupart des populations normales à moins qu'une caractéristique aléatoire existe de manière disproportionnée avec chaque "n e" échantillon de données (ce qui est peu probable). En d'autres termes, une population doit présenter un degré naturel d'aléatoire avec la métrique choisie. Si la population a un type de modèle standardisé, le risque de choisir accidentellement des cas très courants est plus élevé. apparent.
Dans le cadre de l'échantillonnage systématique, comme pour les autres méthodes d'échantillonnage, une population cible doit être sélectionnée avant de sélectionner les participants. Une population peut être identifiée sur la base de n'importe quel nombre de caractéristiques souhaitées qui conviennent à l'objectif de l'étude en cours. Certains critères de sélection peuvent inclure l'âge, le sexe, la race, le lieu, le niveau d'éducation et/ou la profession.
Il existe plusieurs méthodes d'échantillonnage d'une population pour l'inférence statistique; l'échantillonnage systématique est une forme d'échantillonnage aléatoire.
Comme exemple hypothétique d'échantillonnage systématique, supposons que dans une population de 10 000 personnes, un statisticien sélectionne chaque 100e personne pour l'échantillonnage. Les intervalles d'échantillonnage peuvent également être systématiques, comme le choix d'un nouvel échantillon à prélever toutes les 12 heures.
Comme autre exemple, si vous vouliez sélectionner un groupe aléatoire de 1 000 personnes parmi une population de 50 000 en utilisant un échantillonnage systématique, tous les participants potentiels doivent être placés dans une liste et un point de départ serait sélectionné. Une fois la liste formée, chaque 50e personne sur la liste (en commençant le décompte au point de départ sélectionné) serait choisie comme participant, puisque 50 000/1 000 =50.
Par exemple, si le point de départ sélectionné était 20, la 70e personne de la liste serait choisie suivie de la 120e, et ainsi de suite. Une fois la fin de la liste atteinte et si des participants supplémentaires sont nécessaires, le décompte revient au début de la liste pour terminer le décompte.
Afin de procéder à un échantillonnage systématique, les chercheurs doivent d'abord connaître la taille de la population cible.
L'échantillonnage systématique et l'échantillonnage en grappes diffèrent dans la manière dont ils extraient les points d'échantillonnage de la population incluse dans l'échantillon. L'échantillonnage en grappes décompose la population en grappes, tandis que l'échantillonnage systématique utilise des intervalles fixes à partir de la population plus large pour créer l'échantillon.
L'échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à partir d'intervalles fixes réguliers de la population en fonction de sa taille. L'échantillonnage en grappes divise la population en grappes, puis prélève un échantillon aléatoire simple dans chaque grappe.
L'échantillonnage en grappes est considéré comme moins précis que les autres méthodes d'échantillonnage. Cependant, cela peut réduire les coûts d'obtention d'un échantillon. L'échantillonnage en grappes est une procédure d'échantillonnage en deux étapes. Il peut être utilisé lorsqu'il est difficile de remplir une liste de l'ensemble de la population. Par exemple, il pourrait être difficile de construire l'ensemble de la population des clients d'une épicerie à interroger.
Cependant, une personne peut créer un sous-ensemble aléatoire de magasins, ce qui constitue la première étape du processus. La deuxième étape consiste à interroger un échantillon aléatoire des clients de ces magasins. Il s'agit d'un processus manuel simple qui peut économiser du temps et de l'argent.
Un risque que les statisticiens doivent prendre en compte lorsqu'ils procèdent à un échantillonnage systématique concerne l'organisation de la liste utilisée avec l'intervalle d'échantillonnage. Si la population placée sur la liste est organisée selon un modèle cyclique qui correspond à l'intervalle d'échantillonnage, l'échantillon sélectionné peut être biaisé.
Par exemple, le service des ressources humaines d'une entreprise souhaite sélectionner un échantillon d'employés et leur demander ce qu'ils pensent des politiques de l'entreprise. Les salariés sont regroupés en équipes de 20, chaque équipe étant dirigée par un manager. Si la liste utilisée pour sélectionner la taille de l'échantillon est organisée avec des équipes regroupées, le statisticien risque de ne sélectionner que des managers (ou aucun manager) en fonction de l'intervalle d'échantillonnage.
L'échantillonnage systématique est simple à réaliser et facile à comprendre, c'est pourquoi il est généralement privilégié par les chercheurs. L'hypothèse centrale, selon laquelle les résultats représentent la majorité des populations normales, garantit que l'ensemble de la population est échantillonnée de manière uniforme. De plus, l'échantillonnage systématique offre un degré de contrôle accru par rapport aux autres méthodes d'échantillonnage en raison de son processus. L'échantillonnage systématique comporte également un facteur de faible risque car il y a peu de chances que les données soient contaminées.
Le principal inconvénient de l'échantillonnage systématique est que la taille de la population est nécessaire. Sans connaître le nombre précis de participants dans une population, l'échantillonnage systématique ne fonctionne pas bien. Par exemple, si un statisticien souhaite examiner l'âge des sans-abri dans une région spécifique mais ne peut pas obtenir avec précision le nombre de sans-abri, il n'aura pas de taille de population ni de point de départ. Un autre inconvénient est que la population doit présenter une quantité naturelle d'aléatoire, sinon le risque de choisir des instances similaires est accru, ce qui va à l'encontre de l'objectif de l'échantillon.
L'échantillonnage en grappes et l'échantillonnage systématique diffèrent dans la manière dont ils extraient les points d'échantillonnage de la population incluse dans l'échantillon. L'échantillonnage en grappes divise la population en grappes, puis prélève un échantillon aléatoire simple dans chaque grappe. L'échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à partir d'intervalles fixes réguliers de la population en fonction de sa taille. L'échantillonnage en grappes est susceptible d'une erreur d'échantillonnage plus importante que l'échantillonnage systématique, bien qu'il puisse s'agir d'un processus moins coûteux.