Qu'est-ce qu'un échantillon aléatoire stratifié?

Tout sur l'échantillonnage aléatoire stratifié

Un échantillon aléatoire stratifié est un type de procédure d'échantillonnage probabiliste. Les deux parties de base de ce type d'échantillon sont: 1) Elle est stratifiée, et 2) elle est probabiliste. Alors qu'est-ce que cela signifie exactement et pourquoi est-ce important? Un échantillon aléatoire stratifié est également connu sous le nom d'échantillonnage aléatoire proportionnel ou d'échantillonnage aléatoire par quotas.

Qu'est-ce qu'un échantillonnage aléatoire stratifié?

Un échantillon est une mini-représentation d'une plus grande population.

Les échantillons peuvent être déterminés de manière informelle ou formelle. Mais les échantillons qui sont systématiquement développés selon certaines méthodes scientifiques sont généralement perçus comme étant plus utiles pour faire des généralisations sur la population plus large.

Que signifie stratifié?

Les échantillons stratifiés sont constitués de sous-groupes homogènes considérés comme distincts d'une manière importante. Une collection de ces sous-groupes homogènes est appelée strate. Cette méthode d'échantillonnage permet à la population de se diviser en sous-groupes homogènes à partir desquels des échantillons aléatoires simples peuvent être sélectionnés .

Pourquoi un échantillon stratifié est-il utile?

Le but de l'échantillonnage aléatoire stratifié est de sélectionner des participants de différents sous-groupes qui sont jugés pertinents par rapport à la recherche qui sera menée. Par exemple, les résultats d'une étude peuvent être influencés par les attributs des sujets , tels que leur âge, leur sexe, leur niveau d'expérience de travail, leur groupe racial et ethnique, leur situation économique, leur niveau d'éducation, etc.

Un échantillon stratifié est construit de sorte que ces caractéristiques potentiellement influentes puissent raisonnablement être considérées comme reflétant le profil de ces caractéristiques dans la population globale. De cette façon, l'échantillon reflète la population dont il a été prélevé, mais l'échantillon ne peut pas être considéré comme représentatif de l'ensemble de la population .

Rappelez-vous, la sélection des membres d'un échantillon stratifié n'est pas un processus aléatoire. Cela dit, une fois que les strates ont été établies, un échantillonnage aléatoire simple est utilisé pour sélectionner les membres des échantillons pour chaque strate .

Que signifie probabiliste?

Un échantillon aléatoire stratifié est probabiliste, car chaque méthode utilisée pour sélectionner la population de l'échantillon fournit un moyen raisonnablement fiable d'estimer la représentativité de la population de l'échantillon par rapport à la plus grande population (de l'univers) à partir de laquelle l'échantillon a été sélectionné. En d'autres termes, un échantillon probabiliste permet à un chercheur d' estimer la probabilité que l'échantillon sélectionné représente ou ne représente pas la plus grande population à partir de laquelle l'échantillon a été tiré.

Exemples

Utiliser des méthodes d'échantillonnage aléatoire stratifié lorsqu'il y a un intérêt dans les différences entre les sous-groupes homogènes et la population de l'échantillon plus large dans son ensemble.

Disons qu'une population de clients d'affaires peut être divisée en trois groupes: Gen-Xers, Gen-Yers (Millennial) et Baby Boomers. De plus, nous avons des raisons de croire que les Gen-Xers et les Gen-Yers sont des minorités relativement plus petites de la clientèle d'affaires globale. Les Gen-Xers représentent environ 5% de la population totale de la clientèle et les membres de la génération Y représentent environ 10% de la clientèle.

Un échantillon aléatoire simple de 100 membres (n = 100) pourrait générer 5 Gen-Xers et 10 Gen-Yers si nous utilisions une fraction d'échantillonnage de 10%. Il serait possible d'avoir encore moins de Gen-Xers et moins de Gen-Yers que cela dans l'échantillon - juste par hasard. La stratification est susceptible de produire des résultats plus représentatifs. Disons que nous voulons avoir au moins 25 personnes dans chaque groupe. Si nous prenons encore un échantillon de 100 (n = 100), nous pourrons échantillonner 25 Gen-Xers, 25 Gen-Yers et 50 baby-boomers.

Nous savons que 10% de la population est composée de la génération Y ou de la génération Y (soit environ 100 de nos clients) et un échantillon aléatoire de 25 clients donnera une fraction d'échantillonnage à l'intérieur de la strate de 25/100 ou 25%. Parmi les 50 clients qui ne sont pas des baby-boomers, il y a Gen-Xers, ce qui signifie que la fraction intra-strate sera de 25/50 ou 50%.

Donc, 50 Gen-Xers plus 100 Gen-Yers est un total de 150 de notre échantillon de clients. Comme la population totale des clients est de 1000, nous soustrayons les Gen-Xers plus les Gen-Yers (150 clients au total), ce qui laisse 850 clients, qui sont des baby-boomers. La fraction d'échantillonnage à l'intérieur de la strate pour les baby-boomers est de 50/850, soit environ 5,88%.

Deux choses sont évidentes: (1) Les trois groupes sont plus homogènes au sein du groupe que dans l'ensemble de la population. Cela signifie qu'il y a moins de variance, ce qui offre l'opportunité d'une plus grande précision statistique . (2) Et puisque l'échantillon a été stratifié, il y aura suffisamment de membres de chaque groupe pour pouvoir faire des inférences de sous-groupes significatives .

L'échantillonnage stratifié peut être préféré à l'échantillonnage aléatoire simple lorsqu'il est important de représenter l' ensemble de la population et de représenter les sous-groupes clés de la population, en particulier lorsque les sous-groupes sont assez petits mais distingués de manière importante. En utilisant des méthodes d'échantillonnage stratifié, un chercheur peut effectivement s'assurer que les sous - groupes peuvent être différenciés dans la discussion des résultats de la recherche.