Évitez ces erreurs de polarisation des échantillons dans la recherche sur les médias sociaux

Comment promouvoir la qualité dans les échantillons de médias sociaux

La recherche sur les médias sociaux, telle qu'elle est actuellement menée, est soumise à un biais de non-participation. Un certain nombre de types de biais de non-participation existent et chaque type peut avoir un impact sur la fiabilité des résultats de la recherche - souvent cachés ou inconnus. En fait, la recherche a montré que les participants à la recherche qui sont difficiles à atteindre et qui ont besoin de multiples efforts pour les contacter diffèrent de manière significative des autres répondants.

Ces différences ont été observées selon l'âge, le sexe, l'état matrimonial, le statut socioéconomique, l'état de santé et le nombre d'enfants.

Taux de réponse

La mesure dans laquelle les données à la fin d'une étude comprennent tous les membres d'un échantillon est appelée taux de réponse . Bien que ce concept soit clair dans une enquête structurée ou un ensemble d'entretiens, il est plus ambigu dans la recherche sur les médias sociaux. Cependant, il n'est pas moins important dans la recherche sur les médias sociaux que dans d'autres types de recherche qualitative . Le taux de réponse est calculé en divisant le nombre de participants qui remplissent les questionnaires - ou accepte d'être interrogés - par le nombre total de personnes qui composent l' effort d'échantillonnage initial . Le nombre total doit inclure les personnes qui n'ont pas été contactées avec succès ou qui ont refusé de participer à la recherche.

Le problème de la généralisation

Indépendamment de la manière dont les données sont collectées, l'importance d'un taux de réponse élevé ne peut être suffisamment soulignée.

Il n'est pas possible de générer de manière réaliste une population plus importante lorsque le taux de réponse d'un échantillon est faible. La polarisation de l'échantillon augmente lorsque le taux de réponse diminue. Dans les enquêtes basées sur les médias, lorsque les taux de retour tombent à 20 ou 30% de l'échantillon, ce groupe de participants ressemble peu à la population de l'échantillon global.

La même tendance des gens à retourner un sondage postal ou à accepter de participer à un sondage téléphonique se produit avec des personnes qui s'engagent dans les réseaux sociaux: c'est-à-dire, un intérêt particulier pour le sujet (ou produit ou service, selon le cas être).

Taille de l'échantillon

Les échantillons plus petits ont une erreur d'échantillonnage plus importante que les échantillons plus gros. Considérons que les données de l'échantillon fournissent une estimation des attributs de la population plus large. Chaque échantillon tiré d'une base de sondage fournit une estimation distincte de cette population plus grande. Théoriquement, il pourrait y avoir un modèle distinct de réponses dans chaque échantillon pris pour chaque question posée. Avec le temps, avec suffisamment d'échantillons tirés de la base de sondage, le modèle réel convergerait autour du modèle (vrai) réel de la population plus large.

Marge d'erreur

L'erreur d'échantillonnage décrit la précision d'une estimation provenant de n'importe lequel des échantillons prélevés dans la plus grande population. L'erreur d'échantillonnage est exprimée en termes de marge d'erreur associée à un niveau de confiance, qui est une mesure statistique . Dans un scrutin présidentiel de préférence, par exemple, le rapport peut montrer que le titulaire est favorisé par 64% des électeurs. La marge d'erreur serait de plus ou moins 3 points avec un niveau de confiance de 95%.

En d'autres termes, si le sondage était effectué à nouveau avec 100 échantillons d'électeurs différents, sur les 100 électeurs, 95 électeurs indiqueraient que le titulaire est favorisé par 61% à 67% des électeurs. C'est-à-dire 61% des votants + 3% ou -3%.

Décisions sur la taille de l'échantillon

La marge d'erreur associée à l'échantillonnage diminue à mesure que la taille de l'échantillon augmente, mais seulement jusqu'à un certain point. Lorsque la taille de l'échantillon atteint 1000 à 2000 répondants, la marge d'erreur est suffisamment faible pour prendre en compte des échantillons plus importants (ce qui n'est pas un choix rentable ). Lorsque les sous-groupes font partie de la population plus grande, des tailles d'échantillon plus importantes peuvent être justifiées parce que la marge d'erreur variera pour chaque sous-groupe en fonction du nombre de personnes dans les sous-groupes. Par exemple, compte tenu de 1000 membres d'un réseau de médias sociaux et d'une marge d'erreur de 1 à 3 points de pourcentage avec un intervalle de confiance de 95%, l'analyse d'un sous-groupe de ce réseau de médias sociaux les mères comptant environ 100-auraient une plus grande marge d'erreur d'environ 4 à 10 points.

Mesurer la suffisance de l'échantillon

Les échantillons sont généralement évalués selon les procédures de sélection utilisées plutôt que selon la taille ou la composition finale. Ceci est fondamental car, dans la plupart des cas, il est impossible de mesurer avec précision la représentativité d'un échantillon de la population générale. Les procédures statistiques sont utilisées parce qu'elles permettent des estimations commodes et fondamentalement fiables. L'établissement d'un intervalle de confiance raisonnable et d'une marge d'erreur au début permet aux chercheurs de se concentrer sur des variables telles que le taux de réponse et des bases de sondage adéquates.