jeudi 13 février 2014

ME +: Une feuille excel pour calculer la marge d'erreur d'un sondage

Les sondages diffusés par la presse sont des estimations de l'état de l'opinion publique à un instant donné. Ces estimations sont nécessairement incertaines dès lors que nous n'avons pas accès à l'ensemble de la population en question mais uniquement à un échantillon (normalement représentatif) de celle-ci. Le degré d'incertitude est principalement fonction de la taille de l'échantillon considéré: plus il petit, plus notre degré d'incertitude est élevé. Malheureusement, lorsqu'on interprète les résultats d'un sondage, on tend souvent à se fixer sur les pourcentages bruts sans se soucier de cette marge d'incertitude (c'est ce que font souvent les journalistes). J'ai discuté des problèmes que cela pouvait poser ici et ici.

C'est pour cette raison que j'ai élaboré une feuille excel, que j'appelle ME+, permettant aisément de calculer la marge d'erreur d'un sondage publié dans la presse. Il peut être téléchargé en cliquant sur ce lien-ci (il n'y a pas de virus ou de macro maléfique, rassurez-vous!).


Qu'est-ce que la marge d'erreur? 

Par exemple, si 40% de 1003 personnes, un échantillon représentatif de Belges, ont répondu par "oui" à la question "Je suis favorable à ce que l'on dépénalise l'euthanasie pour les mineurs", la marge d'erreur à 95% est de 3,03 %. Cela signifie donc qu'on peut être sûr à 95% que, si l'on interrogeait l'ensemble de la population belge, le pourcentage que l'on constaterait se situerait entre 36,97 (soit 40-3,03) et 43,03 (soit 40,03).  La marge d'erreur représente donc le degré de certitude que l'on peut avoir par rapport à notre estimation. 

Comment calculer la marge d'erreur d'un sondage dans ME+

Vous aurez besoin du nombre de personnes interrogées. Celles-ci sont normalement communiquées avec le sondage. Prenons par exemple un sondage BVA posant la question suivante: "Au Réveillon, si vous aviez le choix que consommeriez-vous, des huîtres ou du foie gras?" et proposant deux réponses (huîtres ou foie gras). Réponses (au grand dépit des canards): 65% disent du foie gras, 31% des huîtres, 4% ne savent pas. 991 personnes sont interrogées. 

J'ouvre ME+. Comme ma question porte sur un sondage unique, les informations devront être remplies dans la cellule B9 (ligne 9, colonne B). J'utilise le taux d'erreur conventionnel de 5% (j'indique donc 5 en B9), la taille de la population considérée (importe peu ici) correspond à l'ensemble des Français, je mets donc 60.000.000 en D9 (mais cela ne change rien si je me trompe de quelques millions!), j'indique 997 en en E9. Pour estimer la marge d'erreur correspondant à la réponse "huîtres", j'indique 31 en F9. La marge d'erreur est de 2.87. Je peux donc raisonnablement supposer que la valeur chez l'ensemble des Français se situe entre 28,13 et 33,87.  





Dans la colonne D, la marge d'erreur est représentée graphiquement.


On peut se convaincre de l'importance de la taille de l'échantillon dans le calcul de la marge en introduisant une taille d'échantillon plus petite, par exemple 300 personnes. Dans ce cas, la marge d'erreur devient de 5%:


La marge d'erreur dépend aussi du pourcentage observé. Elle est d'autant plus élevée que ce pourcentage est proche de 50%. Par exemple, pour les "ne sait pas" (4%), elle n'est que de 1,22% (par rapport aux 2,87% des huîtres). 

Me+ permet également de calculer la marge d'erreur sur la différence entre les scores obtenus lors de deux sondages différents, ou entre les scores à deux questions posées dans le même sondage. J'espère que certains journalistes en feront usage...

N'hésitez pas à me faire part de vos suggestions pour améliorer cet outil...

2 commentaires:

Anonyme a dit…

Merci beaucoup pour ce petit outil, que j'étais en train d'essayer de construire moi-même mais que vous avez déjà monté !

Olivier Klein a dit…

Merci pour votre commentaire. Ravi que ceci vous soit utile!