Schéma général du cours

 

Prof dr sisi kayan cours de sondage 1Prof dr sisi kayan-Sallabus- cours de sondage 1 (571.43 Ko)

 

COURS DE THEORIES ET METHODES DE SONDAGE

PROF DR. SISI KAYAN

La pratique des sondages s'est aujourd'hui étendue à tous les aspects de la vie. L'essentiel de nos connaissances, de la recherche scientifique, des politiques et de la planification, voire des décisions, actions et attitudes individuelles dans la vie de tous les jours, est dans une large mesure façonné et orienté par des sondages. Les décisions d'achat, le diagnostic et le traitement de maladies, les opinions sur les lieux, les peuples ou les institutions reposent sur des contacts et expériences limités, voire uniques, qui sont néanmoins considérés comme représentatifs de l'ensemble du phénomène considéré. Il n'est pas rare que des auteurs écrivent des livres ou des articles sur des lieux ou même des pays aussi grands que l'Inde, après n'y avoir séjourné que quelques jours. Ces écrits se fondent sur des observations et expériences limitées, qui font alors fonction d'échantillon.

Le phénomène des sondages s'est généralisé dans le monde moderne. L'acheteur d'un lot de céréales n'examine qu'une poignée de grains pour se faire une idée de la qualité de l'ensemble; le cuisinier ou la ménagère ne goûtent que quelques bouchées (ou cuillerées) de leurs préparations pour juger du goût de tout le plat, et il suffit de quelques gouttes de sang pour analyser tout le sang que contient le corps d'un individu. Cette omniprésence du recours aux sondages laisse à penser que ceux-ci pourraient avoir la même efficacité dans le domaine des statistiques de l'éducation que dans d'autres activités humaines ou dans les travaux universitaires.

La validité des conclusions tirées d'un sondage est néanmoins fonction de la représentativité de l'échantillon. Les déductions citées en exemple plus haut partent implicitement du principe que tous les éléments de la population considérée sont de même nature, du moins pour ce qui est de leurs grandes caractéristiques quantitatives ou qualitatives, ou bien que ces éléments sont suffisamment bien répartis dans la population pour qu'on puisse tirer de l'analyse d'un petit nombre d'éléments, voire d'un seul, autant d'informations que si l'on analysait l'ensemble de ia population. Or, cette dernière peut n'être ni uniforme ni homogène, ce qui amène à se poser des questions sur la représentativité de l'échantillon et, partant, sur le bien-fondé de l'application à l'ensemble de la population des conclusions tirées de l'analyse de l'échantillon. Pour leur part, la représentativité de l'échantillon et la validité des conclusions tirées du sondage sont dans une large mesure fonction de la méthode de sondage, de la taille de l'échantillon et des techniques d'enquête et d'analyse.

Si l'on n'exclut de l'échantillon qu'un petit nombre d'éléments de la population, les estimations établies à partir de l'échantillon seront pratiquement identiques aux statistiques de la population tout entière, l'échantillon étant dans ce cas quasiment de même taille que la population. Lorsque, par contre, l'échantillon ne compte qu'un ou deux éléments de la population, il risque de ne pas être représentatif, sauf si la population est parfaitement homogène.

Dans l'optique de la représentativité, la méthode d'échantillonnage est aussi importante que la taille de l'échantillon. 11 est communément admis que l'échantillonnage aléatoire simple permet de sélectionner un échantillon véritablement représentatif, alors qu'un échantillon tiré à l'aveuglette peut s'avérer atypique, quelle qu'en soit la taille. Par ailleurs, les conclusions tirées de l'échantillon ne sont pertinentes et correctes que dans la mesure où les techniques d'analyse employées sont celles qui conviennent.

La taille de l'échantillon, la méthode d'échantillonnage et les techniques d'inférence des conclusions à partir de l'échantillon jouent donc un rôle capital tant dans la théorie que dans le pratique des sondages. Aussi a-t-on prêté une attention particulière à ces trois aspects dans la réalisation de l'enquête pilote.

Avantage de l’enquête par sondage : Substituer le sondage à la méthode actuelle de production des données (par recensement)  ne peut se justifier que si, d'un point de vue tant analytique que pratique, le sondage présente des avantages certains par rapport au recensement. Tel est effectivement le cas, et ces avantages sont considérables lorsque la population est nombreuse. On peut considérer comme particulièrement importants, en théorie comme en pratique, les avantages ci-après que présentent les sondages par rapport aux recensements.

Objectif

L'objectif de ce cours est d'introduire les principaux concepts de la théorie des sondages en soulignant la nature particulière de l'aléa et l'importance des calculs de précision, et de présenter les plans de sondage les plus classiques. Le rôle de l'information auxiliaire sera mis en exergue, que ce soit lors de la phase d'échantillonnage ou lors de l'estimation. Ce cours sera illustré par des exemples d'enquêtes, et les procédures de sondages de SAS seront brièvement présentées.

Principaux acquis de la formation :

A l’issue du cours, l’étudiant saura

  • Définir un plan de sondage (méthode et algorithme) adapté au problème posé ;
  • Calculer la précision des estimateurs (moyenne, total, proportion) issus d'une enquête par sondage;
  • Utiliser des variables auxiliaires pour améliorer la qualité des estimateurs;
  • Repondérer les données pour corriger de la non-réponse totale et mettre en place des stratégies d'imputation pour corriger de la non-réponse partielle.
  1. GENERALITES : Enquête et sondage

I.1. L’enquête

I.1.1. Définition

L’enquête sociologique est très fréquemment utilisée dans les sciences humaines et souvent par les gestionnaires. Le sondage électoral et les études de marché sont les formes d’enquête les plus répandues.

Mais comment définir une enquête ? Et plus particulièrement une enquête commerciale ?

Dans le langage courant le mot enquête ne ramène pas nécessairement à une démarche méthodologique de recherche. Il signifie le plus souvent : quête d’informations, collecte de témoignages, recherche pour savoir quelque chose. Mais il convient de distinguer l’enquête sociologique des autres types d’enquête (enquête administrative, juridique, de police ou encore journalistique).

L’enquête sociologique est une collecte d’informations sur une population donnée. Sa principale caractéristique est de recourir pour cette collecte de données à l’interrogation systématique de sujets de cette population pour décrire, comparer ou expliquer. Aussi, elle relève d’une démarche scientifique.

C’est pour cette raison qu’une enquête en sciences sociales ou commerciales doit être conduite avec la plus grande rigueur méthodologique pour réduire le plus possible la subjectivité de celui qui la réalise.

La mise en œuvre d’une enquête suppose avant tout un questionnaire bien pensé; strictement préparé autour de la construction d’une problématique. Par ailleurs, dans la collecte des informations une attention particulière doit être accordée au mode de recueil de l’information et au choix de l’échantillon. Au niveau de l’analyse des résultats, on va utiliser la quantification, et des lois statistiques.

L’utilisation des renseignements fournis par les sujets sur eux-mêmes, peut introduire un biais dans les conclusions que l’on pourrait tirer des résultats de l’enquête. En effet, le sujet peut répondre en exagérant ou en minimisant sa situation ou encore en répondant au hasard. Aussi, il faudra veiller à obtenir des réponses aussi fiables possibles.

Quand va-t-on recourir à l’enquête sociologique ?

En sciences humaines, il existe des méthodes concurrentes de la technique d’enquête pour obtenir des données sur une population.

Mais si nous avons pour objectif de comprendre la façon dont les individus se représentent un phénomène, de connaître leur perception des choses, leurs valeurs, et leurs normes, l’enquête sociologique (et par conséquent le sondage) est la plus adaptée. Autrement le chercheur a à sa disposition des outils comme l’étude documentaire, l’observation directe, l’entretien non-directif ou l’expérimentation.

Imaginons que l’on vous demande de mener une enquête, quelle serait selon vous la première étape dans la réalisation de cette enquête ?

La première chose à faire est de définir votre objectif général. Que voulez savoir (quel est le sujet que vous souhaitez étudier) et sur quelle population doit porter cette étude ? A quoi va servir cette enquête ?

Cette formalisation des objectifs de l’étude doit s’accompagner d’une formalisation des contraintes de l’étude. Il s’agit de mettre en évidence sa faisabilité pratique (aspect financier, calendrier prévisionnel, collaborations possibles, matériel disponible, possibilités d’accès aux personnes à interroger).

La rigueur garante de l’objectivité d’une enquête demande une préparation et une organisation très précise de celle-ci. Le respect de la démarche scientifique requiert le suivi de la chronologie des huit grandes étapes du déroulement d’une enquête.

I.I.2. Etapes d’une enquête

  • Étape 1 : La définition de l’objectif général
  • Étape 2 : La définition des objectifs spécifiques
  • Étape 3 : L’élaboration du plan d’observation
  • Étape 4 : La préparation de l’instrument d’observation
  • Étape 5 : Le recueil de l’information
  • Étape 6 : La préparation des données
  • Étape 7 : L’analyse des résultats
  • Étape 8 : La rédaction du rapport final

Attardons nous quelques instants sur chacune de ces étapes :

Étape 1 : La définition de l’objectif général

Nous avons vu tout à l’heure que l’objectif général devait être vu comme l’énoncé du problème qui nécessite le recours à l’enquête. On peut par exemple se demander s’il y a unité ou diversité des comportements de lecture des jeunes?

Étape 2 : La définition des objectifs spécifiques

Une fois la question de départ posée, il s’agit de procéder à sa décomposition en objectifs spécifiques ou questions plus limitées. Cette formulation en objectifs spécifiques revient à se poser une série de questions de la forme : tel facteur a-t-il de l’effet sur tel phénomène ? Ils peuvent se formuler sous forme d’hypothèses que l’on va chercher à vérifier.

Étape 3 : L’élaboration du plan d’observation

Ce plan d’observation est la façon d’organiser le déroulement de l’enquête. Les objectifs de l’enquête et les contraintes pratiques vont être déterminantes pour l’élaboration de ce plan. À cette étape un certain nombre de choix sont opérés : quelle population interroger ? Selon quels critères est-elle définie ? Qui sera soumis à cette enquête ? (La population entière ou un échantillon ?) Quel type de consultation faire ? (Des entretiens individuels ou un questionnaire standardisé ?). S’agit-il d’une description d’une population à un moment donné ou faudra-t-il suivre son évolution dans le temps ?

Étape 4 : La préparation de l’instrument d’observation

A ce stade du déroulement de l’enquête, l’échantillonnage et l’élaboration du questionnaire se font. Les questions à poser seront fonction des objectifs spécifiques de l’enquête. Plus ces derniers seront nombreux, et plus le questionnaire sera long. Ce questionnaire devra être mis en test réel pour s’assurer de son bon fonctionnement. (Bonne compréhension des questions, bon fonctionnement des filtres, liste des modalités de réponses pertinentes, ordre des questions logiques ...)

Étape 5 : Le recueil de l’information

Les sujets sont interrogés à cette étape sur le terrain et selon la modalité choisie pour l’enquête

Étape 6 : La préparation des données

Les données collectées ne peuvent être utilisées telles quelles, il sera donc nécessaire de les présenter sous une forme qui permette l’analyse prévue. Les données seront saisies en informatique suivant un codage précis en prévision d’analyses statistiques.

Étape 7 : L’analyse des résultats

Les informations sont traitées en fonction de la nature des données recueillies et des objectifs de l’étude (description, comparaison ou vérification d’hypothèses). À ce stade il faut se préoccuper de la qualité des données obtenues. Trois niveaux d’analyse de plus en plus complexes sont possibles : les tris à plat (examen d’une seule variable à la fois), les tris croisés (deux variables prises en compte simultanément), l’analyse multivariée (plusieurs variables prises en compte simultanément.)

Étape 8 : La rédaction du rapport final

Ce rapport final décrit à la fois les objectifs, la méthodologie, les résultats et leurs interprétations.

Comme vous pouvez le voir, ces étapes s'inscrivent dans une suite chronologique. L’enquête ne débute donc pas par la construction du questionnaire (étape n°4). Par ailleurs, l’étape du recueil de l’information est un point de non retour car, une fois la collecte terminée, vous ne pourrez plus repartir sur le terrain si telle ou telle information venait à vous manquer.

Autrement, les étapes 2, 3 et 4 ne peuvent être traitées de façon indépendante. Les objectifs spécifiques déterminent le plan d’observation mais ce dernier peut nous amener à revoir les objectifs spécifiques.

I.I.3.  Le questionnaire d’une enquête

Le questionnaire est l’instrument de base de l’enquête sociologique. Il est construit à partir des buts de recherche que l’on s’est fixés, il doit comporter l’ensemble des variables qui permettront au chercheur d’obtenir les informations qui lui seront nécessaires pour bâtir son analyse. Les principales hypothèses définies dans l’étape n°2 (objectifs spécifiques) seront vérifiées par ces questions. La stratégie de construction d’un questionnaire est relativement simple.

Il faut cependant s’assurer de quatre choses :

  • que les enquêtés (sondés) comprennent les questions
  • qu’ils sont capables d’y répondre
  • qu’ils acceptent d’y répondre
  • et que la réponse est formulée de façon authentique et non-influencée.

Pour ce faire, le chercheur doit se mettre dans la peau de ceux à qui le questionnaire sera administré et prévoir leurs réactions aux questions. C’est le meilleur moyen de concevoir des questions favorisant l’obtention de l’information souhaitée.

Il est préférable, autant que faire ce peut, de revoir les questions déjà produites lors d’enquêtes antérieures sur le même thème de recherche ou sur des thèmes proches du sien.

Il convient de réaliser un pré-test de ce questionnaire.

Avant d’aller sur le terrain avec votre sondage, le pré-test est une opération qui consiste à soumettre le questionnaire à un nombre restreint de personnes susceptibles d’être interrogées dans le cadre de votre grande enquête. Son principal intérêt est de vous permettre de d’identifier les points faibles du questionnaire : mauvaise formulation des questions, insuffisance des informations recueillies. La détection de ces problèmes en amont de la phase de terrain permet de limiter les problèmes d’interprétation des résultats.

Globalement, la formulation des questions, le choix des questions (ouvertes ou fermées), ainsi que la forme et le choix des réponses proposées seront élaborés en fonction de trois critères : la clarté (compréhension), la neutralité (authenticité des réponses) et l’adéquation qui nous renvoie à la capacité des interviewés à répondre au questionnaire.

Je vous propose de préciser les choses sur les deux premiers critères :

La clarté : les questions doivent être formulées dans un vocabulaire simple compréhensible par le plus grand nombre. Les concepts techniques doivent être déclinés le plus simplement possible. La clarté s’obtient également par la formulation de questions courtes

La neutralité : Cette notion est importante dans une enquête ou un sondage. L’information à recueillir doit être demandée (via le questionnaire) de façon objective. Il s’agit ici de s’assurer de l’authenticité des réponses. Un questionnaire est considéré comme étant neutre quand il préjugera le moins possible des réponses éventuelles. Un choix assez large de possibilités de réponses devra être proposé aux sondés.

Exemple : une présélection d’items et une réponse "autre" dans laquelle on laisse le sondé préciser sa réponse.

La satisfaction de ces trois critères limite le nombre de refus de réponse et par conséquent les problèmes de pertinence des résultats obtenus.

La préparation matérielle du questionnaire se concrétise aussi par des efforts au niveau de la charpente de celui-ci. Trois éléments sont importants à ce niveau : la longueur du questionnaire, l’ordre et l’orientation des questions.

La longueur du questionnaire.

Globalement, il faut veiller à ce que les questionnaires auto-administrés (c’est-à-dire remplis par l’interviewé sans la présence d’un enquêteur) soient les plus courts possible, il en est de même pour certains questionnaires administrés par téléphone.

L'ordre des questions.

Un questionnaire comporte un certain nombre de sections qui correspondent chacune à une variable ou un groupe de variables. Il est donc nécessaire, pour s’assurer d’une bonne participation du sondé, de mettre des liaisons entre les différentes sections.

En règle générale, l’articulation retenue par les concepteurs de questionnaires est la suivante :

1) Une ou plusieurs questions pour s’assurer que l’interviewé fait partie de la population sur laquelle on fait notre recherche.

2) La première section doit comporter des questions faciles à répondre pour le mettre en confiance (il convient de soigner la formulation de ces questions). À ’intérieur de cette section, les questions devront être simples et attrayantes tandis que les questions les plus délicates y seront placées à la fin.

3) Les passages d’une section à l’autre devront être marqués par une courte phrase de transition informant l’interviewé de l’orientation du questionnaire.

4) En fin de sondage, on retrouvera les caractéristiques socio-économiques en fin de sondage.

Globalement, les questions générales précèdent les questions spécifiques.

L'orientation du questionnaire.

Il faut savoir qu’en matière de questionnaire il existe ce qu’on appelle un "biais de positivité" c’est à dire que toutes choses étant égales par ailleurs, les individus ont tendance à répondre plus facilement oui que non et plus facilement d’accord que pas d’accord.

Aussi il faut veiller à limiter l’effet de ce biais.

Juste une précision, par question fermée il faut entendre une question qui laisse le choix à l’interviewé entre deux modalités de réponses (oui/non) ou plus (choix multiples : un peu/ beaucoup/ pas du tout).

Une question ouverte laisse au sondé le choix d’utiliser son propre vocabulaire pour répondre à la question (Quel est votre âge ?).

Une question filtre est une question qui permet selon la réponse de choisir la question qui sera abordée ensuite.

En résumé un bon questionnaire doit :

  • Être simple avec une présentation claire et attrayante (faire attention à la disposition et à la forme).
  • Avoir des questions simples c’est à dire :

- courtes (phrases interrogatives n’excédant pas 20 mots)

- neutres (pas de questions tendancieuses ou biaisées)

- sans ambiguïté : utiliser un vocabulaire simple et adapté à la forme de recueil de l’information (écrit ou oral), éviter les mots à plusieurs sens et les formes grammaticales peu claires.

  • Directes ou indirectes
  • Il faut soigner les réponses proposées :            OUI / NON / Ne sait pas

Par ailleurs il convient de faire attention :

  • à l’ordre des questions
  • aux réponses fourre-tout ou induites (questions dans laquelle il y a déjà la réponse)
  • aux questions ouvertes.

Test du questionnaire.

Comme je vous l’ai indiqué précédemment, il faut tester ce questionnaire avant de le lancer, et penser à son exploitation au moment de sa rédaction. En phase de test du questionnaire, une série de questions peut vous permettre d’évaluer votre questionnaire en vue de son amélioration.

Les questions sont-elles comprises ? Les enquêtés ont-ils du mal à répondre? Donnent-ils plusieurs réponses à une même question ? Écrivent-ils des commentaires dans la marge ?

Quelles questions passent mal et provoquent la gêne des enquêtés ? Ces questions sont-elles par exemple trop personnelles et entraînent-elles des refus de répondre, des rires ou d’autres manifestations de malaise ?

L’information demandée est-elle appropriée aux répondants ? N’a-t-on pas oublié d’introduire des filtres ? Les renvois prévus conviennent-ils ?

Le vocabulaire est-il adapté ? Y a-t-il des mots ou expressions qui nécessitent une explication ? L’enquêteur suit-il exactement le texte prévu pour la question ou est-il obligé de l’aménager ?

Les listes de modalités de réponses sont-elles pertinentes et exhaustives ? Les enquêtés en ont-ils ajouté ? La modalité "autre" a-t-elle reçu beaucoup de réponses ?

Les questions produisent-elles des variations de réponses suffisantes ? N’y a-t-il pas de questions qui font l’unanimité sur une seule réponse (et qui seraient donc inutiles.)

L’ordre des questions paraît-il logique ? N’y a-t-il pas des effets liés à l’ordre des questions ?

Y a-t-il des transitions, enchaînements, liens entre les questions ? Les textes de présentation ou de transition conviennent-ils ?

Des questions difficiles ne doivent-elles pas être positionnées plus loin dans le questionnaire ?

A-t-on indiqué aux enquêtés de quelle façon répondre (cocher, entourer, barrer, un choix, plusieurs réponses possibles, etc.) Les enquêtés comprennent-ils comment répondre aux questions ? Se conforment-ils aux consignes ?

Les enquêteurs (dans une enquête de face à face) comprennent-ils comment poser les questions et noter les réponses ? Les consignes pour l’enquêteur sont-elles claires et suffisantes.

En outre on peut, pour améliorer le questionnaire :

  • Essayer plusieurs formes de questions pour choisir celle qui paraît la meilleure
  • Fermer les questions ouvertes
  • Évaluer la durée de l’entretien
  • Relever les erreurs typographiques ou de mise en page.

I.2. Le sondage

I.2.1. Définition et notions

Au sens propre, une enquête est une recherche d’informations : Ex. enquêtes policières, journalistiques, parlementaires… Il existe aussi des enquêtes statistiques dont le but est le recueil de renseignement chiffrés et chiffrables. Certaines enquêtes sont exhaustives, ce sont les recensements (par exemple le recensement de la population). 

Le sondage est une technique statistique qui permet de réaliser certaines enquêtes dans des conditions contrôlées, sur des sous-ensembles de la population appelés échantillons, et désignés soit par hasard, soit en fonction de caractéristiques particulières.

C’est une recherche sur un échantillon de sujets qui se déroule dans la vie quotidienne avec des moyens standardisés de questions dont le but est de dégager une mesure quantitative. Les questions sont les mêmes pour tous les sujets. Ceci signifie en fait forcer la réalité, parce que tous ne comprennent les questions de la même façon. C’est ici que se trouve la faiblesse et le risque des méthodes standardisées du sondage.

Le champ de l’enquête est la population (ou l’univers). Par exemple l’ensemble de ménages vivant à Kinshasa ou dans un quartier de Kinshasa ; l’ensemble des individus de 20 à 45 ans, l’ensemble des électeurs …

Les éléments d’ensemble sont des unités d’observation, ou individus.

La base de sondage est la liste des unités, si possible exhaustive et sans double comptes. Une bonne base de sondage couvre au mieux l’univers de référence, elle comporte en outre des informations permettant de contrôler le choix de l’échantillon et la production des résultats.

L’échantillonnage est la sélection des unités.

Les variables d’intérêts constituent l’objet de l’enquête. Elles peuvent être quantitatives (ex. les dépenses) ou qualitatives (ex. une opinion).

Le sondage ne s’intéresse pas aux individus en tant que tels, mais à des caractéristiques d’ensemble, les paramètres à estimer, par exemple une moyenne de revenus, une proportion d’électeurs votant pour tel candidat…

Un échantillon est représentatif s’il permet d’estimer les paramètres étudiés avec une précision acceptable, étant donnés les objectifs de l’enquête.

Il faut savoir que le sondage est une dimension un peu plus restreinte de l’enquête sociologique. La définition courante du sondage est la suivante : le sondage est une enquête menée auprès d’un échantillon de personnes qui sont considérées comme représentatives d’un ensemble social sur lequel on souhaite recueillir des informations ou connaître l’opinion.

On peut également dire que le sondage en sciences humaines est un instrument de recherche, de mesure, de structuration et de présentation de l’information fondée sur l’observation de réponses à un ensemble de questions posées à un échantillon d’une population.

De ces définitions on retient deux choses :

  • le choix de l’échantillon est donc fondamental dans le cas d’un sondage d’opinion
  • le principal objet du sondage est donc d’obtenir des informations permettant de répondre à des questions et de vérifier les hypothèses d’une recherche.

Par ailleurs, il faut savoir que les résultats d’un sondage se traduisent par des chiffres notamment par une série de pourcentages, contrairement à l’enquête pour laquelle l’analyse est plus approfondie.

Tout comme l’enquête, le sondage utilise des techniques quantitatives. Les résultats obtenus auprès de l’échantillon représentatif choisi seront extrapolées à l’ensemble de cette population qu’elle représente.

Il existe différentes catégories de sondages : les sondages ponctuels, de tendance et le panel.

  • Le sondage ponctuel (ou à coupe transversale) est réalisé une fois. Il sert à décrire certaines caractéristiques d’une population.
  • Le sondage de tendance est réalisé à plusieurs reprises. Il permet d’observer dans le temps l’évolution globale de certaines caractéristiques de la population. Il est basé sur la fidélité aux mêmes notions et au même questionnaire.
  • Le sondage panel est administré plusieurs fois au même échantillon d’individus. Il permet d’étudier le changement au niveau individuel, à l’inverse du sondage de tendance qui étudie ce changement global.

Les principaux avantages du sondage sont la flexibilité, la polyvalence, et la rapidité d’utilisation.

Ses principaux dangers sont : le risque de généralisation abusive de ses résultats et le mauvais échantillonnage.

Pour s’assurer la bonne qualité d’un sondage, deux précautions sont à prendre : la méthode de choix de l’échantillon et la taille de celui-ci.

I.2.2. Histoire des sondages

Bref profil historique:

Le premier sondage important semble être "L'enquête ouvrière" de Karl Marx (1880), qui est resté non conclu.

En 1891, Max Weber fait une étude sur les conditions de travail dans le monde rural.

En réalité, le début systématique des sondages remonte à la doit disant « sociologie scientifique »  de  Quetelet et Le Play et aux intérêts du réformisme social » en Angleterre à la fin du XIXème siècle (Booth).

Mais les antécédents les plus proches se trouvent aux Etats Unis dans les années 30 et 40, avec le développement de la recherche du marché, appliquée tout de suite à l’étude des attitudes électoraux.

 Ainsi, Gallup, Crosley, Roper et Lazarsfeld réussissent à prévoir (prédire) le choix du président  Roosevelt (1936) à partir d’un échantillon de 4.000/5.000 sujets.

Par contre la revue "Literary Digest", avec la méthode “Vote de paille”, sur un échantillon de 2.400.000 personnes, se trompa.

Ce succès du premier sondage statistique attira l’attention de la recherche académique universitaire. Et Lazarsfeld fonda dans l’Université de Columbia (USA) le “Bureau of Applied Social Research” à la fin des années 30.

L'Institut de sociologie appliquée fut la première institution de recherche sociale empirique sur la communication et le modèle de toute une génération d’études des médias ».

Le statut des sondages comme discipline scientifique est de reconnaissance récente. Leur émergence dans l’histoire de la statistique a été décrite et analysée dans les travaux de Droesbeke-Fichet-Tassi (1987) et Droesbeke-Tassi (1990). Le besoin d’informations chiffrées remonte à plusieurs millénaires. On trouve les traces de recensements dans la civilisation sumérienne (5000 à 2000 acn), en Mésopotamie, Egypte, Chine, chez les Incas. C’est une manière pour les chefs d’Etat d’évaluer leur puissance : population, potentiel militaire, revenus… En France, des dispositifs généralisés de collecte de statistiques administratives se mettent en place au 13ème siècle.

C’est au 18ème siècle que l’école d’arithmétique politique, fondée par les Anglais John Graunt et William Petty suscite des enquêtes partielles pour évaluer les multiplicateurs. Le multiplicateur de naissance par exemple permet d’estimer la taille d’une population d’après la ratio, supposé constant, entre le nombre de naissances et la population d’une année donnée. En 1895, le norvégien Kiaer présenta à l’Institut international de statistique les fondements méthodologiques des « dénombrements représentatifs ». Les idées de Kiaer seront appuyées par les savants tels que Bowley, Von Borkiewicz, Tchuprow et reçoivent leur consécration en 1925 dans un rapport à l’Institut International des Statistiques (IIS) présenté par le Danois Jensen. Jerzy Neyman (1934 : sondages à deux dégrés), Horvitz et Thompson (1952 : sondages à probabilités inégales), Dalenius (1957 : non-réponses). La pratique des sondages d’opinion naît au 19ème siècle aux Etats Unis avec les « votes de paille » organisés par les journaux Harrisburg Pennsylvanian et Raleigh Star auprès de leurs lecteurs pour prédire les résultats des élections. La méthode des quotas connait son jour de gloire le 3 novembre 1936, jour de l’élection de F.D.Roosevelt, prévue par 3 sondages par quotas réalisés indépendamment par Crossley, Roger et Gallup, alors que le vote de paille du Literary Digest auprès de 10 millions de personnes prédisait la victoire de Landon.

Jean Stoetzel importa la méthode en France et fonda l’IFOP en 1938, premier institut d’étude de l’opinion publique.

Dans le domaine de l’information économique et sociale, l’Institut national de la statistique et des études économiques (INSEE) est créé en 1946, faisant suite à la Statistique générale de la France (où s’illustra Alfred Sauvy) et le Service national de la statistique (créé en 1942 par Réné Carmille, mort en déportation). La tâche de l’INSEE était immense : bâtir le système d’information économique et sociale de la France en reconstruction : population, consommation, appareil productif. L’ampleur de la mission nécessitait le recours aux enquêtes par sondage, et le statisticien Pierre Thionet mit en place le dispositif dont les principes essentiels sont encore en vigueur, au même moment qu’il contribua à la formation des cadres statisticiens. Il écrivit le premier manuel français de sondage en 1946, dès la création de l’INSEE, pour son école d’application, devenue plus tard l’ENSAE.

I.2.3. Populations et échantillons

Nous avons vu qu’une population était un ensemble d’individus, ou unités statistiques.

Un échantillon d’individus est une partie ou un sous ensemble d’une population plus vaste. Les données dont on dispose pour faire une étude proviennent parfois de la population dans son ensemble, mais le plus souvent ces données proviennent d’un échantillon. En règle générale, il est intéressant d’avoir des données les plus exhaustives possibles sur une population. C’est un moyen d’avoir une représentation, un portrait le plus fiable possible de cette population que l’on étudie. C’est le cas pour le dénombrement de la population d’un pays ou d’une région donnée, de ses naissances et de ses décès, de sa répartition suivant l’âge ou le sexe.

Mais il n’est pas toujours nécessaire de procéder au recueil d’information le plus large possible sur une population. C’est le cas du taux d’équipement des ménages, ou de leurs postes de dépenses de consommation. L’interrogation d’un échantillon est largement suffisante.

Quand faut-il interroger toute une population ou plutôt un échantillon ?

C’est l’importance attribuée à l’obtention d’un portrait exhaustif de la population, sa nécessité et sa faisabilité qui vont déterminer si un échantillon est suffisant ou pas ou si l’image complète de la population est nécessaire. (Exemple : construction d’hôpitaux, enquête de satisfaction/image.)

Chacun de ces choix a des avantages et des inconvénients :

  • La population complète : son principal intérêt est son caractère exhaustif et donc la précision de l’information. Son principal défaut c’est son coût et sa lourdeur dans sa gestion administrative, les délais très longs.
  • L'échantillon a pour principal avantage d’être moins coûteux et de donner une image assez fiable grâce aux techniques statistiques de l’ensemble de la population. Son inconvénient majeur c’est que erreur d’échantillonnage remet en question la fiabilité de l’image donnée par l'échantillon. Or il arrive que, malgré une grande rigueur dans la constitution de l’échantillon, celui-ci ne reflète pas la population qu’il est censé représenter. Dans ce cas, on parle de distorsion ou de biais entre l’échantillon et sa population d’origine.

L’exemple le plus connu de l’enquête pour obtenir portrait exhaustif d’une population donnée est le recensement de la population.

L’exemple le plus connu d’enquête sur un échantillon est le sondage d’opinion.

I.2.4.  Comment va-t-on procéder à un échantillonnage ?

Échantillonner, c’est choisir une partie d’une population pour représenter l’ensemble de la population.

Si vous travaillez sur un échantillon, c’est pour chercher une information sur l’ensemble de sa population mère. Les résultats observés sur cet échantillon n’auront de sens que s’ils sont rapportés à toute la population.

On donc a recours à des techniques bien précises pour construire un échantillon et s’assurer qu’il est représentatif de sa population mère.

Il existe deux grandes catégories de méthodes :

  • les méthodes d’échantillonnage non probabilistes (ou empiriques)
  • les méthodes d’échantillonnage probabilistes (ou aléatoires)

Si la population de référence est accessible à partir d’une base de sondage, on utilise des méthodes dites aléatoires (ou probabilistes). Des outils classiques du calcul des probabilités permettent de produire des indications chiffrées sur la précision des résultats. On distingue : le sondage aléatoire simple, le sondage aléatoire stratifié, le sondage par grappes, le sondage à deux degrés.

L’échantillonnage est d’autant plus efficace qu’on sait mobiliser les informations auxiliaires contenues dans la base de sondage pour guider la sélection. S’il n’y a pas de base de sondage, on applique des méthodes dites empiriques ou à choix raisonné. En réalité chaque type d’échantillonnage détermine un type de sondage. Si l’on dispose de données de cadrage de la population, la méthode la plus employée est la méthode des quotas. La qualité d’un échantillon dépend essentiellement de la fiabilité et de la pertinence des données de cadrage.

En sus des limites et des problèmes évoqués précédemment, chaque méthode d'échantillonnage comporte ses propres avantages et inconvénients, et n'est applicable que si certaines conditions précises, variant selon les méthodes, sont réunies. Il convient de peser soigneusement tous ces facteurs et de veiller à ce que les critères d'applicabilité soient bien respectés, faute de quoi les résultats risquent de n'être ni pertinents ni crédibles.

Les méthodes d’échantillonnage empiriques.

  • Elles regroupent les techniques où les éléments de l’échantillon sont choisis sur le terrain en fonction de jugements sur les caractéristiques de la population ou bien en reconstituant le hasard. Elles ne nécessitent pas de base de sondage, elles sont rapides, et pas très chères. Les échantillons obtenus à l’aide de ces méthodes sont les suivants :
  • les échantillons par quotas ou proportionnel
  • les échantillons " accidentels "
  • les échantillons de volontaires
  • Nous reviendrons un peu plus longuement dans quelques instants sur la technique d’échantillonnage par quotas qui est la plus utilisée dans cette catégorie.

Les méthodes d’échantillonnage probabilistes.

Elles regroupent les techniques qui font intervenir le hasard pour désigner les éléments de l’échantillon. Elles nécessitent une base de sondage (liste de tous les individus de la population mère), sont plus coûteuses et longues que les méthodes empiriques. Les échantillons obtenus par ces techniques sont :

  • les échantillons aléatoires simples
  • les échantillons systématiques
  • les échantillons par grappe
  • les échantillons stratifiés (proportionnels ou non proportionnels)

Nous reviendrons dans un moment sur la technique d’échantillonnage aléatoire simple qui est la technique de base , dans cette catégorie.

Je vous propose d’aller à l’essentiel et de voir les échantillons les plus répandus pour chacune de ces grandes catégories. Les échantillons par quotas pour la première et l’échantillon aléatoire simple pour le second.

L’échantillonnage par quotas ou proportionnel 

C’est l’une des techniques les plus simples et les plus répandues. Elle repose sur un principe simple : reproduire le plus fidèlement possible les caractéristiques de la population étudiée grâce à l’application de règles très précises.

Par ce procédé, on va chercher à construire un échantillon qui ressemble à la population mère à partir d’informations statistiques (données de cadrage disponibles) sur la structure de cette population. On réduit ainsi le risque d’avoir un échantillon aberrant. Par ailleurs, cette méthode permet d’obtenir des précisions d’autant plus fines que les critères de quotas sont corrélés à l’objet du sondage (modèle de population.)

Ces données statistiques, sur les principaux caractères de la population visée par l’étude, sont appelées variables contrôlées (sexe, âge, taille de la commune de résidence, la profession du chef de ménage, la profession du répondant, le niveau d’étude etc.)

Le principe sur lequel repose cette méthode est qu’un échantillon identique à la population mère quant à la répartition des variables contrôlées sera peu différent de cette population quant aux autres variables non contrôlées.

Généralement se sont les statistiques produites par Statistique Canada qui sont utilisées pour établir ces quotas. Une fois sur le terrain, l’enquêteur est libre d’interroger qui il veut à condition de respecter ces quotas.

Exemple : s’il y a dans la population 48% d’hommes et 52% de femmes, 25% de jeunes de 25 à 30 ans, etc. L’enquêteur chargé d’enquêter auprès de 100 personnes devra interroger 48 hommes, 52 femmes et 25 personnes de 25 à 30 ans, etc.

Les quotas retenus peuvent être "simples" c’est à dire avec plusieurs séries de distribution qui seront respectées de façon indépendante ou encore croisée en combinant plusieurs caractéristiques.

Revenons à notre exemple si l’on sait que 19% des femmes de la population mère ont entre 25 à 30 ans et 31% des hommes ont de 25 à 30 ans. L’enquêteur devra respecter ces quotas et interroger 10 femmes et 15 hommes ayant de 25 à 30 ans.

Pour assurer une certaine objectivité aux résultats, il faut fixer quelques règles aux enquêteurs comme la gestion rigoureuse des feuilles de quotas, le contrôle strict de la démarche "aléatoire" de l’enquêteur (interdiction d’interroger des personnes qui se connaissent entre elles ou qui connaissent l’enquêteur; l’obligation d’une certaine dispersion géographique avec imposition d’un itinéraire précis à respecter ; ou encore la réalisation des enquêtes à des moments différents.

L’échantillonnage aléatoire simple.

Comme je vous l’ai indiqué précédemment, cette méthode suppose l’établissement d’une base de sondage à partir de laquelle les éléments du sondage seront tirés au hasard.

Le principe de base est le suivant : tous les individus ou éléments constituant la population de base ont la même chance d’être choisis (par exemple : à partir de la liste complète des clients de l'entreprise.)

Il faudra donc, dans un premier temps établir la base de sondage qui est une liste exhaustive des individus de la population. Pour cela, on aura recours à des fichiers existants ou à des registres. Dans tous les cas de figure, il est très important que ces fichiers soient complets, à jour et adaptés à la population sur laquelle on veut enquêter.

A ce sujet, il est parfois tentant de vouloir utiliser des répertoires comme l’annuaire du téléphone ou les listes d’inscription électorale. Mais ce sont souvent de mauvaises bases de sondage. En effet, on évalue en effet à 6% le nombre de personnes qui ne figurent pas dans l’annuaire. Pour ce qui est des listes électorales, elles sont souvent inexactes en raison du nombre des non-inscrits ou des personnes inscrites mais résidant ailleurs ou l’inverse etc.

Une fois la base de sondage établie il existe trois techniques :

- le tirage de jetons numérotés ou de papiers avec le nom de chaque individu dans une urne

- la désignation de façon aléatoire de l’échantillon à l’aide d’un ordinateur

- la sélection de nombre identifiant les individus à l’aide d’une table de nombres aléatoires

Pour une population restreinte, la première technique suffira largement; pour une population de grande dimension, il est préférable d’attribuer un numéro distinct à chaque individu ou élément de la base de sondage. Ceux qui composeront l’échantillon seront sélectionnés à l’aide d’un programme informatique ou d’une table de nombres aléatoires.

L’intervention du hasard n’est pas synonyme d’anarchie. Il obéit tout de même à des règles strictes qu’il faut respecter dans la constitution d’un échantillon. Si on prend le cas de la population québécoise, un échantillonnage probabiliste représentatif nécessite le choix d’environ 1000 sujets.

Aussi, un échantillon construit suivant cette méthode, ne peut être modifié par les enquêteurs en cours d’enquête. En effet, l’enquêteur n’interrogera pas un profil, comme dans l’échantillon par quotas, mais une personne bien précise. Des moyens doivent être prévus pour procéder aux différentes relances nécessaires pour interroger les individus sélectionnés.

En règle générale, ces échantillons portent sur un grand nombre d’individus, environ 1000 ou plus.

Comparaison entre les méthodes par quotas et aléatoire.

Le premier type de méthode d’échantillonnage par quotas est privilégié par les instituts de sondage et de marketing tandis que la seconde (aléatoire) est utilisée par Statistique Canada et les statisticiens professionnels.

Chacune de ces méthodes a ses avantages et ses inconvénients mais les études comparatives entre sondages probabilistes et sondages par quota ont montré l’équivalence des performances des deux méthodes, notamment dans le cadre des sondages électoraux.

Il faut toute fois préciser que l’utilisation de la méthode des quotas (empiriques) pour un échantillon de 3 000 individus et plus donnera des estimations biaisées. Tandis que l’utilisation de la méthode aléatoire donnera des résultats d’une grande imprécision pour des échantillons de moins de 80 individus.

Un autre aspect de la complémentarité de ces deux méthodes c’est la combinaison de ces deux méthodes pour la construction d’échantillons complexes.

En conclusion, sur ces techniques d’échantillonnage, il faut retenir que l’utilisation de ces techniques va vous permettre de reproduire fidèlement la population totale que vous étudiez et, de ce fait, vous garantir la représentativité de votre échantillon. Mais il faut savoir qu’en matière de sondage il n’existe pas de certitude, même si l’échantillon a été obtenu par utilisation d’une méthode rigoureuse. Les pourcentages obtenus, résultats du sondage, ont donc toujours une marge d’erreur liée au fait qu’on interroge une fraction de la population.

I.2.5.  Les étapes d’une enquête par sondage

  1. Conception générale de l’enquête : Cette étape comprend la définition des objectifs de l’enquête, de la population étudiée, des informations que l’on souhaite obtenir, avec quelle périodicité, à quel niveau de finesse… Ici il faut s’assurer que les informations recherchées n’existent pas ailleurs (données dites secondaires). En fonction de ce qui précède, on définit une technique de recueil des informations (par téléphone, par voie postale, par internet, par enquêteur à domicile) et simultanément une méthode d’échantillonnage. On détermine aussi la taille de l’échantillon nécessaire, compte tenu du budget disponible et éventuellement de la précision souhaitée.
  2. La rédaction du questionnaire : - Première rédaction du questionnaire (si possible en utilisant les résultats d’études exploratoires ou qualitatives préalables) ; - Pré test du questionnaire ; - rédaction définitive incluant le pré codage du questionnaire pour faciliter la saisie informatique.
  3. Administration du questionnaire : - Le terrain : Commence avec la phase de collecte des informations auprès des interviewés, qui commence par une réunion d’information des enquêteurs (appelé aussi briefing) afin de leur transmettre les consignes d’échantillonnage et de passation du questionnaire ; Il s’en suit l’administration des questionnaires sur le terrain et, enfin par le contrôle de la qualité du travail des enquêteurs.
  4. Traitement et analyse des données : Vérification, codage et saisie informatique des questionnaires, puis traitement informatique, généralement par des logiciels spécialisés de traitement d’enquêtes. Les résultats de ces traitements sont alors synthétisés dans un rapport final.

L’importance et la complexité de ces différentes phases varient beaucoup d’une enquête à l’autre.

LIRE TOUT LE COURS (OU TELECHARGER LE PDF)Prof. Dr. Sisi Kayan Cours de Théorie et Techniques de sondageProf. Dr. Sisi Kayan Cours de Théorie et Techniques de sondage (786.12 Ko)

Date de dernière mise à jour : 14/09/2022