Español English French Kwéyol

Sondages sur les intentions de vote de la population en âge de voter en Haïti : Une lecture technique et politique

Par Claude Joseph*

Soumis à AlterPresse le 16 octobre 2015

Si en général les sondages ont toujours existé en Haïti, les enquêtes sur les intentions de vote sont cependant trois fois plus jeunes que nos 30 années de boiteuses expériences démocratiques débutant avec la chute de la dictature duvaliériste. De 1957 à 1986, sonder les intentions de vote en Haïti était impossible dans la mesure où le régime d’alors était une monocratie de type autocratique. Avant 1957, les suffrages universels n’existaient pas. L’occupation Américaine qui mettait une fin aux régimes pronunciamientos, n’a institué ni un « suffrage parlementaire », ni un suffrage universel, car c’est un conseil d’état qui remplaçait le parlement durant toute l’occupation. Quoiqu’une forme de suffrage universel fut adoptée dans la constitution de 1935 (art. 38), elle s’est vitement dissipée dans les amendements de 1939 (art. 39). Après la chute d’Elie Lescot, Dumarsais Estimé, l’un des instigateurs de la charte de 1935 créant une « monarchie présidentielle absolue » [1], fut élu par un parlement au prix des subterfuges et des manœuvres anticonstitutionnelles les plus inimaginables. Et enfin, l’accouchement aux forceps du suffrage universel de 1957, consacrant la victoire du docteur François Duvalier avec 700 000 votes, allait mourir asphyxié dans la dictature. Ainsi, l’environnement politique qui prévalait en Haïti était historiquement incompatible à toutes tentatives d’estimer les intentions de vote de la population.

Depuis tantôt 10 ans, une firme haïtienne dénommée Bureau de recherche en informatique et en développement économique et social (Brides) a initié la pratique de sonder les intentions de vote de la population pendant les périodes électorales. Les résultats de ces sondages sont toujours contestés par certains acteurs politiques mettant en doute la crédibilité morale même de l’institution. D’un autre coté, les indécis et ceux qui ont de l’aversion pour les perdants profitent des résultats pour s’aligner aux gagnants. Mais rarement, pour ne pas dire jamais, une critique est produite sur la méthodologie qui accouche ces résultats qui vont être soit rejetés d’un revers de main par certains, soit acceptés aveuglément par d’autres. C’est évidemment dans la perspective de pallier à ce déficit que cet article est rédigé.

Pourquoi un sondage ?

D’abord, un sondage est une technique permettant d’utiliser un sous-ensemble, un échantillon, tiré d’un ensemble appelé population afin de généraliser sur le comportement de la population. En d’autres termes, un sondage permet d’inférer les paramètres d’une population (μ, σ, π) à partir des caractéristiques d’un échantillon appelées statistiques (x-bar, s, p). Les sondages sont réalisés parce qu’en général ils sont moins couteux, et dans certains cas, recenser toute une population est pratiquement impossible. Cependant, si l’objectif principal du sondage est de faire des inférences à partir d’un échantillon à une population, la précision et la validité de cette inférence ne résident que dans la représentativité de l’échantillon choisi. Un échantillon est représentatif d’une population, lorsque son choix est basé sur les postulats de la théorie des probabilités. En dehors de ces théories, particulièrement le théorème central limite de La Place, les statistiques provenant de l’échantillon ne peuvent pas être utilisées pour estimer les paramètres de la population. En fait, on distingue deux principaux types d’échantillons probabilistes (les restes étant des combinaisons de ces deux méthodes) : 1) un échantillon issue d’un tirage aléatoire simple où il y a une équiprobabilité pour chaque membre de la population d’être sélectionné, et 2) un échantillon d’un tirage aléatoire systématique où seulement la première unité est tirée aléatoirement et ensuite les autres sont choisies à un intervalle prédéterminé. D’autres modes d’échantillonnages, comme les méthodes à plusieurs phases et plusieurs degrés, peuvent combiner le tirage simple, le tirage systématique et la stratification. Dans le cas des sondages du Brides, on verra que la technique utilisée est une combinaison de méthodes appelée méthode à deux degrés, mais qui pourtant n’offre aucune information en ce qui attrait au mode de tirage utilisé pour sélectionner les unités á chaque étape.

Il est important de noter que la représentativité d’un échantillon ne dépend pas forcement de sa taille. Certains croient que plus la taille d’un échantillon est grande, plus l’échantillon est représentatif. Toutes choses étant égales par ailleurs, certainement un échantillon de taille 100 est plus représentatif qu’un échantillon de taille 30. Cependant, un échantillon de taille d’un million où les individus ne sont pas choisis aléatoirement avec une probabilité connue (non nulle) est moins représentatif qu’un échantillon de 500 individus choisis aléatoirement. Ce, pour dire que ce qui importe vraiment dan le choix de la taille c’est le facteur aléatoire. Statistiquement, pour les sondages estimant les proportions comme les intentions de vote, la taille de l’échantillon est fonction de deux principaux facteurs : 1) le seuil de confiance, le critère adopté (généralement 95%) quant à la certitude sur la validité des résultats [2], et 2) la marge d’erreur souhaitée. Ceci permet de clarifier une question fondamentale pour des amis qui, après la publication des résultats du Brides, m’ont appelé pour me dire qu’il y a une autre enquête d’un échantillon de plus grande taille qui donne des résultats différents. La taille d’échantillonnage de la dernière enquête du Brides est 11900, cela ne veut pas dire que ses résultats seront plus fiables qu’un sondage qui se porterait sur un échantillon de 1000 si les principes des probabilités ne sont pas respectés dans la méthodologie du Brides. Egalement, une autre enquête sur un échantillon d’une taille supérieure à celui du Brides ne serait pas plus crédible pour les mêmes raisons mentionnées.

On ne peut pas non plus obtenir un échantillon représentatif d’une population si cette dernière n’est pas organisée d’une façon à faciliter une bonne sélection des unités d’échantillonnages. En d’autres termes, la base d’échantillonnage (ou base de sondage), la liste comportant tous les éléments de la population, doit être clairement définie pour que la représentativité de l’échantillon ne laisse pas beaucoup à désirer. Pour être plus concret, en Haïti, la base d’échantillonnage est composée de 11967 sections d’énumération (SDE) et chaque SDE comprend en moyenne 200 ménages. La base de sondage dans laquelle le Brides sélectionne son échantillon pour ses deux dernières enquêtes est-elle à jour ? Pour saisir l’importance de cette question se portant sur la qualité de la base d’échantillonnage, imaginer une situation où un échantillon d’étudiants est sélectionné dans une liste comportant tous les étudiants d’une université donnée afin d’obtenir leurs intentions de vote, si la majorité des étudiants choisis ne peuvent pas être interviewés parce qu’ils ont abandonné ou sont déjà gradués, et si ceux qui ont abandonné ont un profil typé différent des autres répondant à l’enquête, les résultats de ce sondage reflèteront difficilement les opinions de la population estudiantine de cette université. Si la base de sondage était à jour, elle ne comporterait pas les étudiants ayant abandonné et déjà gradués.

La question sur la qualité de la base de sondage du Brides est importante quand on sait que les SDE ont été délimités depuis 2001, dans le cadre du recensement de la population de l’IHIS. Par exemple, pour l’enquête sur l’emploi et l’économie informelle (EEEI) réalisée par l’IHSI dont la collecte des données s’est déroulée entre octobre et novembre 2007, la base de sondage retenue est l’Echantillon-Maitre d’Enquêtes Multiples auprès des Ménages (EMEM-I) révisé à partir des données cartographiques de 2002 [3]. Tandis que pour l’enquête sur les conditions de vie des ménages après le séisme (ECVMAS) en 2012, l’IHSI a du effectuer des travaux cartographiques préparatoires pour mettre à jour la base de sondage surement affectée par le séisme de 2010. Dans le rapport de sondage du Brides, la question de l’actualisation de la base de sondage n’est mentionnée nulle part. Il est important de savoir si le Brides s’est servi des récents travaux de l’IHSI dans le cadre du ECVMAS 2012.

Il faut tout au moins souligner qu’une analyse de la méthodologie des deux dernières enquêtes du Brides est une tâche non moins difficile dans la mesure où sur environ 180 (la première 176 pages, la deuxième 134 pages), la méthodologie est présentée en moins de quatre paragraphes occupant seulement une page. La méthodologie fait un survol non saisissable du mode de sélection de l’échantillon. D’après le rapport, « Le choix de ces personnes a été réalisé selon un tirage à deux degrés dont le premier a été la sélection des grappes de ménages ou sections d’énumération (SDE) et au deuxième degré les ménages ont été choisis au sein des SDE à raison de 25 par SDE » [4]. Ceci ne permet pas de comprendre comment d’abord les SDE sont sélectionnés : est-ce un tirage aléatoire simple, où chaque SDE a la même probabilité d’être choisie ? Ou un tirage aléatoire systématique, où seulement la première SDE est tirée au hasard et les autres selon un intervalle prédéterminé ? Ensuite, quel type de tirage permettant de choisir les ménages à l’intérieur des SDE ? Ces questions sont sans réponses dans la méthodologie. Ce qui est, peut être, clair c’est qu’après avoir sélectionné les ménages, le Brides utilise une grille, dénommée grille de Kish, pour sélectionner un individu aléatoirement au sein du ménage. Cependant, l’inconvénient de cette méthode c’est qu’elle requiert à l’agent enquêteur de demander l’âge des personnes faisant partie du ménage pour faire la sélection. Etant donné qu’une telle demande est souvent perçue comme une intrusion, elle peut causer une résistance à la collaboration. En outre, on se demande pourquoi un échantillon de 11900 ménages aboutit à 11997 interviewés ? D’où viennent ces 97 personnes ? Est-ce possible que dans certains ménages deux individus sont sélectionnés ? Si oui, n’est-ce pas une violation de la méthode de Kish ?

Généralement, les gens collaborent difficilement aux enquêtes se portant sur leurs intentions de vote. Ajouté à cela, demander à quelqu’un son âge constitue une plus grande entrave à sa collaboration, ce qui augmenterait le taux de non-réponse. Dans le cas du Brides, l’effectif des indécis et de non réponse pour la présidence s’élève à 1589 individus représentant un total de 13.2%. Cela ne doit pas passer comme une lettre à la poste quand on sait que les indécis et ceux qui refusent de répondre pourraient avoir un profil typé. Et s’ils sont différents de ceux qui collaborent, la fiabilité des résultats est questionnable. Particulièrement, il serait intéressant de savoir la constitution du taux de non réponse dans le sondage du Brides. Les non réponses peuvent résulter du refus du ménage, dans lequel cas c’est la personne qui ouvre la porte qui refuse que l’agent ait accès au ménage. Elles peuvent aussi être dues au refus de la personne sélectionnée où c’est la personne même qui refuse de répondre. En dernier lieu, les non réponses peuvent être causées par une absence prolongée de la personne choisie. Dans tous ces cas, si les personnes refusant de répondre, ou impossible d’être rejointes, ont des opinions différentes des autres acceptant de répondre ou rejointes, le bais de non réponse entravera l’inférence statistique en ce sens qu’on ne peut pas conclure que ce qui est observé dans l’échantillon est le reflet de la population.

Tout ceci pour dire que l’enquête du Brides doit être analysée au peigne fin vu que la méthodologie offre peu de possibilités de juger de la fiabilité de ses résultats. Dans un prochain article, je montrerai comment les résultats définitifs d’une élection peuvent correspondre aux résultats d’un sondage ne respectant même pas les règles de probabilité, donc un faux sondage. J’analyserai dans ce cas la politique des sondages politiques. Je montrerai que les indécis et ceux qui ont de l’aversion pour les perdants ont tendance à voter le candidat en tête des sondages. Les groupes d’intérêts économiques, animé du souci de faire des profits, ont également tendance à investir là où la probabilité de gagner parait plus certaine. Donc, souvent quand les résultats des élections coïncident avec les résultats d’une enquête, cela ne constitue pas une indication d’un bon sondage. Ces aspects toxiques des sondages poussent certaines démocraties à régulariser les enquêtes sur les intentions de vote.

........

* Adjunct professor of Statistics and Research methods
Fordham University and Lehman College

Contact : Cjoseph20@fordham.edu


[1Moise Claude, Constitutions et lutes de pouvoir en Haïti : La solution Américaine 1915-1946, tome II. Editions de l’Université d’Etat d’Haïti.

[2Si on prend plusieurs échantillons d’une même population, 95 fois sur 100, cet échantillon constituera une fidèle représentation de la population.

[3IHSI, Enquêtes sur l’emploi et l’économie informelle, Juillet 2010

[4Sondages du Brides du 5 au 11 octobre 2015, p. 3