Luís Aguiar-Conraria - OBSERVADOR
Como é possível que a dispersão nas
sondagens reais seja muito inferior às das minhas sondagens simuladas, feitas
em condições estatisticamente ideais? É uma questão interessante que fica por
decifrar.
Sempre que sai uma nova sondagem, temos
títulos bastante incisivos nos jornais. Em Março, o Expresso, apoiado na
Eurosondagem, anunciava: “Três meses depois, o PS descola do PSD”. Já em Abril
mudou de título: “Sondagem: PS desce mas Costa sobe. E muito”. Ao contrário, na
semana anterior, apoiado na Aximage, o Correio da Manhã anunciava: “PS
ultrapassa PSD nas intenções de voto”.~
No gráfico em baixo, podemos ver as
estimativas de voto no Partido Socialista de acordo com as sondagens da Aximage
e da Eurosondagem publicadas este ano. Os primeiros quatro losangos são da
Eurosondagem e os restantes são da Aximage. A linha preta dá-nos a média
simples das oito sondagens (34,5%).
Eu não sei exactamente como é que quem me
lê interpreta este gráfico. Talvez repare que sempre que o PS sobe na
Eurosondagem então desce na Aximage. O que me surpreende a mim é a estabilidade
das intenções de voto. Todas as sondagens estão a menos de um 1,2 pontos
percentuais da média. A diferença entre a mais favorável (35,6%) e a menos
favorável (33,3%) ao PS é de apenas 2,3 pontos percentuais. Confesso, aliás,
que me parecem tão estáveis que quaisquer títulos a falar em subidas ou
descidas são ridículos.
Tanto assim é, que me lembrei de fazer um
exercício simples. Fazer oito sondagens diferentes à mesma realidade. Uma forma
de o fazer seria encomendar 8 sondagens feitas simultaneamente. O problema é que
tal não só seria demasiado caro como, ainda por cima, teria dificuldade em
controlar a qualidade do trabalho. Felizmente há uma alternativa que é perfeita
e é gratuita: usar o Excel para simular sondagens.
Tomo como ponto de partida os 34,5% de
média das intenções de voto. De seguida, pergunto a 800 células do Excel se
votam ou não no PS e dou-lhes instruções para responder ‘Sim’ com uma
probabilidade de 34,5% e ‘Não’ com uma probabilidade de 65,5% [i]. No fim,
basta-me calcular a percentagem de células que respondeu sim. Isto equivale a
oito sondagens, feitas em condições tecnicamente ideais, com oito amostras de
800 eleitores.
Os resultados, que obtive na primeira
simulação em que a média deu os mesmos 34,5%, estão ilustrados na figura em
baixo. Variações de 3 ou 4 pontos percentuais são perfeitamente normais e a
diferença entre a sondagem mais favorável e a menos favorável é superior a 5
pontos percentuais. Estas variações são obtidas a partir de uma população que
tem sempre o mesmo valor para o PS: 34,5%. Ou seja, resultam apenas do erro
amostral, não há qualquer mudança nas intenções de voto. Repare-se que, como
tenho controlo absoluto sobre estas sondagens, posso afirmar o que estou a
afirmar com total certeza: não existe qualquer outra fonte de erro.
Daqui retiram-se conclusões muito
interessantes. Por exemplo, se amanhã sair uma sondagem que dá ao PS uma subida
de 2, 3 ou até 4 pontos percentuais será abusivo retirar grandes ilações sobre
isso. São perfeitamente compatíveis com não ter havido nenhuma alteração nas
intenções de voto. Ou seja, 99% dos comentários a essas notícias serão bastante
tolos. Mais grave, andar a fazer títulos de jornal com variações de décimas é,
simplesmente, estúpido.
Fica, no entanto, outra questão
interessante por decifrar. Como é possível que a dispersão nas sondagens reais
seja muito inferior às das minhas sondagens simuladas, feitas em condições
estatisticamente ideais?
Uma explicação possível teria a ver com o
tamanho da amostra. É sabido que quanto maior a amostra menor a dispersão
esperada. Como expliquei, nas minhas simulações, considerei uma amostra de 800
observações. Ora a Aximage declara na sua ficha técnica que entrevistou cerca
de 600 pessoas, ou seja menos do que a minha amostra [ii]. Já a Eurosondagem tem
amostras de 1000 pessoas. Mas cerca de 20% dessas pessoas diz que “não sabe” ou
“não responde”, pelo que a amostra relevante se reduz para cerca de 800
entrevistados. Assim, esta explicação não colhe.
Sobram então duas hipóteses. Uma é que se
trata de um acaso. É possível que, por mera coincidência, estas 8 sondagens
tenham dado resultados tão parecidos. Como as coincidências não duram para
sempre, já sabem, se, numa próxima sondagem, o PS aparecer com 37% ou com 31%
não retirem grandes ilações desse facto.
A outra hipótese é, naturalmente, que
estas empresas tenham técnicas de amostragem fabulosas que lhes permitem evitar
o erro amostral. Graças a essas técnicas, que desconheço, conseguem obter os
mesmos resultados que seriam de esperar com amostras bastante maiores,
reduzindo assim bastante os seus custos. Esta é a minha hipótese preferida:
como economista, gosto sempre que as empresas sejam eficientes. Para estimar
essa eficiência, fiz milhares de simulações, tendo concluído que para eu
conseguir consistentemente resultados tão estáveis como os da Aximage e os da
Eurosondagem combinados, precisaria de considerar amostras com mais de 2500
observações (ou seja, cerca de três vezes maiores do que as da Eurosondagem e
quatro vezes maiores do que as da Aximage). Naturalmente, não é de esperar que
os responsáveis das sondagens em Portugal divulguem publicamente tão fabulosas
técnicas de amostragem. Afinal, o segredo é a alma do negócio. Mas não posso
deixar de lhes endereçar os meus sinceros parabéns.
[i] Tecnicamente, o que fiz foi gerar 800
observações a partir de uma distribuição de Bernoulli com parâmetro 0,345. O
leitor com alguns rudimentos de estatística pode experimentar em casa. Para o
efeito, a distribuição de Bernoulli ou a Binomial são as ideais.
[ii] Na verdade ao ler a ficha técnica da
Aximage, fiquei na dúvida se os 600 entrevistados são obtidos antes ou depois
de serem excluídas as pessoas que declararam abster-se (cerca de 33%).
Portanto, não é claro se deva considerar uma amostra de 600 pessoas ou de 400.
Talvez os responsáveis da Aximage queiram melhorar a qualidade da informação
que prestam nas suas fichas técnicas.
Sem comentários:
Enviar um comentário