Categorias
Docendo Discimus

A teoria económica da má estatística e das interpretações arbritrárias

Por Hugo Pinto de Abreu

O Gustavo [1, 2, 3, 4, 5, 6] trouxe-nos recentemente dois exemplos [7, 8] de como dados estatísticos são interpretados arbitrariamente para justificar determinadas posições politico-ideológicas, quando os mesmos dados justificariam interpretações diversas, até mesmo diametralmente opostas. Os exemplos do Gustavo realçam algo que eu vejo acontecer — com preocupação — na investigação económica (e que o Gustavo parece ver na investigação médica [9]): retirar-se conclusões de fundo e mesmo esboçar-se políticas públicas com base em análise estatística à qual não subjaz qualquer orientação robusta e estruturada, a nível da teoria económica. E, pior ainda, com base em análise estatística que é, ela mesma, realizada de forma duvidosa, ou mesmo errada.

De facto, o que se escreveu sobre a razão de tanta literatura médica estar errada [9] aplica-se, mutatis mutandi, à literatura económica. Há demasiados artigos científicos — em jornais com arbitragem! — cuja metodologia consiste mais ou menos nisto: pegar no maior número possível de variáveis (económicas, comerciais, sociais, jurídicas, políticas, etc.), meter tudo numa regressão econométrica [10] — se possível, complementar com um ou outro teste para dar «maior credibilidade»; por exemplo uma análise de componentes principais [11] — e ver no que dá! Enfim, uma espécie de cozinha experimental, na qual se mete tudo na panela e se reza para que saia algo comestível. Consequência: os resultados podem ser totalmente desprovidos de sentido e as conclusões que se retiram a respeito do impacto das variáveis independentes (explicativas) podem estar determinadas muito mais por terceiros factores e por efeitos cruzados (totalmente determinados pela presença ou ausência doutras variáveis explicativas), do que por qualquer efeito real que as variáveis independentes efectivamente tenham.

Da mesma forma, vejo sempre com gigantesca apreensão a utilização duma estrutura de secções cruzadas quando a análise exigiria claramente séries temporais ou dados em painel, especialmente em estudos macroeconómicos. Por exemplo, por vezes juntam-se dados de n países ao longo de vinte, trinta ou cinquenta anos: se esta informação for tratada em secções cruzadas, sem qualquer cuidado adicional, os dados serão tratados como se fossem não de n países ao longo de x anos, mas de «n vezes x» países, sem perspectiva temporal. O problema? Podem ser idiossincrasias de cada país, relacionadas com terceiros factores, a determinar o resultado. Se o modelo não for «informado» disto, em vez de reconhecer a mesma idiossincrasia em x ocasiões, fica a supor que x países têm a mesma idiossincrasia.

Tudo isto pode causar — e causa frequentemente — resultados contraditórios de estudo para estudo. Não há qualquer problema em chegar a resultados contraditórios, mas as contradições devem ser, sempre que possível, abordadas no próprio estudo, idealmente tendo em conta a teoria económica, e fazendo um esforço sério — e não meramente cosmético — para explicar as divergências face aos resultados esperados ou apontados pela teoria. Quando isso não acontece, a «teoria económica» que nos guia é a da má estatística e das interpretações arbitrárias.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *