top of page
Torre de comunicação

Flutuações estatísticas

Muitas vezes, as notícias dizem que “algo aumentou 3%” ou “número de qualquer coisa baixou 126”, etc. Apesar de parecer, e de poder ser, uma maneira muito objetiva de apresentar algo, também pode ser um método falacioso de levar alguém a crer numa mudança, numa evolução num dado fenómeno, que pode, na verdade, não significar nada. Mas porquê? Falar da evolução duma quantidade não é algo exato, objetivo?

A resposta é que sim, mas na verdade nem sempre. Ou seja: dizer que alguém tem mais 26 batatas hoje que ontem, na realidade, diz muito pouco. Interessa muito saber o número total de batatas que teve ou tem. Isto é; se ontem tinha 10 batatas e hoje tem 36, houve um aumento grande: agora tem mais do triplo do que tinha antes! Mas se se trata do dono de uma empresa que explora hectares e hectares de batatal, e num dia tinha 3000, e no dia seguinte 3026… a diferença foi pequena, foi de menos de 1%! Dizer que há sequer um aumento, apesar de não ser falso, é um pouco desnecessário… na prática, o número de batatas neste caso manteve-se praticamente constante; a variação não foi significativa.


 

Mais sobre flutuações estatísticas:

Regra geral, para não acreditarmos que algo mudou sem que na verdade tenha mudado significativamente, basta saber qual a quantidade total, e qual a variação. “A quantidade qualquer coisa era [], e aumentou em []”. Mas, às vezes, também importa saber o que é ser significativo: para uma dada grandeza, um aumento de, por exemplo, 3% pode ser algo importante: tome-se como exemplo uma taxa de inflação. Para outras grandezas, seria uma variação desprezável. Mas então, como saber?

Se repetirmos muitas vezes a mesma experiência, nas mesmas condições, e estivermos à espera de obter valores próximos dum dado resultado, chamemos-lhe μ, podemos, e provavelmente iremos não encontrar sempre o valor μ. Repetindo muitas vezes a experiência, a teoria estatística diz-nos que há uma flutuação característica, a que se chama σ, dentro da qual 2 em cada 3 medições irão cair. Ou seja, eu dizer que tal grandeza era μ ou que estava acima de μ por mais qualquer coisa inferior a σ significa praticamente o mesmo. Mas sabemos ainda mais do que isto. Sabendo esse valor de flutuação σ, também se pode dizer que mais de 99% das medições vão estar entre μ-3σ e μ+3σ.


 

Exemplo:

É mais fácil entender com um exemplo. Pensemos numa quantidade X qualquer que se divulga mensalmente. Mesmo que não se saibam exatamente os valores médio μ e a flutuação característica σ (cujo nome científico é desvio padrão), estes podem ser conhecidos aproximadamente.

Assuma-se μ=300 e σ=10. Mesmo que nada aconteça dum mês para o outro, que influencie o valor desta quantidade, X pode ter o valor 304 em abril e 291 em maio. Um político que tenha tomado alguma medida para diminuir esta quantidade (por exemplo, se estivermos a falar de desemprego, ou poluição, etc) pode dizer orgulhosamente que X diminuiu 4.3%. Não é uma mentira!, mas também não é muito honesto. Na verdade, a quantidade X pode ter diminuído de forma aleatória, sem ter nada a ver com a medida política tomada. Pelo descrito anteriormente, mais de 99% das medições de X que sigam a distribuição prevista vão estar entre 270 e 330 (como se vê no gráfico abaixo), mesmo sem se mudar nada que influencie X. Quaisquer valores entre esses 2 são praticamente equivalentes entre si. Mas, pelo contrário, imaginemos que a quantidade X era 304 em abril e 262 em maio. Agora a variação foi de 13.8%, mas não é isso que interessa verdadeiramente. O que interessa é que estes valores não seguem os dois a mesma distribuição, com μ=300 e σ=10. De facto, o valor de maio está 3.8σ abaixo do valor esperado de 300. Ora agora sim, pode atribuir-se esta diferença a algum fator não aleatório: quem sabe uma medida política, ou um aumento do emprego sazonal (se X medir o desemprego), ou a moda de utilizar bicicletas elétricas na cidade (se X medir poluição do ar), etc.

A distribuição descrita acima, para a qual há um valor esperado μ, e um parâmetro de desvio σ, chama-se distribuição normal, ou gaussiana. É um dos comportamentos mais típicos de variáveis aleatórias.




 

54 visualizações0 comentário
Post: Blog2_Post
bottom of page