Como predizer sem saber e... Acertar!

Hoje quero comentar sobre uma curiosidade estatística que pode ser muito útil para qualquer pessoa que tenha que fazer uma predição quantitativa. A situação típica poderia ser a seguinte: suponhamos que queremos estimar as vendas que teremos em nossa empresa este mês; concretamente, o número de unidades que serão vendidas entre os dias 1 e 31 do mês. E suponhamos que para fazer esta estimação contamos unicamente com dois especialistas; de um lado um companheiro do departamento financeiro, especializado em controlling financeiro, que diz que serão 100 unidades. Do outro lado, um segundo especialista, neste caso um estatístico externo especializado, que conclui que venderemos 200 unidades. Não há mais dados. O que fazer? Em quem acreditar? No controller interno ou no estatístico externo? Suponhamos que a realidade finalmente resulta ser X (não diremos o total no momento). É fácil calcular o erro da predição: se escolhemos 100, o erro de predição será o valor absoluto da subtração 100-X. Em caso de escolhermos 200, a diferença – ou erro – será o valor absoluto de 200-X. Claro... O problema é que não conhecemos X, assim que não parece possível saber com certeza qual dos especialistas está com a razão. Temos informação a priori sobre quem poderia estar mais certo? Parece que não. Podemos acreditar que temos razões para escolher um ou outro (aposto que o leitor já tem a essa altura uma “aposta pessoal” sobre qual especialista é melhor), mas o certo é que não temos nenhum dado neste problema que nos permita optar por algum deles – acreditar no contrário é um “defeito de fabricação” que nós temos!

Vejamos as conseqüências deste “defeito humano”. Como não há razões sólidas para escolher um ou outro, podemos supor que a metade das pessoas escolherá a um e a outra metade ao outro. Então, o erro médio que cometemos se escolhemos na sorte um dos especialistas será: Erro1 = 0,5x[100-X]+0,5x[200-X]=([100-X]+[200-X])/2 (utilizo os colchetes para indicar “valor absoluto”).

E aqui é onde queria chegar. A pergunta óbvia é: podemos melhorar este erro esperado? À primeira vista parece que não, mas devemos parar e analisar. De fato, a primeira alternativa em que pensamos quando estamos em situações parecidas é utilizar o promédio entre as duas predições, neste caso (100+200)/2. A intuição que temos, no entanto, é que o erro esperado de predição deste promédio é o mesmo que teríamos escolhendo um especialista na sorte, como no parágrafo anterior. Mas... É assim? Calculemos: Erro2=[(100+200)/2-X]=[(100+200)/2-2X/2] =([100-X+200-X])/2.

Para comparar parece claro que queremos ver qual dos erros esperados é menor. Basicamente devemos comparar [100-X]+[200-X] com [100-X+200-X]. Não há dúvidas de que o segundo é sempre (!) menor ou igual ao primeiro, independente do valor de X. Na verdade, podemos comprovar que sempre que X seja um valor entre 100 e 200, Erro2<Erro1; e quando X seja um valor fora do intervalo entre as duas predições, então Erro2=Erro1. Sendo assim, em um problema desta natureza, utilizar a média das predições nem sempre é benéfico.

O princípio que acabo de expor se chama “averaging principle”, e é conhecido ao menos desde Kelley, 1925. No entanto, é muito pouco intuitivo para quem o pensa pela primeira vez. Isso explica as fortes reticências que muitos investigadores têm no momento de combinar metodologias, apesar de que em realidade promediar resultados de estudos em que se utilizam diferentes metodologias seguramente é muito interessante. Claro, promediar é melhor a não ser quando o investigador tenha fortes indícios de que um dos estimadores individuais é um melhor “especialista”. Em geral, no entanto, é muito mais rentável ser humilde, combinar e promediar. Isso é o que faz, por exemplo, www.pollyvote.com, que conseguiu prognosticar com muita precisão o resultado das últimas eleições norte americanas, combinando quatro fontes de dados com metodologias completamente diferentes; e o fez aplicando nem mais nem menos que o “averaging principle”.

(texto de German Loewe – tradução Anna Laura Rezende)

Suscríbete a nuestro blog y recibe las últimas novedades aquí o en tu email.