April 30, 2020 | Carlos Ochoa

Uma amostra contra o Covid-19

Quantas pessoas foram realmente infectadas pelo Covid-19? Nas últimas semanas assistimos a um incrível baile de números. Surpreendente pela simplicidade da pergunta e pela dificuldade de se obter uma resposta.

Na era da informação, em um momento da história humana em que temos mais meios de diagnóstico e mais fontes de dados, estamos deixando de responder a esta questão simples, mas de suma importância, como veremos um pouco mais adiante. Felizmente, podemos dar uma resposta usando um método que dura toda a vida: amostragem.

Uma amostra contra o Covid-19

 

Dados oficiais são irrealistas

Diferentes governos relataram números de pessoas infectadas desde o início da crise. Entretanto, logo ficou evidente que estes números foram claramente distorcidos para baixo, por diferentes razões:

1. Existem pacientes assintomáticos: não apresentam sintomas, mas estão ou foram infectados. Se não houver sintomas, nenhum exame é feito.

2. A incapacidade de fazer testes diagnósticos suficientes. Enquanto países como a Alemanha têm sido capazes de realizar um grande número de testes, outros países como a Espanha ou a Itália não têm sido capazes de realizar tantos testes quanto gostariam. Isso levou à recomendação de que pacientes com sintomas ficassem confinados em suas casas em caso de suspeita, sem saber se foram infectados.

A principal evidência de que o número oficial de pessoas infectadas está incorreto é a desproporção entre infectados e mortos. Tomando o exemplo da Espanha, em 20 de abril foi reportado 200.210 pessoas infectadas e 20.852 morreram, ou 10,4%. Sabe-se que o Covid-19 não tem uma taxa de mortalidade tão alta, o que só pode significar que o número de infectados é muito maior do que o relatado.

 

Estimativas Estatísticas

Várias pessoas que, usando modelos estatísticos, tentaram estimar o número real de pessoas infectadas e nos alertar sobre a situação que estava por vir.

Já no dia 10 de março, autores como Tomás Pueyo alertaram os governantes do mundo sobre a gravidade da situação. Simplesmente revisando (1) os dados existentes, (2) a experiência dos países que na época estavam sendo mais afetados (China, Coréia do Sul, Itália e Irã) e (3) conhecendo o crescimento exponencial que as infecções virais geralmente têm, Pueyo desenhou o quadro assustador que nos esperava, especialmente se os governos não tomassem medidas de isolamento.

Outros autores, como o nosso ex-parceiro da Netquest Carlos Bort, ousaram fazer estimativas, afirmando que o número real de pessoas infectadas no dia 17 de Março em Madrid (Espanha) poderia ser até 100 vezes o número relatado. Estas estimativas são feitas pela modelagem dos diferentes estados por onde passam os infectados (contagioso, incubado, sintomático ou assintomático, curado ou falecido...) e o período médio de tempo que ocorre em cada estado.

Bort, em seu artigo, fez uma estimativa com base no número oficial de infectados e outra com base no número de mortes. A primeira estimativa tinha a grande desvantagem da falta de confiabilidade dos dados oficiais, o que enfraqueceu a análise. Por outro lado, a estimativa do número de óbitos foi baseada em dados muito mais confiáveis. Infelizmente, descobrimos mais tarde que nem mesmo o número de mortes era confiável, pois durante muitas semanas as mortes por Covid-19 não foram devidamente contabilizadas, especialmente em lares de idosos.

netquest-numero-contagios-ccaa-madrid-PT-01-01

O Imperial College de Londres, a partir de 31 de março, aprofundou a hipótese de que o nível de contágio era muito maior do que o nível oficial, com 7 milhões de pessoas infectadas na Espanha (15% da população). Naquela época, esses 7 milhões representavam 100 vezes o número oficial, na mesma linha que a estimativa de Bort.

Todas essas estimativas são claramente mais realistas do que os simples dados oficiais fornecidos pelos governos, mas ainda sofrem de um problema fundamental: a falta de dados confiáveis para trabalhar.

 

E a amostragem clássica vem em socorro novamente

Ainda é um paradoxo. Há muito tempo ouvimos dizer que na era da Big Data as informações são abundantes, estão livremente disponível e que, usando os métodos certos, é possível fazer qualquer estimativa.

Bem, isso não é verdade. Se quisermos estimar de forma confiável o número real de pessoas infectadas pela covid-19, precisamos de uma amostra representativa de pessoas. Sim, uma amostra, a mesma que usamos para fazer uma pesquisa eleitoral ou um teste de recall de marca.

Uma amostra, se bem desenhada, permite estimar com precisão a incidência real de uma doença na população, independentemente de fatores como sintomatologia ou saturação do sistema hospitalar. O princípio é muito básico: selecionamos pessoas aleatoriamente e fazemos um teste para detectar a doença. As pessoas são selecionadas independentemente de terem sintomas ou não, em todas as regiões, de todas as idades... e o resultado é extrapolado para a população como um todo.

netquest-covid-19-blood-test-blog-post-01

O Ministério da Saúde da Espanha já lançou um estudo que visa estimar o percentual da população que foi infectada, estando ou não doente neste momento, através de uma grande amostra de 90.000 pessoas, distribuídas em 2 ondas. As pessoas selecionadas serão submetidas a um teste rápido de anticorpos, um teste que nos permite detectar se a pessoa passou pela doença graças aos vestígios que ela deixa em nosso sistema imunológico. Como os testes rápidos não são muito confiáveis, aqueles que testarem negativos serão submetidos a um segundo teste (o famoso PCR), que é muito mais confiável.

Apenas os órgãos públicos têm capacidade de fazer este tipo de estudo utilizando uma amostra verdadeiramente probabilística, uma vez que, como já explicamos em inúmeras ocasiões, isso requer ter uma lista de todo o universo a ser estudado (neste caso, toda a população espanhola), e os meios reais para acessá-los e forçá-los a participar do estudo.

 

Algumas considerações sobre a amostragem a ser realizada

Não conheço o método exato utilizado pelo órgão público competente para estudar a extensão do vírus, mas certamente terão considerado as seguintes opções:

1. Eles poderiam usar amostragem aleatória simples. Seria como colocar um bilhete em uma urna para cada habitante e tirar 60.000 bilhetes aleatoriamente. Eu não recomendaria fazer isso por uma razão: a afetação do vírus é muito desigual por regiões, até mesmo por populações e até mesmo por bairros. Você pode aproveitar esta propriedade para fazer uma amostragem mais eficiente (próximo ponto).

2. Eles poderiam usar amostragem estratificada. Esta técnica divide a população em grupos ou estratos, e garante que a amostra tenha um número fixo por estrato. Neste caso, o mais lógico seria utilizar estratos geográficos (Comunidade Autônoma ou Província), mas poderiam ser utilizados grupos de faixas etárias, classe social ou uma combinação desses grupos. A amostragem estratificada reduz o nível de erro. E em casos como este, é possível alocar mais amostra para regiões que sabemos que são as mais afetadas, para que possamos nos aprofundar melhor nas estimativas.

3. Finalmente, é possível combinar a amostragem estratificada com a amostragem por conglomerados. Neste caso, parece aconselhável escolher a família como unidade de amostragem: como devemos deslocar uma equipe médica para coletar amostras em uma residência, é melhor conseguir amostras de todos os membros da família.

 

Importância do estudo e alternativas

O estudo randomizado proposto pelas autoridades sanitárias é de suma importância. Mesmo que a crise de saúde de curto prazo esteja sob controle (saturação hospitalar), saber qual percentual da população passou pela infecção é fundamental para determinar o nível de imunidade coletiva de que desfrutamos. Quanto mais pessoas foram infectadas, mais pessoas terão gerado imunidade à doença, agindo como barreiras naturais para impedir a propagação do vírus, protegendo os não infectados. Os epidemiologistas, com essas informações e sabendo como o vírus é transmitido, podem determinar a partir de que ponto a população goza de imunidade coletiva, permitindo o levantamento de medidas de confinamento que afetam a vida das pessoas e a economia.

Desnecessário dizer que o estudo proposto pelo Ministério é muito caro e só está disponível para um órgão oficial. Mas mesmo uma amostra não estritamente aleatória poderia oferecer estimativas muito mais próximas da realidade do que os números oficiais que lidamos atualmente. A Netquest tem um painel online com capacidade para entrevistar mais de 80.000 pessoas na Espanha ou no Brasil, pessoas dispostas a participar de um estudo deste tipo. Uma primeira fase poderia ser simplesmente descobrir se essas pessoas tiveram sintomas, mesmo que não tenham feito o teste. Mas seria perfeitamente possível enviar aos participantes um kit para coletar uma amostra e enviá-la pelo correio (assumindo que fosse possível enviar as amostras por correio sem afetar sua análise posterior, e que a obtenção de uma amostra pudesse ser auto-administrada).

Em muitos casos, a obtenção rápida de informações com um nível de precisão suficientemente alto é preferível à informação perfeita, mas tardia, ou à total ausência de informação confiável que tivemos até agora. A tomada de decisão é muito sensível aos atrasos. No entanto, na Espanha, parece que o estudo via amostra continuará a sofrer atrasos devido a problemas logísticos.

CTA Blog Use Case COVID-19 PT

 

Carlos Ochoa

About the author

Carlos Ochoa | Chief Client Officer

FREE EBOOK

The essentials of online data collection

Download ebook

Netquest Blog Archives

Search and discover over last years latest market research topics.

View the archives

Assine no nosso blog

Receba as últimas notícias aqui ou no seu email.

Subscribe to our blog

netquest-blog-suscription-shape-illustration

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Hey!

It looks that you are enjoying what you've been reading

Want to read more?

Have access to more genuine content, subscribe to our blog.

I'm already subscribed. Close