Início ANDROID O que os cientistas entendem mal sobre as evidências estatísticas e como...

O que os cientistas entendem mal sobre as evidências estatísticas e como corrigi-las

45
0

A estatística é uma ferramenta importante na ciência que nos ajuda a compreender questões importantes reveladas pelos dados. Contudo, o conceito de “evidência estatística” continua difícil de definir. O professor Michael Evans, da Universidade de Toronto, explorou esta questão complexa no seu estudo recente publicado na Enciclopédia 2024.

O campo da estatística trata de situações em que existe alguma quantidade de interesse cujo valor é desconhecido, os dados foram coletados e acredita-se que os dados contenham evidências sobre o valor desconhecido. A teoria estatística deve responder a duas questões principais com base nos dados: (i) fornecer valores razoáveis ​​para a quantidade de interesse e uma medida da precisão da estimativa, e (ii) avaliar se há evidências a favor ou contra o valor hipotético da quantidade de interesse e uma medida da força da evidência. Por exemplo, seria certamente interessante estimar a proporção de pessoas infectadas com COVID-19 que desenvolverão doenças graves, ou saber se foram obtidas evidências a favor ou contra a hipótese da existência de matéria escura com base em medições feitas pelo telescópio Webb.

Conforme discutido neste artigo, existem dois temas principais na forma como estas questões são abordadas: abordagens probatórias e abordagens de tomada de decisão. O foco da abordagem probatória é garantir que quaisquer métodos estatísticos utilizados sejam explicitamente baseados nas evidências dos dados. Em contraste, a teoria da decisão visa minimizar perdas potenciais utilizando penalidades baseadas em suposições sobre conclusões errôneas. Para aplicações científicas, contudo, argumenta-se que a priorização das evidências nos dados está bem alinhada com o objetivo fundamental da ciência, que é determinar a verdade. O artigo do professor Evans o coloca firmemente no campo das evidências.

A seguinte citação do artigo estabelece um problema fundamental com a abordagem da evidência: “A maioria das análises estatísticas referem-se ao conceito de evidência estatística em frases como ‘a evidência nos dados sugere’ ou ‘com base na evidência que derivamos’. No entanto, há muito que se reconhece que o conceito em si nunca foi definido de forma satisfatória, ou pelo menos não forneceu uma definição que seja universalmente acordada.”

A questão fundamental para a abordagem probatória é, então: como deve ser definida a evidência estatística? Pois como se pode afirmar que uma abordagem específica é baseada em evidências sem declarar explicitamente o que se entende por evidência estatística? O artigo do Professor Evans analisa as muitas abordagens que foram adotadas ao longo dos anos para resolver este problema.

Existem alguns métodos estatísticos bem conhecidos que são usados ​​como expressões de evidências estatísticas. Muitas pessoas estão familiarizadas com o uso dos valores p em questão (ii). Existem problemas bem conhecidos com valores p como medida de evidência estatística, alguns dos quais são revisados ​​neste artigo. Por exemplo, um alfa de corte precisa ser escolhido para determinar quando o valor p é pequeno o suficiente para indicar que há evidências contra a hipótese e que não há seleção natural de alfa. Além disso, os valores p nunca fornecem evidências de que uma hipótese esteja correta. O conceito de intervalos de confiança está intimamente relacionado aos valores p e, portanto, sofre de falhas semelhantes.

Allan Birnabum fez uma tentativa substancial nas décadas de 1960 e 1970 para estabelecer o conceito de evidência estatística como central para o campo da estatística, e o seu trabalho é discutido neste artigo. Isto levou à descoberta de muitas relações interessantes entre princípios acordados por muitos estatísticos, tais como os princípios de possibilidade, suficiência e condicionalidade. Birnbaum não conseguiu descrever completamente o que significa evidência estatística, mas seu trabalho apontou para outra divisão bem conhecida nas estatísticas: frequentismo versus bayesianismo. Birnbaum busca uma definição de evidência estatística no freqüentismo. Tanto os valores p quanto os intervalos de confiança são de natureza frequentista. Os leitores frequentes imaginam que o problema estatístico em estudo é repetido várias vezes independentes e então procuram procedimentos estatísticos que funcionem bem nessas sequências.

Em contraste, os bayesianos querem que as inferências se baseiem apenas em dados observados, sem levar em conta tais sequências imaginárias. Um custo da abordagem bayesiana é que o analista precisa fornecer uma distribuição de probabilidade prévia para a quantidade de interesse que reflita a visão do analista sobre o verdadeiro valor dessa quantidade. Os estatísticos bayesianos são forçados a atualizar suas crenças após verem os dados, representados pela distribuição de probabilidade posterior da quantidade de interesse. É a comparação de crenças a priori e a posteriori que leva intuitivamente a uma definição clara de evidência estatística. princípio da evidência: Se a probabilidade posterior de que um determinado valor seja verdadeiro for maior que a probabilidade anterior correspondente, há evidências de que é um valor verdadeiro, e se a probabilidade posterior for menor que a probabilidade anterior, há evidências de que não é um valor verdadeiro. É a evidência nos dados que muda a crença, e o Princípio da Evidência descreve isso claramente.

Conforme explicado no artigo do Professor Evans, outros elementos são necessários além do princípio probatório. Para estimar e medir a força da evidência é necessário ordenar os possíveis valores da quantidade de interesse, e a forma natural de fazer isso é através do índice de confiança relativo: a razão entre a probabilidade posterior de um valor e sua probabilidade anterior. Quando a proporção é maior que 1, há evidências de apoio. Quanto maior a proporção, mais evidências de apoio. Pelo contrário, quando o rácio é inferior a 1, existem provas de apoio. Os índices de confiança relativos levam a respostas naturais a questões de estimativa e avaliação de hipóteses.

Este artigo discute mais, inclusive como lidamos com a subjetividade inerente aos métodos estatísticos, como o uso de verificação de modelo e verificação de conflitos de dados anteriores. Talvez o mais surpreendente, contudo, seja o facto de a abordagem evidencial através de crenças relativas ter levado a uma resolução entre o frequentismo e o bayesianismo. Parte da história é que a confiabilidade de qualquer inferência deve ser avaliada, e é isso que o frequentismo faz. Isto surge na abordagem de confiança relativa, onde as probabilidades anteriores são manipuladas para obter evidências contra um valor quando o valor é verdadeiro, e evidências para o valor quando o valor é falso. Finalmente, a inferência é Bayesiana na medida em que reflecte a crença e fornece uma definição clara de evidência estatística, enquanto o controlo da fiabilidade da inferência é frequentista. Ambos desempenham um papel fundamental na aplicação de estatísticas a problemas científicos.

À medida que o mundo se torna cada vez mais dependente de insights baseados em dados, torna-se cada vez mais importante compreender o que constitui uma evidência sólida. A pesquisa do Professor Evans fornece uma base cuidadosa para abordar esta questão premente.

Referência do diário

Evans, M. “Conceitos, raízes históricas e desenvolvimentos atuais de evidências estatísticas.” Enciclopédia 2024, 4, 1201–1216. Número digital: https://doi.org/10.3390/encyclopedia4030078

Sobre o autor

Michael Evans é professor de estatística na Universidade de Toronto. Ele recebeu seu Ph.D. da Universidade de Toronto em 1977, onde trabalha desde então, com intervalos para estudos na Universidade de Stanford e na Universidade Carnegie Mellon. Ele é membro da American Statistical Association, atuando como Presidente do Departamento de Estatística de 1992-97 e Presidente Interino em 2022-23, e como Presidente da Canadian Statistical Association de 2013-2014. Ele ocupou vários cargos editoriais: Editor Associado da JASA Theory and Methods 1991-2005, Editor Associado do Canadian Journal of Statistics 1999-2006 e 2017 até o presente, Editor Associado 2005-2015 e Editor 2015-2021 do Journal of Bayesian Analysis, Editor de Assunto da revista online FACETS (atual) e Editor Associado do New England Journal of Statistical Science (atual).
A pesquisa de Michael Evans envolve métodos estatísticos multivariados, estatística computacional e fundamentos de estatística. A investigação actual centra-se no desenvolvimento de uma teoria de raciocínio chamada crença relativa, que se baseia numa definição clara de como pesar as provas estatísticas. Além disso, sua pesquisa envolve o desenvolvimento de ferramentas para responder às críticas às metodologias estatísticas relacionadas à sua subjetividade inerente. Ele é autor ou coautor de vários artigos de pesquisa, bem como Aproximando Integrais via Monte Carlo e Métodos Determinísticos (com T. Swartz), 2000, Oxford, Probabilidade e Estatística: A Ciência da Incerteza (com J. Rosenthal), 2004 e 2010 por WH Freeman, e Medindo Evidências Estatísticas Usando Confiança Relativa, 2015, CRC Imprensa/Chapman e Hall.

Source link