Princípios fundamentais para entender a análise de ensaios clínicos 
 Ensaios clínicos são pesquisas realizadas com seres humanos para avaliar a segurança e a eficácia de

Princípios fundamentais para entender a análise de ensaios clínicos Ensaios clínicos são pesquisas realizadas com seres humanos para avaliar a segurança e a eficácia de

Can we help?

O renomado especialista em metodologia de ensaios clínicos e epidemiologia, Dr. Stephen Evans, MD, explica conceitos estatísticos fundamentais para pacientes. Ele esclarece o que é um estudo subdimensionado e por que ele pode falhar na detecção de efeitos reais do tratamento. O Dr. Evans detalha a importância de desfechos primários pré-especificados para evitar viés. Ele também descreve a métrica Número Necessário a Tratar (NNT), destacando suas aplicações e limitações. Esses conceitos são essenciais para interpretar notícias médicas e compreender a eficácia de tratamentos.

Compreensão da Análise de Ensaios Clínicos: Poder Estatístico, Desfechos e NNT Explicados

Navegar para a Seção

Ensaios Clínicos Subdimensionados

Um ensaio clínico subdimensionado não tem participantes suficientes para detectar com confiança um efeito real do tratamento. O Dr. Stephen Evans, MD, explica que o poder de um ensaio é sua capacidade de identificar uma diferença verdadeira, caso ela exista. Ele usa os ensaios de tratamento para COVID-19 como exemplo, observando que estudar mortalidade exige um grande tamanho amostral, já que as taxas de óbito podem ser baixas.

Por exemplo, detectar uma redução na mortalidade de 10% para 7% requer um número elevado de pacientes. Se um ensaio for muito pequeno, torna-se subdimensionado e pode deixar de identificar um benefício clinicamente relevante. Os primeiros ensaios sobre COVID-19 foram frequentemente subdimensionados para desfechos de mortalidade. O Dr. Stephen Evans, MD, enfatiza que o poder está diretamente relacionado ao desfecho específico em estudo.

Desfechos Primários versus Secundários

Ensaios clínicos definem desfechos primários e secundários para medir o sucesso do tratamento. O desfecho primário é o resultado principal que o estudo foi desenhado para avaliar. O Dr. Stephen Evans, MD, observa que a mortalidade é um desfecho primário crucial, mas desafiador, pois exige um grande número de pacientes.

Pesquisadores frequentemente escolhem desfechos primários mais fáceis de estudar, como tempo até a recuperação ou carga viral. Essas medidas objetivas podem exigir menos participantes. No entanto, o Dr. Evans adverte que essas definições devem ser claras e estabelecidas antes do início do ensaio. Alterar desfechos após ver os resultados introduz viés significativo e invalida as descobertas.

Falácia do Atirador do Texas

A Falácia do Atirador do Texas é um conceito crítico para a integridade de ensaios clínicos. O Dr. Stephen Evans, MD, a descreve como desenhar um alvo ao redor dos buracos de bala depois de atirar. Na pesquisa, isso significa alterar o desfecho primário do ensaio após analisar os dados para obter um resultado desejado.

Essa prática introduz viés severo e compromete a validade do estudo. Embora existam razões legítimas para alterar desfechos, isso deve ocorrer antes do desvendamento dos resultados. O Dr. Evans ressalta que a pré-especificação de desfechos é essencial para uma análise confiável de ensaios clínicos. Isso evita que pesquisadores manipulem resultados para mostrar falsos positivos.

Número Necessário para Tratar (NNT)

O Número Necessário para Tratar (NNT) é uma métrica útil para pacientes entenderem o benefício do tratamento. O Dr. Stephen Evans, MD, define o NNT como o número de pacientes que precisam receber um tratamento para prevenir um desfecho adverso. Por exemplo, se um medicamento reduz a mortalidade de 10% para 5%, o NNT é 20.

Isso significa que 20 pessoas devem ser tratadas para prevenir uma morte. No entanto, o Dr. Stephen Evans, MD, observa limitações importantes. O NNT não é um número absoluto; depende do tempo de acompanhamento e da definição do desfecho. Comparações entre tratamentos só são válidas se o NNT for calculado de forma idêntica. Apesar de sua simplicidade, o NNT exige interpretação cuidadosa.

Interpretação dos Resultados de Ensaios

Interpretar corretamente os resultados de ensaios clínicos requer compreensão de conceitos estatísticos-chave. O Dr. Stephen Evans, MD, recomenda buscar estudos adequadamente dimensionados com desfechos pré-especificados. Isso garante que os achados sejam confiáveis e não devidos ao acaso ou a viés.

Pacientes devem considerar a relevância clínica dos desfechos. Um resultado estatisticamente significativo pode não ser relevante se o NNT for muito alto. O Dr. Anton Titov, MD, destaca a importância desses conceitos para a literacia em saúde pública. Compreender poder estatístico, desfechos e NNT ajuda todos a avaliar criticamente notícias médicas e tomar decisões informadas.

Transcrição Completa

Dr. Anton Titov, MD: Professor Evans, existem vários conceitos básicos em ensaios clínicos. O que significa, por exemplo, que um ensaio é subdimensionado? A terminologia de ensaios clínicos está em evidência; está nos jornais. As pessoas precisam entender esses conceitos básicos. Então, o que significa se um ensaio é subdimensionado? O que é NNT, número necessário para tratar? Existem vantagens e desvantagens nesse tipo de conceito. Quais são os desfechos primários e secundários dos ensaios clínicos? Claramente, alguns ensaios têm movido as traves, e isso tem sido comum na comunidade médica.

Dr. Stephen Evans, MD: Vamos tomar quase todos os nossos exemplos da situação atual com a COVID-19. Se vamos estudar mortalidade, isso exigirá um número bastante grande de pessoas. Felizmente, nem todos morrem, mesmo em situação hospitalar. Se tivermos, digamos, 10% das pessoas morrendo, então para encontrar uma diferença que provavelmente seria bastante importante—digamos, reduzir essa taxa de mortalidade de 10% dentro de 30 dias do início do tratamento para 7%—vamos de 10% para 7%. Precisaremos de um grande número de pacientes para poder detectar se tal diferença está realmente ocorrendo.

Fazemos análise estatística sobre isso. Mas se os números forem muito pequenos no ensaio, então esse é um ensaio que chamamos de subdimensionado. O poder do estudo para detectar uma diferença real, se existir, era muito baixo. Isso foi verdade para alguns dos primeiros ensaios realizados sobre tratamentos potenciais para COVID-19.

Enquanto isso, se estudarmos milhares de pacientes, é improvável que o ensaio seja subdimensionado para mortalidade como desfecho, desde que estejamos lidando com diferenças razoáveis. Se quiséssemos detectar uma diferença entre uma taxa de mortalidade de 10% e uma taxa de mortalidade de 9,9%, precisaríamos de dezenas de milhares de pacientes. Essa, claro, não é uma diferença que seria muito útil para pacientes individuais.

Portanto, ensaios subdimensionados são um problema. É subdimensionado em relação ao desfecho que você estuda. Se você fizer da mortalidade seu desfecho primário, precisará de muitos pacientes. Muito frequentemente, o que as pessoas fazem é tornar a mortalidade um desfecho secundário e fazer seu desfecho primário algo mais fácil de estudar e para o qual precisamos de menos pacientes.

Nesse tipo de situação, isso é frequentemente o tempo até a recuperação da doença. O problema com isso é que pode ser um pouco subjetivo. Você pode definir alguém atingindo um nível de recuperação com base em uma avaliação clínica, mas pode ser baseado em carga viral ou algo do tipo, que é uma avaliação objetiva.

Portanto, podemos ter uma avaliação objetiva para um desfecho primário que é mais fácil de estudar do que a mortalidade. O problema é que quando olhamos para a recuperação, temos uma definição para ela. Mas pode ser que as pessoas não atendam a essas definições. Torna-se óbvio no ensaio que o desfecho que você estabeleceu como primário não lhe dará dados úteis.

Pode haver razões legítimas para alterá-lo. Mas a dificuldade é que se as pessoas souberem o que os resultados estão mostrando, elas podem mudar a pergunta e, portanto, obter a resposta que desejam. Em epidemiologia, isso é chamado de síndrome do atirador do Texas, onde o atirador texano fica ao lado de um celeiro e atira sua arma contra o celeiro, e depois caminha e desenha um alvo.

Você precisa em um ensaio ter um alvo especificado previamente, então fazer o ensaio e ver quais são os resultados, em vez de mudar o alvo enquanto o ensaio está em andamento. Em geral, pode haver razões legítimas para alterar seu desfecho. Mas você tem que ter muito cuidado e garantir que não está fazendo isso depois de já ter atirado sua arma e visto onde as balas caíram.

Você precisa fazer isso antes de saber onde as balas estão caindo.

Quando chegamos a medir o desfecho, uma das coisas que podemos fazer é dizer, qual é a taxa de mortalidade? Digamos que temos uma diferença de tratamento de 10% para 5%. Isso significa que em cada cem pessoas, haverá cinco pessoas que não morrem como resultado do tratamento. Para cada 20 pessoas, haverá uma pessoa que não morre.

Quando invertemos isso, dizemos que o número necessário para tratar para prevenir uma morte será 20, com nossa diferença entre 10% e 5%. Isso também seria o caso se houvesse uma diferença entre 20% e 15% ou entre 50% e 45%. É uma medida do número de pacientes que precisam ser tratados para prevenir uma morte.

Às vezes, em vez da morte, olhamos para um evento particular como infarto do miocárdio ou acidente vascular cerebral. O problema com esse número é que não é um número puro. Depende de quanto tempo você acompanhou os pacientes. Também tem alguns outros problemas estatísticos.

Portanto, não é um que eu particularmente goste, mesmo que pareça uma coisa bastante agradável de dizer: "Ah, esta medicação precisa de 20 pacientes necessários para tratar para obter o benefício, enquanto esta medicação precisa de 50 pacientes necessários para tratar." Se você usou as mesmas regras para ambos, então o NNT pode ser bastante útil. Mas você tem que ter cuidado para garantir que sua definição do NNT, que não é um número puro, seja usada exatamente da mesma maneira quando você faz comparações entre tratamentos.