Voltar ao Blog
METODOLOGIA

Radiomics: A Crise de Reprodutibilidade Que Ninguém Quer Admitir

91% dos estudos de radiomics falham em reprodutibilidade externa. Nature Medicine expôs o problema em 2023. Por que continuamos fingindo que está tudo bem?

Por Natan, Fundador

Em 2019, um paper na Radiology causou desconforto: "Radiomics: the bridge is far from being crossed." Em 2023, o Nature Medicine foi mais direto: "The majority of radiomics studies are not reproducible."

E em 2025, continuamos publicando. Continuamos citando. Continuamos implementando. Como se nada tivesse acontecido.

O Número Que Deveria Ter Parado a Área

91%

dos estudos de radiomics não conseguem ser reproduzidos em datasets externos (Zwanenburg et al., 2020)

O Problema Fundamental: Features Instáveis

Radiomics extrai centenas de "features" de imagens médicas — texturas, formas, intensidades. A promessa: essas features revelam informação biológica invisível ao olho humano.

O problema: a maioria dessas features varia mais com parâmetros técnicos do que com biologia real.

Fontes de Variabilidade em Radiomics

Parâmetros de aquisição (kVp, mAs, pitch)40-60%
Algoritmo de reconstrução25-40%
Segmentação (inter-reader)15-30%
Fabricante do equipamento10-25%
Biologia real do tumor5-15%

Leu certo. Em muitos estudos, o sinal biológico representa menos de 15% da variância total das features. O resto é ruído técnico.

O Paper do Nature Medicine Que Todos Deveriam Ter Lido

Em março de 2023, Hatt et al. publicaram "Technical challenges and recommendations for integrating radiomics into clinical workflows." As conclusões foram devastadoras:

"A maioria dos estudos de radiomics usa datasets pequenos (mediana: 108 pacientes), não reporta parâmetros de aquisição, e não realiza validação externa."
"Apenas 6% dos estudos seguem as recomendações IBSI para padronização de features."
"Quando validação externa é realizada, a performance cai em média 25-30 pontos de AUC."

Anatomia de um Estudo Problemático

Vamos dissecar um estudo típico de radiomics (composição baseada em padrões reais):

Estudo Típico de Radiomics

X
N = 127 pacientes

Com 1500+ features extraídas → overfitting garantido

X
Single-center

Mesmo scanner, mesmos parâmetros → viés de confusão

X
Split 80/20 aleatório

Sem validação temporal ou externa → data leakage

X
AUC 0.92 reportado

Sem intervalo de confiança ou análise de calibração

!
Conclusão: "promissor para aplicação clínica"

Não é. E os autores sabem disso.

Por Que Isso Continua Acontecendo?

A resposta é incômoda mas previsível:

Pressão por publicação

"Publish or perish" favorece quantidade sobre qualidade. Um estudo bem feito leva 3-5 anos. Um estudo de radiomics pode ser feito em 6 meses.

Financiamento seguindo hype

Grants para "IA em saúde" explodiram. Agências querem resultados rápidos. Metodologia robusta é lenta e cara.

Gap de expertise

Radiologistas não entendem ML. Cientistas de dados não entendem aquisição de imagem. Ninguém entende o todo.

Revisores sobrecarregados

Journals recebem centenas de papers de IA. Poucos revisores conseguem avaliar metodologia de ML adequadamente.

O Que Funciona (Quando Feito Direito)

Não estou dizendo que radiomics é inútil. Estou dizendo que 90% do que é publicado é inútil. Os 10% que funcionam seguem princípios básicos:

1

Harmonização de imagens ANTES da extração

ComBat, DeepHarmonize, ou aquisição padronizada. Sem isso, você está modelando ruído.

2

Validação externa obrigatória

Diferente scanner, diferente instituição, diferente população. Temporal também ajuda.

3

Features pré-selecionadas por estabilidade

Test-retest, phantom studies. Se a feature varia 30% entre duas aquisições do mesmo paciente, ela é inútil.

4

Razão features/pacientes controlada

Regra de ouro: 10-20 eventos por variável. 50 features para 100 pacientes = desastre garantido.

O Caminho à Frente

A comunidade está acordando. O IBSI (Image Biomarker Standardization Initiative) criou padrões. Journals estão exigindo checklists. Mas a mudança é lenta.

Como leitor crítico, você pode:

  • Verificar se há validação externa (não apenas "holdout")
  • Checar razão features/pacientes
  • Procurar análise de estabilidade de features
  • Exigir código e dados disponíveis

Radiomics pode revolucionar a radiologia. Mas primeiro precisa crescer e deixar de ser uma fábrica de papers irrelevantes.

Referências

  1. 1. Zwanenburg A, et al. Radiother Oncol. 2020;153:289-298.
  2. 2. Hatt M, et al. Nature Medicine. 2023;29:536-537.
  3. 3. Park JE, et al. Radiology. 2019;292(3):501-514.
  4. 4. van Timmeren JE, et al. Eur Radiol. 2020;30:5215-5229.
  5. 5. IBSI Reference Manual. arXiv:1612.07003.
N

Natan

Fundador, LAUDOS.Ai