IA Generativa Analisa Dados Médicos Mais Rápido que Equipes Humanas

Pesquisa Publicada na Cell Reports Medicine Demonstra Avanço Significativo

Cientistas da UC San Francisco e da Wayne State University descobriram que a IA generativa pode processar enormes conjuntos de dados médicos muito mais rápido do que as equipes tradicionais de ciência da computação — e, em alguns casos, produzir resultados ainda mais fortes. Especialistas humanos haviam passado meses analisando cuidadosamente as mesmas informações.

Comparação Direta de Performance

Para comparar o desempenho diretamente, os pesquisadores atribuíram tarefas idênticas a diferentes grupos. Algumas equipes contaram inteiramente com a experiência humana, enquanto outras usaram cientistas trabalhando com ferramentas de IA. O desafio era prever o nascimento prematuro usando dados de mais de 1.000 gestantes.

Até mesmo uma equipe de pesquisa júnior, composta por um estudante de mestrado da UCSF, Reuben Sarwal, e um estudante do ensino médio, Victor Tarca, desenvolveu com sucesso modelos de previsão com suporte de IA. O sistema gerou código de computador funcional em minutos — algo que normalmente levaria programadores experientes várias horas ou até dias.

Código Analítico a Partir de Prompts Específicos

A vantagem veio da capacidade da IA de escrever código analítico com base em prompts curtos, mas altamente específicos. Nem todos os sistemas tiveram bom desempenho. Apenas 4 dos 8 chatbots de IA produziram código utilizável. Ainda assim, aqueles que tiveram sucesso não exigiram grandes equipes de especialistas para orientá-los.

Devido a essa velocidade, os pesquisadores juniores conseguiram concluir seus experimentos, verificar suas descobertas e enviar seus resultados para uma revista científica em poucos meses.

“Essas ferramentas de IA poderiam aliviar um dos maiores gargalos na ciência de dados: construir nossos pipelines de análise,” disse Marina Sirota, PhD, professora de Pediatria que é diretora interina do Bakar Computational Health Sciences Institute (BCHSI) da UCSF e investigadora principal do March of Dimes Prematurity Research Center da UCSF. “A aceleração não poderia chegar em melhor momento para os pacientes que precisam de ajuda agora.”

Por Que a Pesquisa de Nascimento Prematuro Importa

Acelerar a análise de dados pode melhorar ferramentas de diagnóstico para o nascimento prematuro — a principal causa de morte de recém-nascidos e um importante contribuinte para desafios motores e cognitivos de longo prazo em crianças. Nos Estados Unidos, aproximadamente 1.000 bebês nascem prematuros a cada dia.

Os pesquisadores ainda não entendem completamente o que causa o nascimento prematuro. Para investigar possíveis fatores de risco, a equipe de Sirota compilou dados de microbioma de cerca de 1.200 gestantes cujos resultados foram acompanhados em nove estudos separados.

“Esse tipo de trabalho só é possível com o compartilhamento aberto de dados, reunindo as experiências de muitas mulheres e a expertise de muitos pesquisadores,” disse Tomiko T. Oskotsky MD, co-diretora do March of Dimes Preterm Birth Data Repository, professora associada na UCSF BCHSI e co-autora do artigo.

Competição DREAM

Analisar um conjunto de dados tão vasto e complexo provou ser desafiador. Para abordar isso, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Dialogue on Reverse Engineering Assessment and Methods).

Sirota co-liderou um dos três desafios de gravidez da DREAM, focando especificamente em dados de microbioma vaginal. Mais de 100 equipes em todo o mundo participaram, desenvolvendo modelos de aprendizado de máquina projetados para detectar padrões ligados ao nascimento prematuro. A maioria dos grupos completou seu trabalho dentro da janela de três meses da competição. No entanto, levou quase dois anos para consolidar os achados e publicá-los.

Testando IA em Dados de Gravidez e Microbioma

Curiosos para saber se a IA generativa poderia encurter esse cronograma, o grupo de Sirota parceirou com pesquisadores liderados por Adi L. Tarca, PhD, co-autor sênior e professor no Center for Molecular Medicine and Genetics da Wayne State University em Detroit, MI. Tarca liderara os outros dois desafios da DREAM, focados em melhorar métodos para estimar o estágio da gravidez.

Juntos, os pesquisadores instruíram oito sistemas de IA a gerarem independentemente algoritmos usando os mesmos conjuntos de dados dos três desafios da DREAM, sem codificação humana direta.

Os chatbots de IA receberam instruções de linguagem natural cuidadosamente escritas. Muito como o ChatGPT, os sistemas foram guiados por prompts detalhados projetados para direcioná-los a analisar os dados de saúde de maneiras comparáveis aos participantes originais da DREAM.

Resultados

Seus objetivos espelharam os desafios anteriores. Os sistemas de IA analisaram dados de microbioma vaginal para identificar sinais de nascimento prematuro e examinaram amostras de sangue ou placentárias para estimar a idade gestacional. A datação da gravidez é quase sempre uma estimativa, mas determina o tipo de cuidados que as mulheres recebem conforme as gravidezes progridem. Quando as estimativas são imprecisas, preparar-se para o trabalho de parto torna-se mais difícil.

Os pesquisadores então executaram o código gerado por IA usando os conjuntos de dados da DREAM. Apenas 4 das 8 ferramentas produziram modelos que combinaram com o desempenho das equipes humanas, embora em alguns casos os modelos de IA tenham desempenhado melhor. Todo o esforço de IA generativa — da concepção ao envio de um artigo — levou apenas seis meses.

Supervisão Humana Essencial

Os cientistas enfatizam que a IA ainda requer supervisão cuidadosa. Esses sistemas podem produzir resultados enganosos, e a experiência humana permanece essencial. No entanto, ao classificar rapidamente enormes conjuntos de dados de saúde, a IA generativa pode permitir que os pesquisadores passem menos tempo corrigindo bugs de código e mais tempo interpretando resultados e fazendo perguntas científicas significativas.

“Graças à IA generativa, pesquisadores com experiência limitada em ciência de dados nem sempre precisarão formar colaborações amplas ou gastar horas depurando código,” disse Tarca. “Eles podem focar em responder às certas perguntas biomédicas.”

O estudo foi financiado pelo March of Dimes Prematurity Research Center na UCSF e pelo ImmPort. Os dados usados neste estudo foram gerados em parte com suporte do Pregnancy Research Branch do NICHD.

Fontes


Este post foi gerado por IA usando GLM-4.7

Traduções: