Num primeiro teste real de inteligência artificial na investigação em saúde, cientistas da UCSF e da Wayne State University descobriram que a inteligência artificial generativa pode processar enormes conjuntos de dados médicos mais rapidamente do que as equipas tradicionais de ciência da computação e, em alguns casos, produzir resultados ainda mais fortes. Especialistas humanos passaram meses analisando cuidadosamente as mesmas informações.
Para comparar diretamente o desempenho, os pesquisadores atribuíram as mesmas tarefas a grupos diferentes. Algumas equipes dependem inteiramente da experiência humana, enquanto outras utilizam cientistas que utilizam ferramentas de inteligência artificial. O desafio era prever o nascimento prematuro utilizando dados de mais de 1.000 mulheres grávidas.
Até mesmo uma dupla de pesquisa júnior composta pelo aluno de mestrado da UCSF, Reuben Sarwal, e pelo estudante do ensino médio, Victor Tarca, desenvolveu com sucesso um modelo preditivo baseado em IA. O sistema produzia código de computador funcional em minutos – algo que normalmente levaria horas ou até dias para programadores experientes.
A vantagem vem da capacidade da inteligência artificial de escrever código analítico com base em prompts curtos, mas altamente específicos. Nem todo sistema funciona bem. Apenas 4 dos 8 chatbots de IA produziram código utilizável. Ainda assim, as empresas bem-sucedidas não precisam da orientação de uma grande equipe de especialistas.
Devido a esta velocidade, os investigadores juniores são capazes de completar as suas experiências, validar as suas descobertas e submeter os seus resultados a uma revista dentro de alguns meses.
“Essas ferramentas de IA podem aliviar um dos maiores gargalos da ciência de dados: construir nossos pipelines de análise”, disse Marina Sirota, MD, professora de pediatria, diretora interina do Instituto de Ciências da Saúde Computacional Bakar da UCSF (BCHSI) e investigadora principal do Centro de Pesquisa de Prematuridade da UCSF. “Esse aumento na velocidade chega cedo demais para os pacientes que precisam de ajuda agora.”
Sirota é co-autor sênior do estudo, publicado em medicamento de notificação de células 17 de fevereiro.
Por que a pesquisa sobre nascimento prematuro é importante
A aceleração da análise de dados poderia melhorar as ferramentas de diagnóstico do nascimento prematuro, uma das principais causas de morte neonatal e uma das principais causas de desafios motores e cognitivos a longo prazo nas crianças. Nos Estados Unidos, aproximadamente 1.000 bebês nascem prematuramente todos os dias.
Os pesquisadores ainda não entendem completamente o que causa o nascimento prematuro. Para investigar possíveis factores de risco, a equipa de Sirota recolheu dados do microbioma de cerca de 1.200 mulheres grávidas cujos resultados foram monitorizados em nove estudos separados.
“Este tipo de trabalho só é possível através da partilha aberta de dados, reunindo as experiências de muitas mulheres e os conhecimentos de muitos investigadores”, disse Tomiko T. Oskotsky, MD, co-diretora do Repositório de Dados de Nascimento Prematuro March of Dimes, professora associada da UCSF BCHSI, e co-autora do artigo.
No entanto, analisar um conjunto de dados tão grande e complexo revelou-se um desafio. Para resolver este problema, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Diálogo sobre Avaliação e Métodos de Engenharia Reversa).
Sirota co-lidera um dos três desafios de gravidez DREAM, concentrando-se especificamente nos dados do microbioma vaginal. Mais de 100 equipes em todo o mundo estão envolvidas no desenvolvimento de modelos de aprendizado de máquina projetados para detectar padrões associados ao nascimento prematuro. A maioria das equipes concluiu seu trabalho dentro do período de competição de três meses. No entanto, demorou quase dois anos para compilar as descobertas e publicá-las.
Testando inteligência artificial em dados de gravidez e microbioma
A equipe de Sirota estava curiosa para saber se a inteligência artificial generativa poderia encurtar esse tempo, por isso colaborou com pesquisadores liderados pelo co-autor sênior e professor Adi L. Tarca, Ph.D., do Centro de Medicina Molecular e Genética da Wayne State University em Detroit, Michigan. Tarca lidera dois outros desafios DREAM centrados na melhoria dos métodos de estimativa das fases da gravidez.
Juntos, os pesquisadores instruíram oito sistemas de inteligência artificial a gerar algoritmos de forma independente usando os mesmos conjuntos de dados dos três desafios DREAM, sem codificação humana direta.
Os chatbots de IA recebem instruções em linguagem natural cuidadosamente escritas. Assim como o ChatGPT, o sistema é guiado por instruções detalhadas projetadas para orientá-los na análise de dados de saúde de maneira semelhante aos participantes originais do DREAM.
Seus objetivos refletem os desafios iniciais. O sistema de IA analisa dados do microbioma vaginal para identificar sinais de trabalho de parto prematuro e examina amostras de sangue ou placenta para estimar a idade gestacional. O namoro na gravidez é quase sempre uma estimativa, mas determina o tipo de cuidado que a mulher recebe durante a gravidez. A preparação para a entrega torna-se mais difícil quando as estimativas são imprecisas.
Os pesquisadores então usaram o conjunto de dados DREAM para executar o código gerado pela IA. Apenas 4 das 8 ferramentas produziram modelos que correspondiam ao desempenho da equipe humana, embora em alguns casos os modelos de IA tenham tido melhor desempenho. Todo o esforço generativo de IA – desde o início até o envio do artigo – levou apenas seis meses.
Os cientistas sublinham que a inteligência artificial ainda requer uma supervisão cuidadosa. Estes sistemas podem produzir resultados enganosos e a experiência humana continua a ser crítica. No entanto, ao classificar rapidamente conjuntos massivos de dados de saúde, a IA generativa pode permitir que os pesquisadores gastem menos tempo solucionando problemas de código e mais tempo interpretando resultados e fazendo perguntas científicas significativas.
“Com a IA generativa, os pesquisadores com experiência limitada em ciência de dados nem sempre precisam formar colaborações extensas ou passar horas depurando código”, disse Tarca. “Eles podem se concentrar em responder às perguntas biomédicas certas.”
Autor: UCSF Os autores são Reuben Sarwal; Claire Dubin; Sanchita Bhattacharya, MA; e Atul Butte, MD, Ph.D. Outros autores incluem Victor Tarca (Huron High School, Ann Arbor, Miss.); Nikolas Kalavros e Gustavo Stolovitzky, Ph.D. (Universidade de Nova York); Gaurav Bhatti (Universidade Estadual Wayne); e Roberto Romero, MD, Sc.D. (Instituto Nacional de Saúde Infantil e Desenvolvimento Humano (NICHD)).
Financiamento: Este trabalho foi financiado pelo March of Dimes Center for Prematurity Research da UCSF e pelo ImmPort. Os dados utilizados neste estudo foram gerados em parte com o apoio da Divisão de Pesquisa de Gravidez do NICHD.



