Início ANDROID A inteligência artificial poderia descobrir novas físicas mais rapidamente, mas com um...

A inteligência artificial poderia descobrir novas físicas mais rapidamente, mas com um bônus surpreendente

23
0

A inteligência artificial já desempenha um papel importante ao ajudar os cosmólogos a estudar o universo. Agora, uma nova pesquisa mostra que uma técnica de aprendizado de máquina chamada aprendizagem por transferência poderia tornar a busca por uma nova física mais rápida e barata. No entanto, o estudo também encontrou uma lacuna surpreendente: a IA pode por vezes tornar-se tão dependente do que já aprendeu que tem dificuldade em reconhecer algo verdadeiramente novo.

A pesquisa foi publicada em Jornal de Cosmologia e Física de Partículas Astronômicas (JCAP

Inteligência Artificial e a Exploração de Nova Física

O atual Modelo Padrão de Cosmologia, denominado ΛCDM, explica com sucesso muitas características do universo em grande escala, incluindo sua expansão e a distribuição de galáxias. No entanto, os cientistas acreditam que este modelo não é a resposta final.

Produzir essas simulações é computacionalmente caro e muitas vezes requer quantidades significativas de poder computacional.

Reduza os custos de simulação usando a aprendizagem por transferência

Os pesquisadores investigaram se a aprendizagem por transferência poderia tornar esse processo mais eficiente.

A aprendizagem por transferência permite que os sistemas de inteligência artificial apliquem o conhecimento adquirido de uma tarefa em outra tarefa relacionada. Em vez de treinar uma rede neural inteiramente nas simulações mais complexas e dispendiosas do ponto de vista computacional, a equipe primeiro a treinou em simulações mais simples baseadas em ΛCDM. Este estágio inicial é chamado de pré-treinamento, seguido de treinamento adicional usando um modelo mais complexo que inclui física potencialmente nova.

Bayer comparou métodos de aprendizagem com livros didáticos.

“Você lê um livro básico primeiro para ter uma ideia do que ele contém e depois passa para os livros realmente complexos”, disse Beyer.

Essa estratégia evita que a IA “digira tudo de uma vez”, disse a primeira autora Veena Krishnaraj, estudante de graduação da Universidade de Princeton.

Os resultados são impressionantes. Em alguns casos, a aprendizagem por transferência reduz o número de simulações caras exigidas em mais de dez vezes.

Quando o conhecimento prévio se torna um problema

O estudo também revelou um desafio menos óbvio, nomeadamente a transferência negativa.

Usando a comparação dos livros didáticos da Bayer, imagine aprender sobre medicina a partir de um texto introdutório e depois encontrar uma doença rara que se assemelha muito a uma doença comum. O conhecimento existente é muitas vezes útil, mas por vezes pode levar a conclusões incorretas.

O mesmo problema ocorre em sistemas de inteligência artificial.

Em alguns casos, as características da nova física assemelham-se a padrões que a inteligência artificial já associou aos modelos cosmológicos padrão. Quando isso acontece, a rede pré-treinada pode interpretar informações desconhecidas através de informações que já conhece, dificultando a identificação de efeitos verdadeiramente novos.

Os pesquisadores observaram esse efeito ao estudar simulações que incluíam um grande número de neutrinos. Algumas das características observadas relacionadas às massas dos neutrinos são muito semelhantes às mudanças relacionadas ao parâmetro ΛCDM existente (chamado σ8), que mede a força dos aglomerados de matéria em todo o universo.

Devido a esta semelhança, é inicialmente difícil para redes neurais pré-treinadas distinguir entre os dois efeitos.

“A migração negativa não é aleatória. É impulsionada pela degradação física subjacente no modelo”, disse Krishnaraj.

Em outras palavras, diferentes processos físicos podem produzir características observáveis ​​muito semelhantes, dificultando que a inteligência artificial identifique corretamente qual parâmetro é responsável.

“Portanto, isso é algo que precisamos estar cientes e trabalhar para mitigar”, concluiu ela.

As descobertas destacam os benefícios e limitações potenciais da aplicação de conceitos fundamentais de modelos à física. Esses métodos são amplamente semelhantes em espírito às técnicas por trás dos modernos sistemas generativos de inteligência artificial e de grandes modelos de linguagem.

Como observam os pesquisadores em seu artigo, o pré-treinamento pode acelerar a inferência, “mas também pode dificultar o aprendizado de novas físicas”.

Até agora, esta abordagem só foi testada com simulações. O próximo passo será aplicá-lo a observações astronômicas reais.

estado.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui