Técnica de aprendizagem por transferência reduziu em mais de dez vezes a necessidade de simulações cosmológicas caras, mas estudo mostra que o mesmo conhecimento prévio capaz de acelerar a busca por novas leis da física pode dificultar a identificação de sinais realmente inéditos no universo.
A inteligência artificial pode acelerar a busca por novas leis da física ao reduzir em mais de dez vezes o uso de simulações cosmológicas caras, mas o ganho vem acompanhado de um risco: confiar demais em padrões já aprendidos.
IA usa conhecimento prévio para buscar leis da física
A pesquisa examinou como a aprendizagem por transferência pode ajudar cosmólogos a investigar teorias além do modelo cosmológico padrão, conhecido como ΛCDM. O estudo foi publicado no Journal of Cosmology and Astroparticle Physics, com artigo disponível no JSTAT.
O modelo ΛCDM explica características em larga escala do universo, como sua expansão e a distribuição das galáxias. Ainda assim, os cientistas avaliam que ele não representa uma resposta definitiva para todos os fenômenos observados.
-
A Austrália quer “engarrafar” o sol do deserto e mandar energia limpa para Singapura por um cabo submarino de 4.300 km, em um plano de US$ 35 bilhões que parece ficção científica e pode mudar a exportação de eletricidade
-
Condomínios que liberaram carregador de carro elétrico sem projeto agora acendem alerta: regra nova em mais um estado exige circuito exclusivo, disjuntor, sinalização e responsável técnico, enquanto Bombeiros miram garagens fechadas e expõem o risco escondido atrás da recarga noturna aparentemente simples
-
Bitucas de cigarro que iriam para o lixo viraram tijolos ecológicos para construção de casas em projeto de estudantes da Argentina; os blocos de encaixe usam 60% de material reciclado, reduzem mais de 50% do cimento e custam metade de um tijolo comum
-
Pela primeira vez na história, cientistas extraem DNA humano antigo de pintura rupestre e abrem uma nova janela sobre quem viveu nas cavernas pré-históricas
Observações recentes levantaram questões associadas a neutrinos massivos, gravidade modificada e energia escura em evolução. Cada possibilidade exige simulações detalhadas, nas quais universos virtuais são construídos com diferentes pressupostos físicos.
Esse processo é caro do ponto de vista computacional. Para testar muitas hipóteses, pesquisadores precisam gerar grande quantidade de simulações complexas, o que demanda poder de processamento substancial e amplia o custo das análises.
Como a aprendizagem por transferência reduz simulações
A aprendizagem por transferência permite que uma rede neural aproveite conhecimento adquirido em uma tarefa e o aplique em outra tarefa relacionada. A equipe usou esse princípio para treinar primeiro a IA em simulações mais simples.
Nessa etapa inicial, chamada de pré-treinamento, a rede neural aprendeu padrões a partir de simulações baseadas no ΛCDM. Depois, recebeu treinamento adicional com modelos mais sofisticados, que incluem possíveis fenômenos físicos ainda não incorporados ao modelo padrão.
Adrian Bayer, cosmólogo do Flatiron Institute e da Universidade de Princeton, descreveu a estratégia como um atalho. Em vez de treinar a IA diretamente nas simulações mais custosas, o sistema começa por modelos simples e avança para os complexos.
Bayer comparou o método ao uso de livros didáticos. Primeiro, o estudante lê um livro básico para formar uma noção geral do conhecimento; depois, passa para um material mais complicado e especializado.
Para Veena Krishnaraj, primeira autora do estudo e estudante de graduação da Universidade de Princeton, essa estratégia evita que a IA tenha de assimilar tudo de uma vez. O resultado foi uma redução expressiva das simulações mais caras.
Em alguns casos, a aprendizagem por transferência diminuiu em mais de dez vezes o número de simulações dispendiosas necessárias para investigar parâmetros ligados a novas possibilidades físicas no universo.
Quando o atalho atrapalha a descoberta
O estudo também identificou um problema chamado transferência negativa. Ele ocorre quando o conhecimento prévio da IA, em vez de ajudar, leva o sistema a interpretar sinais novos como se fossem variações de padrões já conhecidos.
A dificuldade apareceu em simulações com neutrinos massivos. Algumas assinaturas observacionais associadas à massa do neutrino se parecem com mudanças ligadas ao parâmetro ΛCDM σ8, que mede a intensidade do agrupamento da matéria no universo.
Por causa dessa semelhança, a rede neural pré-treinada teve dificuldade inicial para separar os dois efeitos. A IA analisava informações desconhecidas a partir de referências familiares, o que poderia mascarar evidências de novas leis da física.
Krishnaraj afirmou que a transferência negativa não é aleatória, mas impulsionada por degenerescências físicas subjacentes no modelo. Isso significa que processos diferentes podem produzir assinaturas observáveis muito parecidas.
Promessa para levantamentos astronômicos futuros
Os resultados apontam benefícios e limites do uso de conceitos inspirados em modelos fundamentais na física. O pré-treinamento pode acelerar a inferência, mas também dificultar o aprendizado de novos conceitos físicos.
Até agora, a abordagem foi testada em simulações. O próximo passo será aplicá-la a observações astronômicas reais, em um contexto de levantamentos cosmológicos que devem reunir volumes inéditos de dados de alta precisão.
A equipe vê a aprendizagem por transferência como uma ferramenta importante para a cosmologia futura, desde que seus riscos sejam considerados. Comente o que você acha desse equilíbrio entre velocidade e cautela: a IA deve ganhar mais espaço na busca por novas leis da física ou esse tipo de limitação mostra que a supervisão humana continuará indispensável?

A inteligência artificial deixa passar dados novos, porque ela é alimentada com dados existentes! Então precisaríamos de uma inteligência artificial que seria capaz de avaliar novos dados e sobrepor os atuais para comparação e possíveis previsões. Por exemplo a IA sabe que uma fruta se decompõe porque tem informações da sua origem e estrutura de massa celular, mas o mesmo não pode ser dito sobre novos dados! Pois não se sabe ao certo sua origem e nem tão pouco sua estrutura para prevê um destino para tal dado!