Table of Contents
Fetching ...

Introdução a rede neural para Físicos

Gubio Gomes de Lima, Gustavo Miranda, Tiago de Souza Farias

TL;DR

O artigo discute como redes neurais podem ser integradas à física para modelar, resolver e interpretar sistemas dinâmicos, com foco em quatro aplicações do pêndulo simples. A abordagem contrasta redes puramente empíricas com métodos Physics-Informed (PINN) e técnicas de descoberta de dinâmicas (SINDy), destacando ganhos de eficiência, interpretação e redução de dados. Demonstra-se que PINNs incorporam a EDO do sistema na função de custo e reduzem a necessidade de grandes conjuntos de dados, enquanto SINDy busca modelos analíticos esparsos a partir de um espaço latente aprendido via autoencoder. No conjunto, o trabalho ilustra como a fusão de ML com conhecimento físico pode acelerar a compreensão de fenômenos clássicos, oferecer ferramentas de descoberta de leis e representar dados de maneira compacta, apontando para um novo patamar de modelagem científico-tecnológica.

Abstract

As técnicas de aprendizado de máquina emergiram no contexto científico e se desenvolveram como ferramentas poderosas para enfrentar uma ampla gama de desafios na sociedade. A integração dessas técnicas com a física tem conduzido a abordagens inovadoras na compreensão, controle e simulação de fenômenos físicos. Este artigo visa proporcionar uma introdução prática às redes neurais e seus conceitos fundamentais, destacando perspectivas recentes dos avanços na interseção entre modelos de aprendizado de máquina e sistemas físicos. Além disso, apresentamos um material prático para orientar o leitor em seus primeiros passos na aplicação de redes neurais para resolver problemas físicos. Como exemplo ilustrativo, fornecemos quatro aplicações de complexidades crescentes para o problema de um pêndulo simples, a saber: fit de parâmetros da Equação Diferencial Ordinária (EDO) do pêndulo para aproximação de ângulo pequeno; Physics Informed Neural Networks (PINNs) para encontrar soluções da EDO do pêndulo em ângulo pequeno; Autoencoders em conjunto de dados de imagens do pêndulo para estimação de dimensionalidade do espaço de parâmetros do problema físico; uso de arquiteturas Sparse Identification of Non-Linear Dynamics (SINDy) para descoberta de modelos e expressões analíticas para o problema do pêndulo não linear (ângulos grandes).

Introdução a rede neural para Físicos

TL;DR

O artigo discute como redes neurais podem ser integradas à física para modelar, resolver e interpretar sistemas dinâmicos, com foco em quatro aplicações do pêndulo simples. A abordagem contrasta redes puramente empíricas com métodos Physics-Informed (PINN) e técnicas de descoberta de dinâmicas (SINDy), destacando ganhos de eficiência, interpretação e redução de dados. Demonstra-se que PINNs incorporam a EDO do sistema na função de custo e reduzem a necessidade de grandes conjuntos de dados, enquanto SINDy busca modelos analíticos esparsos a partir de um espaço latente aprendido via autoencoder. No conjunto, o trabalho ilustra como a fusão de ML com conhecimento físico pode acelerar a compreensão de fenômenos clássicos, oferecer ferramentas de descoberta de leis e representar dados de maneira compacta, apontando para um novo patamar de modelagem científico-tecnológica.

Abstract

As técnicas de aprendizado de máquina emergiram no contexto científico e se desenvolveram como ferramentas poderosas para enfrentar uma ampla gama de desafios na sociedade. A integração dessas técnicas com a física tem conduzido a abordagens inovadoras na compreensão, controle e simulação de fenômenos físicos. Este artigo visa proporcionar uma introdução prática às redes neurais e seus conceitos fundamentais, destacando perspectivas recentes dos avanços na interseção entre modelos de aprendizado de máquina e sistemas físicos. Além disso, apresentamos um material prático para orientar o leitor em seus primeiros passos na aplicação de redes neurais para resolver problemas físicos. Como exemplo ilustrativo, fornecemos quatro aplicações de complexidades crescentes para o problema de um pêndulo simples, a saber: fit de parâmetros da Equação Diferencial Ordinária (EDO) do pêndulo para aproximação de ângulo pequeno; Physics Informed Neural Networks (PINNs) para encontrar soluções da EDO do pêndulo em ângulo pequeno; Autoencoders em conjunto de dados de imagens do pêndulo para estimação de dimensionalidade do espaço de parâmetros do problema físico; uso de arquiteturas Sparse Identification of Non-Linear Dynamics (SINDy) para descoberta de modelos e expressões analíticas para o problema do pêndulo não linear (ângulos grandes).

Paper Structure

This paper contains 13 sections, 64 equations, 17 figures, 2 tables.

Figures (17)

  • Figure 1: Ilustração das etapas de um Perceptron: $x_{ij}$ representa os elementos do vetor de entrada $\mathbf{x}_j$ (em verde) associado à amostra $j$, estes elementos são multiplicados um a um por pesos $w_i$ e somados a um bias$b$. O resultado desta soma (em azul) serve de argumento para uma função de ativação $f$ (em amarelo), produzindo a saída $\hat{y}$.
  • Figure 2: Banco de dados de Iris (Iris dataset), onde estão explicitas as primeiras 5 linhas do data-set, com informações sobre flores, como comprimento e largura da sépala ou da pétala.
  • Figure 3: Evolução das Fronteiras de Decisão do Perceptron no banco de dados Íris. Os dados estão inseridos em um gráfico de dispersão, projetado em duas das quatro dimensões dos dados. A unidade de medida de ambos os eixos é dada em centímetro. Na esquerda, painéis a) e c), escolhemos as dimensões dadas por comprimento da sépala (abcissas) e largura da sépala (ordenadas), na direita, painéis b) e d), as outras duas dimensões são o comprimento da pétala (abcissas) e largura da pétala (ordenadas). Em ambos o rótulo de aprendizado está em codificado na cor: vermelho para classe 0 e azul para classe 1. Nos gráficos de cima, a) e b), temos a classificação dada pelo Perceptron com inicialização aleatória, já nos gráficos de baixo, c) e d), temos a classificação após a otimização. Veja que, após a otimização, o hiperplano (chamado de fronteira de decisão, onde o Perceptron acusa o valor 0.5) separa os conjuntos de dados em ambas projeções, exceto por um ponto.
  • Figure 4: Comportamento do Perceptron para o problema de regressão ao longo de diferentes épocas de treinamento. No eixo horizontal temos os instantes de tempo ($t$) e no eixo vertical a predição da velocidade ($\hat{y}$) feita pelo Perceptron. Os pontos pretos representam os dados de treino, enquanto as linhas vermelha, verde e azul correspondem às estimativas do modelo nas épocas 0, 1,2 e 100, respectivamente.
  • Figure 5: Representação gráfica de uma configuração específica de rede neural utilizando grafo, composta por 2 entradas, 2 camadas ocultas com 3 neurônios cada e 2 saídas. Os círculos verdes, representam as entradas $x_{ji}$ e os pretos, as saídas $\hat{y}_{i}$. As camadas do meio, compostas pelos neurônios em vermelho e azul, são as camadas ocultas.
  • ...and 12 more figures