Início ANDROID O gerador de imagens AI baseado em luz quase não usa energia

O gerador de imagens AI baseado em luz quase não usa energia

14
0

Arte colorida no estilo Vincent Van Gogh gerada por modelos de difusão convencionais (à esquerda em cada conjunto de três) e geradores de imagem óptica (à direita)

Shiqi Chen et al. 2025

Os geradores de imagens de IA que utilizam luz para produzir imagens, em comparação com hardware de computação convencional, podem consumir centenas de vezes menos energia.

Quando os modelos de inteligência artificial geram imagens a partir de texto, geralmente usam um processo chamado difusão. A IA primeiro vê um grande número de imagens e como destruí-las usando ruído estatístico e, em seguida, codifica esses padrões em um conjunto de regras. Ao receber uma imagem nova e com ruído, ele pode usar essas regras para fazer a mesma coisa ao contrário: por meio de várias etapas, ele trabalha em direção a uma imagem coerente que corresponda a uma consulta de texto específica.

Para imagens realistas e de alta resolução, a difusão utiliza muitas etapas sequenciais que requerem níveis significativos de poder computacional. Em abril, Relatórios OpenAI que seu novo gerador de imagens gerou mais de 700 milhões de imagens em sua primeira semana de operação. Atender a esta escala de demanda requer grandes quantidades de energia e água para alimentar e resfriar as máquinas que alimentam o modelo.

Agora, Aydogan Ozcan da Universidade da Califórnia, em Los Angeles, e colegas desenvolveram um gerador de imagens baseado em difusão que funciona usando feixes de luz. Embora o processo de codificação seja digital e exija pouca energia, o processo de decodificação é totalmente baseado em luz e não requer poder de computação.

“Ao contrário dos modelos de difusão digital que requerem centenas a milhares de passos iterativos, este processo resulta na criação de uma imagem num único instantâneo, não necessitando de computação adicional além da codificação inicial”, disse Ozcan.

O sistema primeiro usa um codificador digital treinado com conjuntos de dados de imagens disponíveis publicamente, que pode produzir imagens estáticas que podem ser convertidas em imagens. Então, eles usaram esse codificador com uma tela de cristal líquido chamada modulador de luz espacial (SLM), que poderia imprimir fisicamente essa estática em um feixe de laser. Quando o feixe de laser passa pela segunda decodificação SLM, ele produz imediatamente a imagem desejada na tela que é gravada pela câmera.

Ozcan e sua equipe usaram seu sistema para produzir imagens em preto e branco de objetos simples, como os números de 1 a 9 ou roupas básicas, que foram usadas para testar o modelo de difusão, bem como imagens coloridas no estilo de Vincent Van Gogh. Os resultados parecem semelhantes aos produzidos por geradores de imagens convencionais.

“Este pode ser o primeiro exemplo em que uma rede de nervos ópticos não é apenas um brinquedo de laboratório, mas também uma ferramenta computacional capaz de fornecer resultados de valor prático”, disse Alexandre Lvovsky na Universidade de Oxford.

Para imagens no estilo Van Gogh, o sistema consome apenas alguns milijoules de energia por imagem, principalmente para telas de cristal líquido, em comparação com as centenas ou milhares de joules exigidos pelos modelos de difusão convencionais. “Para colocar isto em perspectiva, o consumo de electricidade deste último é equivalente à quantidade de electricidade consumida por uma chaleira eléctrica num segundo, enquanto o consumo de uma máquina óptica é equivalente a um milionésimo de segundo”, disse Lvovsky.

Embora o sistema precisasse ser adaptado para funcionar em data centers como um substituto para ferramentas de geração de imagens amplamente utilizadas, Ozcan disse que poderia ser usado em dispositivos eletrônicos vestíveis, como óculos de IA, devido aos seus baixos requisitos de energia.

Tópico:

Source link