Início ESPECIAIS O modelo mundial Genie do Google agora pode simular ruas do mundo...

O modelo mundial Genie do Google agora pode simular ruas do mundo real com o Street View.

47
0

Todos nós abrimos o Street View no Google Maps para mostrar a um amigo como era a casa de nossa infância ou colocamos um pequeno ícone humano em uma rua de Paris para garantir que reservamos um hotel em um bairro legal. Imagine poder fazer isso de uma forma mais imersiva e interativa, onde você poderia realmente simular as ruas e seus arredores, e até mesmo fazer coisas como ajustar o clima ou ver como seria em um cenário “depois de amanhã”.

Este é um dos objetivos de integração mais recentes do Google. A partir de hoje, o Google DeepMind conecta o Street View ao Project Genie, o modelo mundial universal da empresa que pode criar uma variedade de experiências interativas. Este é um novo recurso lançado na conferência de desenvolvedores Google I/O.

“É um caso de uso de agente (e robótica) muito poderoso para os humanos brincarem, e esse sempre foi o tema do Genie”, disse Jack Parker-Holder, cientista pesquisador da equipe aberta da DeepMind, ao TechCrunch.

Ele deu o exemplo de um novo robô implantado em Londres, que mal vê o sol. Parker-Holder diz que o Genie pode simular os raros casos de luz solar refletida em uma casa vitoriana, garantindo que os raios não atinjam o robô.

“Ao mesmo tempo, você pode dizer: ‘Vou para Nova York, mas não posso ir nesta época do ano’”, continuou ele. “‘Vai nevar. Quero ver como ficam esses blocos na neve.'”

O Google coleta dados de visualização de ruas há 20 anos por meio de carros equipados com câmeras e indivíduos usando “mochilas de rastreamento”. A gigante da tecnologia coletou 280 bilhões de imagens em 110 países e sete continentes.

“O Street View oferece toneladas de imagens de todo o mundo”, disse Jack. “Você pode imaginar quão potencialmente poderoso é combinar uma rica fonte de informações e dados do mundo real com a capacidade de simular o mundo.”

O Google lançou seu mais recente modelo mundial, Genie 3, para uma prévia de pesquisa em agosto passado, e em janeiro abriu o acesso à ferramenta para assinantes do Google AI Ultra nos EUA, permitindo que os clientes criassem mundos de jogos interativos a partir de prompts de texto ou imagens. O objetivo é usar o Genie para experiências educacionais, jogos e treinamento robótico.

O Genie 3 já está ajudando a fornecer energia. Um dos simuladores da Waymo Treinar carros autônomos para “eventos muito raros”, como tornados ou encontros acidentais com elefantes. Adicionar dados do Street View aqui pode ajudar o Waymo a se preparar para o lançamento em mais cidades ao redor do mundo.

Waymo se expandiu para 11 cidades dos EUA e tem seus próprios simuladores nos quais confia para testar seus drivers de IA em várias cidades. Parker-Holder diz que a diferença do Genie é que tudo é feito do ponto de vista automotivo. O Street View não só permite simular um mundo ancorado em lugares reais, mas também permite mudar a sua perspectiva para outros tipos de agentes, como humanos ou robôs.

O Google está lançando o Street View do Genie para usuários selecionados do Ultra nos EUA a partir de hoje, e o acesso estará disponível em grande escala ao longo do tempo. Os usuários do Global Ultra terão acesso nas próximas semanas, empresa por empresa.

O objetivo dos pesquisadores é fazer com que esse novo recurso chegue às mãos do maior número de pessoas possível, segundo Diego Rivas, gerente de produto da DeepMind. Ele alertou que o Street View em particular e o Genie em geral ainda são experimentais, portanto há muito espaço para melhorias em termos de precisão.

A partir das amostras que a equipe do Google me mostrou, incluindo uma simulação subaquática da minha vizinhança, os resultados foram impressionantes e surpreendentes. Mas ainda não é uma qualidade realista de videogame. O modelo ainda não reconhece a física e, portanto, ainda não compreende causa e efeito. Por exemplo, na simulação de uma mulher correndo por entre árvores de Josué cobertas de neve, ela correu por entre cactos e arbustos.

Compare, por exemplo, o gerador de imagens Nano Banana do Google, que agora pode gerar textos perfeitos em infográficos, ou o gerador de vídeos Veo, que entende barcos de papel à deriva em correntes de água, fumaça subindo no ar e tecidos caindo sobre formas.

A física não está codificada nesses modelos. Como os seres vivos, eles aprendem intuitivamente ao longo do tempo através da observação passiva.

“Para esses tipos de modelos, eles podem estar de seis a 12 meses atrás do vídeo em termos de precisão e qualidade, então acho que esse é um problema que vamos resolver”, disse Parker-Holder.

O diretor do Google Maps, Jonathan Herbert, que se juntou à equipe do Street View como estagiário há 12 anos, disse que a Genie ainda não é capaz de reconstruir ruas com fidelidade. Ele acredita que a verdadeira inovação é a continuidade espacial da IA. Quando você gira 360 graus, a IA lembra e simula com precisão o ambiente atrás de você. A partir daí, o modelo pode construir novos ambientes em cima dele.

“Há muito tempo que pensamos em como podemos construir os melhores e mais ricos modelos do mundo com base em dados de visualização de rua”, disse Herbert. “Já é nossa ideia há algum tempo usar dados de mapas de novas maneiras e para novos tipos de pesquisa de IA.”

Se você comprar através dos links de nossos artigos, poderemos receber uma pequena comissão. Isto não afeta a nossa independência editorial.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui