No ano passado, falsifiquei o bicho de pelúcia do meu filho para parecer que suas renas de pelúcia estavam de férias.
Foi uma experiência para ver se eu conseguia recriar os eventos retratados nos anúncios Gemini veiculados pelo Google, e nunca mostrei ao meu filho de quatro anos o vídeo das aventuras da rena Buddy. Mas foi um exercício revelador que me fez pensar muito sobre a diferença entre diversão inofensiva com IA generativa e desleixo total. Talvez o diagrama de Venn seja um círculo perfeito! Provavelmente não. Mas o que tenho certeza é que as ferramentas para criar vídeos realistas são surpreendentemente boas e exigem muito pouco esforço e conhecimento. E essa tendência continuou na era Omni Gemini.
Omni é uma nova série de modelos generativos que foram pensados para um dia serem capazes de transformar qualquer tipo de entrada – foto, vídeo, texto – em outra coisa. Mas para começar, é só fazer vídeos. Omni Flash é o primeiro modelo lançado pelo Google, agora disponível na plataforma de criação e edição de vídeo AI da empresa, Flow. Você ainda pode usar o modelo anterior, o Veo, se quiser, mas o Omni melhora o Veo de várias maneiras.
Com Omni, você pode enviar vídeos e usá-los junto com comandos de texto como ponto de partida para criações geradas por IA. O Google também afirma que Omni incorpora mais conhecimento do mundo real ao produzir vídeos e, como resultado, pode fazer um trabalho melhor para manter a consistência dos personagens nos vídeos. Só há uma maneira de realmente descobrir se a afirmação é verdadeira: trouxe de volta o AI Buddy para embalar uma pequena sacola feita por IA para outra aventura.
Os resultados são tão variados que chegam a ser confusos. Alguns deles são ótimos – muito mais consistentes e alinhados com meus comandos do que quando testei o Veo há cinco meses. Mas mesmo os melhores clipes que Omni fez para mim ainda tinham alguns sustos de salto de IA, como quando Buddy muda repentinamente de orientação enquanto está saltando de paraquedas.
No resto do vídeo, dei liberdade artística ao Omni. “Faça uma montagem de Buddy fazendo as malas para as férias e embarcando em um navio de cruzeiro para uma escapadela tropical. A atmosfera é fofa e alegre. Buddy coloca algo fofo em sua mala que será reproduzido no clipe.” Lá Buddy embalou um pote de mel; mais tarde no clipe, ela o pega como se fosse um frasco de protetor solar. “Uh oh”, diz a personagem enquanto borrifa mel nas unhas dos pés.
Para ser honesto, não é nem um pouco ruim. Exceto o frasco de mel, que muda constantemente ao longo do vídeo, de uma jarra para um borrifador transparente cheio de água e depois de volta para um frasco squeeze cheio de mel. E não consigo nem explicar como o modelo gera o quadro final do vídeo – é como se ele simplesmente cospisse um monte de elementos da sequência que acabou de criar.
Você pode usar dicas baseadas em texto para sugerir edições em seus vídeos, e darei crédito ao Google: funcionou melhor com Omni do que quando testei o Veo 3. Mas os resultados são ruim com Veo – é tão ruim que acho mais fácil criar um novo vídeo do zero toda vez que quero mudar alguma coisa. Na verdade, o Omni aceitará suas edições, mas os resultados nem sempre corresponderão.
Enfatizei as reações faciais de Buddy em seus clipes de férias e os resultados parecem estranhos. Isso também dará chifres a Buddy com o tempo, o que ele não tem. Amigos são um QueridoMuito obrigado. Quando pedi a ele para remover os chifres que apareciam em uma cena, ele atendeu – e depois adicionou os chifres em todas as outras cenas.
O problema é que nada disso é de graça. Fazer um vídeo requer créditos, variando de 15 a 40 créditos com base na duração da cena e no “material” com o qual você começa. Uma rodada de edição custa 40 créditos. Tenho o plano AI Pro de US$ 20 por mês que vem com 1.000 créditos por mês. Depois de cerca de 20 clipes gerados com alguma edição, caí para 145. Se você tem uma ideia específica do vídeo que deseja que o Omni faça, pode ser necessário considerar muitas idas e vindas com o modelo para obter um vídeo que esteja próximo da sua visão.
Posso dizer honestamente que não estava preparado para o que vi
Um dos pontos fortes do Omni é adicionar material gerado por IA a vídeos reais, então dei um tempo ao Buddy e fingi. Partindo de um vídeo de selfie com expressão neutra, pedi à Omni que fizesse um vídeo meu comendo um prato de espaguete, sentado em um assento de avião e parado em frente à Torre Eiffel enquanto mordia uma baguete. E posso dizer honestamente que não estava preparado para o que vi.
Existe uma IA que é contada no meu vídeo deepfake. O tilintar do garfo batendo na tigela de macarrão foi um pouco artificial. Há uma mulher no fundo do vídeo do avião que aparece duas vezes. Mas apesar dos pequenos aborrecimentos e sentimentos estranhos sobre as coisas, eles são muito convincentes.
Mostrei ao meu marido o clipe de macarrão; ele sabia que eu estava testando uma ferramenta de vídeo de IA, mas não contei a ele quais cenas a IA estava gerando. Sem saber o que a IA descobriu sobre isso, ele pensou que eu estava sentado na frente da câmera comendo macarrão e disse que a única pista que tinha era que a tigela parecia estranha. Comer macarrão em si parece real o suficiente para ser convincente Meu marido. Um cara que basicamente me viu na vida real todos os dias durante a última década.
Meus outros deepfakes têm graus variados de “bons o suficiente para enganar as pessoas nas redes sociais”. Alguns dos clipes da Torre Eiffel parecem um pouco de desenho animado, mas um é convincente o suficiente para que você precise assisti-lo novamente algumas vezes para descobrir que é IA. EU Eu sabia que não era eu quando minha IA se virou e me mostrou seu cabelo preso em um rabo de cavalo. Mas não tenho certeza se outras pessoas sabem a diferença, e isso me faz sentir estranho.
Certamente estamos nas profundezas do vale misterioso
Para ser sincero, estou um pouco cansado de tudo isso. Fiquei surpreso quando testei o Veo 3 com o realismo que ele produziu. Fiquei surpreso com o quão fácil se tornou retratar repetidamente pessoas falsas em fotos falsas nos últimos anos. Eu provavelmente deveria ter ficado surpreso com o Omni também, e acho que fiquei, mas sua liderança desapareceu.
Criar obras-primas cinematográficas geradas por IA ainda não é tão fácil quanto o Google gostaria que você acreditasse. Mas o Omni melhora o Veo de várias maneiras reconhecíveis. Se você tiver uma conta do Google e um cartão de crédito, poderá gravar um vídeo seu sentado em casa e fazer parecer que está em um vôo para Maui com o mínimo de esforço. Não creio que estejamos no “sopé da singularidade”, mas estamos certamente nas profundezas do vale misterioso.
Todas as imagens e vídeos desta história foram gerados pelo Google Gemini.



