Como revisor de geradores de imagem e vídeo de IA da CNET, uma das grandes coisas sobre este trabalho é decifrar as imagens hilariantes, bizarras e às vezes assustadoras que essas ferramentas geradoras emitem.
Não entenda mal. O software criativo de IA fez grandes avanços em um curto período de tempo. Criei lindas cenas de ficção científica com Midjourney, imagens de produtos de aparência realista com Stable Diffusion e implementei IA com ChatGPT. No entanto, nenhum serviço de IA é perfeito e observámos algumas tendências notáveis durante os nossos testes.
Mesmo com atualizações constantes, há algumas coisas que os geradores de imagens de IA simplesmente não conseguem acertar na primeira tentativa.
Alguns programas de imagem de IA fornecem ferramentas para editar esses erros, o que é ótimo. Recomendamos aproveitar isso sempre que possível. Para programas que não oferecem essas ferramentas ou que não resolvem seu problema, veja o que fazer a seguir:
Com base na minha experiência, compilei dicas testadas e comprovadas para otimizar suas imagens ajustando prompts e configurações. Para obter mais informações, confira nosso guia com os melhores geradores de imagens de IA e prompts eficazes de imagens de IA.
10 fotos mostrando onde os geradores de imagens de IA têm mais dificuldades
Ver todas as fotos
rosto humano e expressão
Expressões faciais precisas desafiam continuamente os geradores de IA. Olhos, dentes e sobrancelhas peculiares são alguns dos indicadores mais fortes de que uma imagem foi criada pela IA. Neste caso os resultados foram muito interessantes para mim. Não era nem totalmente utilizável. As garotas estão exibindo seus dentes de vampiro no estilo Halloween, enquanto o cara atrás está tendo um dia de cabelo ruim.

Mesmo no caso de personagens de desenhos animados ou irrealistas, os criadores têm dificuldade em controlar emoções e expressões. Esta imagem que escolhemos, criada por Dall-E 3, amplificou demais a mensagem e o resultado final foi dramático demais. Sou uma autoproclamada aberração por limpeza, mas não consigo imaginar ninguém ficando tão chateado com centenas de dólares em materiais de limpeza. Mesmo os melhores programas podem falhar e produzir resultados estranhos.
Como resolver o problema: É uma boa ideia reduzir o número de pessoas tentando renderizar, reduzindo assim a probabilidade de erros, e usar ferramentas de edição de pós-produção para solicitar ao serviço que selecione partes específicas da imagem que precisam ser recriadas ou modificadas. Escolher um adjetivo mais brando (“zangado” em vez de “zangado”) pode ajudar a direcionar seu serviço na direção certa.
Personagens icônicos, marcas registradas e logotipos reconhecíveis

Por vários motivos, os geradores de imagens de IA raramente produzem logotipos precisos, marcas registradas conhecidas ou outros caracteres reconhecíveis. Isso ocorre porque normalmente existem preocupações legais significativas sobre as empresas que permitem que materiais de sua marca ou propriedade intelectual sejam usados em serviços de IA. Também pode ser porque o logotipo ou marca que você deseja incluir não está nos dados de treinamento do gerador e, portanto, o gerador não entende sua solicitação.
Duas exceções recentes são os novos recursos de criação de imagens no Google Pixel 9 e Pixel 9 XL. Graças ao Gemini AI, os especialistas móveis do Google o usaram para criar imagens contendo representações precisas do Mickey Mouse e do Pikachu. A outra exceção são alguns usuários pagos do X (anteriormente Twitter) que relatam que podem usar o chatbot Grok do site de mídia social para: Mickey realista e figuras políticas humanas. Esta imagem ainda não é uma renderização perfeita, mas está bem próxima.
Como resolver o problema: Provavelmente não, mas a vantagem é que é muito mais provável que você evite um processo por violação de direitos autorais. Se você encontrar esse problema, pode ser uma boa ideia revisitar seu conceito de design para ver se você consegue transmitir o mesmo ponto sem usar um nome ou logotipo de empresa específico. Você realmente precisa do logotipo do TikTok ou só precisa de um telefone que reproduza vídeos verticais, por exemplo?
Elementos redundantes e complexos

Às vezes, o gerador pode não funcionar se houver muitos elementos sobrepostos ou complexos na imagem. Esse problema não acontece com frequência nos melhores programas de imagens de IA, mas mesmo os melhores programas falham em algum momento. Com esta imagem de Leonardo, minha biblioteca dos sonhos é arruinada por uma escada rolante que desaparece no caminho.

Da mesma forma, esta imagem fotorrealista da cozinha parece boa à primeira vista, mas se você olhar novamente ou aumentar o zoom rapidamente, verá um texto sem sentido impresso no livro de receitas, e o livro em si parece ter duas lombadas e três seções. Imagens como esta mostram como pode ser frustrante criar imagens de IA. Mesmo se você achar que tem um vencedor, uma pequena falha o tornará inutilizável.
Como resolver o problema: simplifique suas solicitações ou use ferramentas de edição pós-criação para encontrar e corrigir problemas. Às vezes, mudar a estética também pode ajudar. Esses problemas geralmente aparecem ao tentar criar imagens fotorrealistas ou de banco de imagens. Se o seu serviço oferece uma ferramenta específica de edição de áreas, use-a para selecionar áreas suspeitas e peça ao gerador para remover o conteúdo delas.
Edição excessiva e alucinações

A marca registrada de um bom gerador de imagens de IA é sua capacidade de produzir imagens com poucos erros ou ilusões, ao mesmo tempo que fornece as ferramentas certas para resolver os problemas que inevitavelmente surgem, mas nem todos os serviços fazem isso. Neste exemplo do Midjourney, a imagem de um time de futebol comemorando uma vitória foi editada diversas vezes, mas não temos ideia de como esse resultado final surgiu e não temos ideia do que está acontecendo com os blobs que deveriam ser jogadores do lado direito da imagem. Honestamente, acho que Midjourney também não sabia.
Como resolver o problema: Ao editar imagens de IA, às vezes menos é mais. Não tenha medo de descartar seu lote atual de imagens e começar de novo. Ao modificar seus prompts, você pode resolver proativamente problemas maiores, de modo que só terá que resolver problemas menores posteriormente.
Geradores de IA ainda exigem trabalho humano

Não tenho dúvidas de que as empresas por detrás destes geradores de IA estão a trabalhar para eliminar estes problemas e melhorar a qualidade dos seus modelos. As imagens atualmente incompletas mostram mais uma vez que embora a tecnologia esteja melhorando, ela não é perfeita. A minha esperança é que muitos destes serviços procurem soluções para estes problemas, uma vez que enfrentam problemas semelhantes.
Por último, deixe-me lembrá-lo de que, ao compartilhar uma imagem, é uma prática recomendada declarar ou reconhecer que a imagem foi criada pela IA. À medida que as imagens de IA ficam melhores e parecem mais realistas, torna-se mais importante do que nunca distinguir as obras de arte geradas por IA de outros tipos de mídia.
Para obter mais informações, confira nossos conselhos sobre como escrever os melhores prompts de imagens de IA e nossas principais opções para geradores de imagens de IA.



