Peça à ferramenta de vídeo de IA do Google para criar um filme de um médico que viaja no tempo voando ao redor de uma cabine telefônica azul britânica e o resultado se assemelha, sem surpresa, a Doctor Who.
E se você pedir à tecnologia da OpenAI para fazer o mesmo, acontece algo semelhante. O que há de errado nisso, você pode estar pensando?
A resposta pode ser um dos maiores problemas enfrentados pelos gestores de IA à medida que a sua tecnologia que define o tempo se torna cada vez mais omnipresente nas nossas vidas.
A inteligência artificial generativa do Google e da OpenAI pretende ser exatamente isso – generativa, o que significa que desenvolve novas respostas para as nossas perguntas. Peça um médico que viaja no tempo e você receberá um que o sistema deles criou. Mas quanto dessa produção é original?
O problema é descobrir até que ponto ferramentas como o ChatGPT da OpenAI e o seu gerador de vídeo Sora 2, e o Gemini da Google e a sua ferramenta de vídeo Veo3, dependem da arte de outra pessoa para criar as suas próprias invenções, e se a utilização de material de origem, digamos, da BBC é uma violação dos direitos de autor da emissora.
Profissionais e indústrias criativas, incluindo escritores, realizadores de cinema, artistas, músicos e editores de jornais, estão a exigir compensação pela utilização do seu trabalho para construir estes modelos – e que a prática cesse até que tenham dado permissão.
Eles também afirmam que seu trabalho está sendo usado sem remuneração para construir ferramentas de IA que criam obras em concorrência direta com as suas. Alguns editores de notícias, incluindo Financial Times, Condé Nast e Guardian Media Group, editor do Guardian, celebraram acordos de licenciamento com a OpenAI.
Uma questão fundamental são os modelos cuidadosamente guardados dos gigantes da IA, que sustentam os seus sistemas e tornam difícil saber o quanto a sua tecnologia depende do trabalho de outros criativos. No entanto, uma empresa afirma poder esclarecer a questão.
A plataforma de tecnologia norte-americana Vermillio rastreia o uso on-line da propriedade intelectual de um cliente e afirma que é possível rastrear, aproximadamente, a porcentagem que uma imagem gerada por IA se baseou em material protegido por direitos autorais pré-existente.
Em uma pesquisa realizada para o Guardian, Vermillio criou uma “impressão digital neural” para diferentes peças de trabalhos protegidos por direitos autorais, antes de pedir às IAs que criassem imagens semelhantes.
Para Doctor Who, ele inseriu um prompt na popular ferramenta Veo3 do Google, perguntando: “Você pode criar um vídeo de um médico que viaja no tempo voando em torno de uma cabine telefônica azul britânica”.
O vídeo de Doctor Who corresponde a 80% da impressão digital de Doctor Who de Vermillio, sugerindo que o modelo do Google se baseou fortemente em trabalhos protegidos por direitos autorais para produzir sua produção.
O vídeo da OpenAI, retirado do YouTube e com marca d’água da ferramenta Sora da OpenAI, correspondeu a 87%, segundo Vermillio.
Outros exemplos criados por Vermillio para o Guardian usam uma impressão digital neural de James Bond. Um vídeo Veo3 de James Bond, criado com a pergunta: “Você consegue criar uma cena famosa de um filme de James Bond?”, teve uma correspondência de impressão digital neural de 16%.
Um vídeo de Sora, retirado da web aberta, correspondeu 62% à impressão digital de Vermillio Bond, enquanto as imagens do agente criado por Vermillio usando ChatGPT e o modelo Gemini do Google tiveram 28% e 86% de correspondências, respectivamente, a partir de uma citação que cita: “Um famoso agente duplo ‘0’ do MI5 vestindo um smoking de um famoso filme de espionagem de Fleming”.
O exemplo de Vermillio também mostrou fortes correspondências com Jurassic Park e Frozen para modelos OpenAI e Google.
Os modelos generativos de IA, o termo para a tecnologia que sustenta ferramentas poderosas como o chatbot ChatGPT da OpenAI, bem como Veo3 e Sora, devem ser treinados em grandes quantidades de dados para gerar suas respostas.
A principal fonte desta informação é a web aberta, que contém uma ampla gama de dados, desde o conteúdo da Wikipédia ao YouTube, artigos de jornais e arquivos de livros online.
A Anthropic, uma empresa líder em IA, concordou em pagar US$ 1,5 bilhão (£ 1,1 bilhão) para resolver uma ação coletiva movida por autores que afirmam que a empresa pirateou seu trabalho para treinar seu chatbot. Um banco de dados pesquisável das obras usadas em seus modelos apresenta uma série de nomes conhecidos, incluindo o autor do Código Da Vinci, Dan Brown, a autora do Labirinto, Kate Mosse, e a criadora de Harry Potter, JK Rowling.
Kathleen Grace, diretora de estratégia da Vermillio, cujos clientes incluem a Sony Music e a agência de talentos WME, disse: “Todos nós podemos ganhar se apenas dermos um golpe e descobrirmos uma maneira de compartilhar e rastrear conteúdo. Isso encorajaria os detentores de direitos autorais a liberar mais dados para empresas de IA e daria às empresas de IA acesso a conjuntos de dados mais interessantes. Em vez de dar todo o dinheiro para cinco empresas de IA, seria um ótimo sistema”.
No Reino Unido, a comunidade artística lançou uma campanha veemente contra as propostas governamentais de revisão da lei de direitos de autor a favor de empresas de IA, que poderiam ser autorizadas a utilizar trabalhos protegidos por direitos de autor sem primeiro pedir autorização; em vez disso, os detentores de direitos autorais teriam que sinalizar que queriam “excluir” o processo.
Um porta-voz do Google disse: “Não podemos falar sobre os resultados de ferramentas de terceiros, e nossas políticas e termos de serviço de IA generativa proíbem a violação de direitos de propriedade intelectual”.
No entanto, o YouTube, de propriedade do Google, afirma que seus termos permitem que o Google use o trabalho dos criadores para criar modelos de IA. Em setembro, o YouTube disse: “Usamos o conteúdo enviado ao YouTube para melhorar a experiência do produto para criadores e espectadores no YouTube e no Google, inclusive por meio de aprendizado de máquina e aplicativos de IA”.
A OpenAI disse que seus modelos são treinados em dados disponíveis publicamente, um processo que afirma ser consistente com a doutrina legal dos EUA de uso justo, que permite o uso de trabalhos protegidos por direitos autorais sem a permissão do proprietário em determinadas circunstâncias.
O grupo da indústria Motion Picture Association pediu à OpenAI que tome “ações imediatas” para resolver questões de direitos autorais em torno da versão mais recente do Sora. O Guardian viu vídeos de Sora apresentando personagens protegidos por direitos autorais de programas como Bob Esponja Calça Quadrada, South Park, Pokémon e Rick e Morty. A OpenAI disse que iria “cooperar com os detentores de direitos para bloquear personagens de Sora a seu pedido e responder aos pedidos de remoção”.
Beeban Kidron, um colega na Câmara dos Lordes e uma figura importante na luta contra as propostas do governo do Reino Unido, disse que era “hora de parar de fingir que o roubo não está acontecendo”.
“Se Doctor Who e 007 não podem ser protegidos, que esperança há para um artista que trabalha por conta própria e não tem recursos ou experiência para perseguir empresas globais que roubam seu trabalho, sem permissão e sem pagamento?”