Início ANDROID É hora de determinar o sucesso ou o fracasso dos sistemas de...

É hora de determinar o sucesso ou o fracasso dos sistemas de rotulagem de IA

30
0

Descobriremos se os sistemas projetados para facilitar a detecção de deepfakes e conteúdo gerado por IA estão realmente prontos para serem destruídos. As credenciais de conteúdo SynthID e C2PA, duas tecnologias diferentes para marcar invisivelmente arquivos de imagem, vídeo e áudio com informações sobre suas origens, estão obtendo sua maior expansão até o momento e, com ela, uma oportunidade de virar a maré contra falsificadores de IA não rotulados que enganam as pessoas online.

Ontem, em sua conferência I/O, o Google anunciou que a capacidade de verificar se uma imagem carrega uma tag SynthID – um sistema de marca d’água invisível aplicado ao conteúdo gerado pelos modelos de IA do Google – está chegando ao Chrome e à Pesquisa. Isso é importante porque o Chrome, é claro dominar quota de mercado global para navegadores web e motores de pesquisa, pelo que as ferramentas de verificação de IA são cada vez mais utilizadas. Isto também simplifica o processo de inspeção; se você deseja verificar uma imagem em busca de marcadores SynthID, espera-se que você a carregue no aplicativo Gemini.

Não só isso, mas a interface de verificação do Google também fará isso Também verifique se este arquivo contém informações C2PA – metadados de proveniência incorporados ao conteúdo no momento da criação para nos dizer como ele foi criado ou manipulado e se ferramentas de IA foram usadas durante o processo. Essa adoção do C2PA permite que os usuários verifiquem imagens suspeitas em uma interface, em vez de alternar entre o aplicativo Gemini e um portal de verificação C2PA dedicado, pois os arquivos podem ter apenas um tipo de rótulo ou nenhum.

Agora o Google oferece o melhor dos dois mundos.
Imagem por The Verge

Este é o esforço colaborativo que esperávamos. Embora os dois sistemas funcionem de maneira diferente, tanto o Google quanto a Content Authenticity Initiative (que existe para promover o padrão C2PA) fizeram afirmações semelhantes sobre o que seria necessário para que funcionassem: que todos pudessem participar. Isto significa que mais modelos de IA precisam incorporar esses dados, e as plataformas on-line onde as falsificações de IA são compartilhadas com mais frequência precisam exibir essas informações com destaque. Para este último, ter ferramentas de verificação integradas nos navegadores pode servir como uma solução em sites que não verificam ou apresentam metadados de IA aos seus usuários.

A OpenAI também está envolvida nesta expansão, anunciando ontem que agora irá incorporar SynthID em imagens geradas por ChatGPT, Codex e API OpenAI. A empresa já inclui metadados C2PA no conteúdo que produz, mas descobri que esses metadados são frequentemente removidos quando postados em outras plataformas. A própria OpenAI também quer reduzir as expectativas em relação ao C2PA, apesar de ser um membro diretor do C2PA e agora reafirmar seu compromisso com o padrão. Aqui está o que OpenAI disse sua página de ajuda C2PAantes que isso aconteça atualizado para incluir SynthID Ontem:

“Metadados como C2PA não são uma panacéia para o problema de proveniência. Os metadados podem ser facilmente removidos acidentalmente ou intencionalmente. Por exemplo, a maioria das plataformas de mídia social hoje removem metadados de imagens carregadas, e ações como tirar uma captura de tela também podem removê-los. Portanto, imagens sem esses metadados podem ou não ter sido geradas pelo ChatGPT ou por nossa API.”

Para algo que é considerado a melhor tecnologia de autenticidade de conteúdo, parece muito ridículo. Até o Google descreve o C2PA como Que padrões da indústria, e isso está acontecendo submetido a governos globais como uma solução para atender aos requisitos de transparência e rotulagem da IA. Mas mesmo que esteja aumentando adotado por fornecedores de IA, hardware e softwareRaramente o vi usado com sucesso para verificar a falsificação de IA em estado selvagem. Quando comparado ao SynthID, o SynthID parece mais poderoso porque não pode ser facilmente removido – dado o quão limitado é seu alcance em comparação ao C2PA, lembro-me de vários casos em que verificadores de fatos e agências de mídia mencionaram sua utilidade para desmascarar deepfakes online.

Tanto o C2PA quanto o SynthID podem trabalhar juntos para criar uma rede de segurança mais ampla. Esta indústria não se beneficiará das guerras de padrões de verificação, mas o Google tem aqui uma oportunidade clara de provar se seu sistema é mais confiável e chamar a atenção do C2PA. Para evitar que isto aconteça, o C2PA precisa de provar que pode realmente ser usado para revelar a origem do conteúdo que vemos online.

Essa oportunidade surgiu: o Google anunciou ontem que o Meta começará a usar metadados C2PA para marcar imagens no Instagram que foram capturadas pela câmera. Meta não respondeu às nossas perguntas sobre como será a aparência ou quais câmeras suportará, embora eu assuma que isso envolverá um rótulo que diz algo como “tirado no Pixel 10”, semelhante à nota “enviado do meu iPhone” aplicada aos e-mails. Isso ajudará efetivamente os usuários do Instagram a distinguir fotos “reais” de falsificações convincentes de IA, que é o que o chefe do Instagram, Adam Mosseri, previu para o futuro em relação à necessidade de deixar de “presumir que o que vemos é real por padrão”.

Se a rotulagem funcionar, é verdade. O Instagram já verifica as imagens em busca de informações C2PA, e seus esforços para rotular o conteúdo gerado por IA já colocaram a plataforma em maus lençóis depois de aplicar rótulos de IA às imagens que os próprios fotógrafos disseram ter tirado.

Também não vou me apressar em elogiar o Google por esta colaboração. A empresa prega a importância da transparência da IA ​​e do combate aos deepfakes digitais, ao mesmo tempo que desenvolve tecnologia usada para enganar as pessoas. Esta empresa se posiciona como fornecedora e solução. Eu poderia perdoar se o SynthID fizesse uma diferença real na luta contra os deepfakes, mas não teria muita esperança dada a escala do problema.

Robustos ou não, SynthID e C2PA só podem detectar marcas d’água se elas forem adicionadas primeiro, e duvido que muitos dos modelos de código aberto usados ​​para gerar conteúdo deepfake verdadeiramente malicioso adotem esses sistemas. A proveniência nunca será uma solução perfeita, mas agora o Google e o C2PA têm a chance de provar que não é uma perda de tempo.

Siga tópicos e autores desta história para ver mais coisas semelhantes em seu feed inicial personalizado e para receber atualizações por e-mail.


Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui