Início ANDROID Reddit está processando Perplexity por supostamente copiar seu conteúdo para alimentar a...

Reddit está processando Perplexity por supostamente copiar seu conteúdo para alimentar a IA

11
0

O Reddit está processando a Perplexity e três “provedores de serviços de coleta de dados” para “impedir a evasão ilegal e em escala industrial da proteção de dados perpetrada por um grupo de malfeitores que farão de tudo para obter conteúdo valioso protegido por direitos autorais no Reddit”. de acordo com sua reclamação.

A empresa comparou as empresas de coleta de dados – SerpApi, Oxylabs e AWMProxy – a “pretensos ladrões de bancos” que “sabendo que não podem arrombar cofres de bancos, em vez disso arrombam caminhões blindados que transportam dinheiro”. O Reddit alega que a Perplexity é cliente de “pelo menos uma” empresa de coleta de dados, dizendo que eles “aparentemente farão qualquer coisa para colocar as mãos do Reddit nos dados que ele precisa desesperadamente para alimentar seu ‘mecanismo de resposta’ – isto é, qualquer coisa além de celebrou um acordo diretamente com o Reddit, assim como alguns de seus concorrentes.”

De acordo com o processo, o Reddit enviou uma carta de cessação e desistência à Perplexity em maio de 2024 “exigindo que eles parassem de coletar dados do Reddit”. Embora a Perplexity tenha dito ao Reddit na época que não estava usando o conteúdo do Reddit para treinar modelos de IA e honraria o robots.txt do Reddit, depois dessa carta, o volume de citações do Reddit sobre a Perplexity realmente aumentou. O Reddit também cria postagens que só podem ser rastreadas pelo Google e, “dentro de algumas horas”, o Obfuscation “gera o conteúdo” dessas postagens, disse a empresa.

“A única maneira pela qual a Perplexity poderia ter obtido tal conteúdo do Reddit e então usá-lo em seu ‘mecanismo de resposta’ seria se a Perplexity e/ou seus co-réus capturassem os SERPs do Google para esse conteúdo do Reddit e a Perplexity então rapidamente alimentasse esses dados em seu mecanismo de resposta”, escreveu o Reddit.

“As empresas de IA estão competindo por conteúdo humano de qualidade – e a pressão alimentou uma economia de ‘lavagem de dados’ em escala industrial”, disse Ben Lee, diretor jurídico do Reddit, em comunicado. “Os raspadores ignoram as salvaguardas tecnológicas para roubar dados e depois vendê-los a clientes ávidos por materiais de treinamento. O Reddit é um alvo principal porque é uma das maiores e mais dinâmicas coleções de conversas humanas já criadas.

“Os réus Oxylabs UAB, AWM Proxy e SerpAI – um raspador de dados lituano, uma antiga botnet russa e uma empresa que anuncia abertamente táticas fraudulentas de evasão – são exemplos claros desse comportamento ilegal”, disse Lee. “Incapazes de copiar o Reddit diretamente, eles mascararam suas identidades, esconderam suas localizações e disfarçaram seus web scrapers para roubar conteúdo do Reddit da Pesquisa Google. A confusão era que os clientes dispostos a pelo menos um desses scrapers optaram por comprar os dados roubados em vez de firmar um acordo legítimo com o próprio Reddit.

“A Perplexity ainda não recebeu uma ação judicial, mas sempre lutaremos pelos direitos dos usuários de acessar o conhecimento público de forma livre e justa”, disse Jesse Dwyer, diretor de comunicações da Perplexity. Borda. “Nossa abordagem permanece baseada em princípios e responsável, pois fornecemos respostas factuais com IA precisa e não toleraremos ameaças à transparência e ao interesse público.”

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui