O Reddit processou a empresa de IA Perplexity e três outras empresas, acusando-as de fazer um esforço enorme para coletar informações – e desta vez, está nos comentários.
O processo federal, aberto na quarta-feira em Nova York, nomeia quatro réus, incluindo a Perplexity, fabricante de um chatbot de IA com sede em São Francisco voltado para pesquisas na web; Oxylabs UAB, com sede na Lituânia; Empresa russa de domínios da web AWMProxy e SerpApi com sede no Texas.
O processo acusa os scrapers de usarem “táticas fraudulentas de evasão” para contornar protocolos de venda de dados a clientes para treinamento, e fez do Reddit um alvo principal “porque é uma das maiores e mais dinâmicas coleções de conversas humanas já criadas”. As alegações incluem violação de direitos autorais, concorrência desleal e enriquecimento sem causa.
“O Reddit tem regras”, diz o processo. “Isso não permite a comercialização não autorizada de conteúdo do Reddit, sem acordos expressos com proteções em vigor para garantir que o Reddit e os direitos de seus usuários sejam protegidos. Em suma, se as empresas de IA quiserem acessar os dados do Reddit legalmente, elas devem cumprir as políticas do Reddit.”
Reddit diz que empresas como OpenAI e Google fizeram exatamente isso, firmando acordos que permitem o acesso aos dados e ao mesmo tempo garantem a segurança de seus usuários. “Esse não é o caminho escolhido pelos Réus”, afirma o processo.
Em uma ação separada movida em junho, o Reddit processou a Anthropic por “explorar ilegalmente” seu conteúdo para treinar o modelo de inteligência artificial de Claude sem seu consentimento. A nova ação obtida pela TheWrap também tem como foco pequenas empresas que coletam dados de treinamento de chatbots da internet.
A Perplexity não respondeu imediatamente a um pedido de comentário, mas disse à AP que iria “lutar vigorosamente pelos direitos dos usuários de acessar o conhecimento público de forma livre e justa”.