A Wikipedia já está mostrando sinais de grande contribuição da IA
Calma Lee/Imagens SOPA/LightRocket via Getty Images
A chegada dos chatbots de IA marca uma linha divisória histórica onde o material online não pode ser totalmente confiável como sendo feito pelo homem, mas como as pessoas irão olhar para trás e ver esta mudança? Enquanto alguns procuram arquivar dados “não contaminados” da era pré-IA, outros dizem que o que precisamos de registar é o resultado da própria IA, para que futuros historiadores possam estudar como os chatbots evoluíram.
Calça Rajivum empresário e ex-diretor de tecnologia em ambos New York Times E Jornal de Wall Streetdisse que vê a IA como um risco para informações como notícias que fazem parte do registro histórico. “Tenho pensado sobre essa questão da ‘arqueologia digital’ desde o lançamento do ChatGPT, e ela está se tornando mais urgente a cada mês que passa”, diz Pant. “Atualmente, não existe uma maneira confiável de distinguir em grande escala o conteúdo gerado por humanos do material gerado por IA. Esta não é apenas uma questão acadêmica, ela afeta tudo, desde o jornalismo até a descoberta legal e a pesquisa científica.”
Para John Graham-Cumming na empresa de segurança cibernética Cloudflare, as informações geradas antes do final de 2022, quando o ChatGPT é lançado, são semelhantes às do aço de baixa resistência. Este metal, fundido antes do teste da bomba nuclear Trinity em 16 de julho de 1945, é inestimável para uso em instrumentos científicos e médicos complexos porque contém uma grande quantidade de contaminação radioativa da era das armas atômicas que cria ruído nas leituras.
Graham-Cumming criou um site chamado lowbackgroundsteel.ai para arquivar fontes de dados que não foram contaminadas pela IA, como downloads completos da Wikipédia a partir de agosto de 2022. A pesquisa mostrou que a Wikipédia atualmente mostra sinais de entrada massiva de IA.
“Houve um tempo em que fazíamos tudo sozinhos e, em algum momento, começamos a obter benefícios significativos com o sistema de chat”, disse ele. “Portanto, a ideia é – você pode encarar isso como contaminação ou como uma espécie de cofre – você sabe, chegamos aqui. E depois desse ponto, recebemos ajuda adicional.”
Marcos Graham executando a Wayback Machine no Internet Archive, um projeto que arquiva na Internet pública desde 1996, disse estar cético quanto à eficácia de qualquer novo esforço para arquivar dados, visto que o Internet Archive armazena até 160 terabytes de novas informações todos os dias.
Em vez de preservar a Internet pré-IA, Graham quer começar a criar um arquivo de resultados de IA para futuros investigadores e historiadores. Ele planeja começar a fazer 1.000 perguntas atuais todos os dias por meio do chatbot e salvar suas respostas. E como esta é uma tarefa tão grande, ele até usará a IA para fazê-la: a IA registra mudanças na produção da IA, para futura curiosidade humana.
“Você faz perguntas específicas e então obtém as respostas”, disse Graham. “E amanhã você fará a mesma pergunta e poderá obter uma resposta um pouco diferente.”
Graham-Cumming é rápido em apontar que não é anti-IA e que a preservação de informações geradas por humanos pode, na verdade, beneficiar os modelos de IA. Isso ocorre porque os resultados de IA de baixa qualidade realimentados no treinamento de novos modelos podem ter efeitos prejudiciais, levando ao que é conhecido como “colapso do modelo”. Evitar isso é um esforço que vale a pena, diz ele.
“Em algum momento, uma dessas IAs pensará em algo que nós, como humanos, não pensamos. Isso provará um teorema matemático, fará algo significativamente novo. E não tenho certeza se chamaria isso de contaminação”, disse Graham-Cumming.
Tópico: