A linguagem adolescente pode dificultar a detecção do bullying online
Imagens Vitapix/Getty
Os jargões da internet da Geração Alfa estão mudando mais rápido do que professores, pais e modelos de IA conseguem acompanhar – potencialmente deixando as crianças vulneráveis a intimidação e assédio que adultos de confiança e sistemas de segurança baseados em IA não conseguem ver.
Manisha Mehta, uma estudante de 14 anos da Warren E. Hyde Middle School em Cupertino, Califórnia, e Fausto Giunchiglia da Universidade de Trento, Itália, coletou 100 expressões e frases populares entre a Geração Alfa – aqueles nascidos entre 2010 e 2025 – em jogos populares, mídias sociais e plataformas de vídeo.
A dupla então pediu a 24 voluntários com idades entre 11 e 14 anos, que eram colegas de classe de Mehta, para analisarem a frase junto com capturas de tela para contextualizar. Os voluntários explicam se entendem a frase, em que contexto ela é usada e se o uso da frase pode dar origem a preocupações de segurança ou interpretações perigosas. Eles também pediram aos pais, moderadores profissionais e quatro modelos de IA – GPT-4, Claude, Gemini e Llama 3 – que fizessem o mesmo.
“Sempre fui fascinado pela linguagem da Geração Alfa, porque é tão única, a maneira como as coisas se tornam relevantes e perdem sua relevância tão rapidamente, e tão rapidamente”, disse Mehta.
Entre os voluntários da Geração Alfa, 98 por cento compreendem o significado básico dos termos, 96 por cento compreendem o contexto em que os termos são utilizados e 92 por cento conseguem detectar quando os termos estão a ser utilizados para causar danos. Mas o modelo de IA só reconheceu o uso malicioso em cerca de 4 em cada 10 casos – variando de 32,5% para Llama 3 a 42,3% para Claude. Os pais e moderadores profissionais não se saíram melhor, concluindo que apenas um terço do uso era prejudicial.
“Eu esperava mais compreensão do que encontramos”, disse Mehta. “Isso é principalmente apenas suposições por parte dos pais.”
As frases comumente usadas pela Geração Alfa incluem algumas que têm vários significados dependendo do contexto. “Deixe-o cozinhar” pode ser um elogio sincero no streaming de jogos – ou uma provocação que implica que alguém está falando bobagem. “Kys”, que costumava significar “conhece-te a ti mesmo”, agora é lido como “mate-te” para algumas pessoas. Outra frase que pode mascarar a intenção rude é “isso é acústico”, usada para perguntar zombeteiramente se alguém é autista.
“A Geração Alfa é muito vulnerável online”, disse Mehta. “Acho que é muito importante que os LLMs sejam pelo menos capazes de entender o que está sendo dito, porque a IA se tornará mais comum no campo da moderação de conteúdo, e mais ainda no futuro.”
“Está claro que o LLM está mudando o mundo”, disse Giunchiglia. “Isso é verdadeiramente paradigmático. Acho que há questões fundamentais que precisam ser feitas.”
As descobertas foram apresentadas esta semana na Conferência sobre Justiça, Responsabilidade e Transparência da Association for Computing Machinery em Atenas, Grécia.
“Empiricamente, esta pesquisa mostra que pode haver grandes deficiências nos sistemas de moderação de conteúdo para analisar e proteger os jovens em particular”, disse Michael Veale na University College de Londres. “As empresas e os reguladores podem precisar de prestar atenção e reagir a isto para permanecerem acima da lei no número crescente de jurisdições que têm leis de plataforma destinadas a proteger os jovens.”
Tópico:



