Início ANDROID Teste cerebral clássico expõe a maior fraqueza da inteligência artificial

Teste cerebral clássico expõe a maior fraqueza da inteligência artificial

38
0

Os sistemas de inteligência artificial podem escrever artigos, responder perguntas e resolver problemas complexos. Mas uma nova pesquisa sugere que eles podem ter dificuldade em fazer o que os humanos fazem todos os dias: concentrar-se na tarefa que têm em mãos quando há distrações.

Pesquisadores liderados por Suketu Patel colocaram vários modelos importantes de inteligência artificial em um famoso experimento psicológico chamado tarefa Stroop. Os resultados revelam diferenças significativas entre a forma como os sistemas de inteligência artificial processam a informação e a forma como o cérebro humano gere a atenção.

O que é a tarefa Stroop?

A Tarefa Stroop é um teste psicológico clássico usado há décadas para estudar atenção, concentração e autocontrole.

No teste, palavras coloridas como “vermelho”, “azul” ou “verde” foram exibidas em tinta colorida. Às vezes, as palavras e as cores da tinta combinam. Por exemplo, a palavra “vermelho” pode aparecer em tinta vermelha. Às vezes eles são conflitantes, como a palavra “vermelho” impressa em tinta azul.

Os participantes foram solicitados a nomear a cor da tinta, em vez de lerem as palavras eles próprios.

Isto parece simples, mas representa um desafio porque ler palavras isoladas é um hábito automático para a maioria das pessoas. O cérebro deve resistir ao impulso de ler palavras individuais e, em vez disso, concentrar-se na identificação da cor da tinta.

Os psicólogos costumam usar essa tarefa para medir o que é chamado de controle executivo, um conjunto de processos mentais que ajudam as pessoas a regular sua atenção, resistir a distrações e focar em objetivos.

Testando a atenção da inteligência artificial

Os pesquisadores queriam ver se os modelos modernos de grandes linguagens (LLMs) poderiam lidar com esse desafio tão bem quanto os humanos.

LLM é o sistema de inteligência artificial por trás de ferramentas como ChatGPT, Claude e Gemini. Eles são treinados em grandes quantidades de texto e aprendem padrões de linguagem que lhes permitem produzir respostas que muitas vezes parecem muito humanas.

Quando recebem uma pequena lista de cinco palavras coloridas, os sistemas de IA geralmente funcionam bem, mesmo que as palavras e as cores não correspondam.

No entanto, à medida que a lista crescia, a situação mudou dramaticamente.

O GPT-4o alcançou 91% de precisão ao processar 5 palavras. Com dez palavras, a precisão caiu para 57%. Quando a lista foi ampliada para 40 palavras, a precisão caiu para apenas 15%.

Claude 3.5 Sonnet mantém desempenho estável na lista de 20 palavras, mas depois experimenta um declínio acentuado, com a precisão caindo para 24% na lista de 40 palavras.

Os pesquisadores observaram padrões semelhantes no GPT-5, Claude Opus 4.1 e Gemini 2.5.

Quando a inteligência artificial perde o foco

O desafio se torna ainda mais difícil quando palavras de cores correspondentes e não correspondentes aparecem na mesma lista.

Nestas condições, o desempenho deteriora-se ainda mais. Em alguns casos, a precisão caiu para quase zero para itens sem correspondência.

Os pesquisadores disseram que o modelo de inteligência artificial não foi capaz de manter instruções para identificar as cores das tintas. Em vez disso, eles próprios optam cada vez mais por ler as palavras.

Por outras palavras, estes sistemas parecem ser incapazes de suprimir de forma sustentável as respostas para as quais foram treinados com mais rigor.

A descoberta é particularmente interessante porque os humanos enfrentam conflitos semelhantes. As pessoas geralmente são melhores lendo textos do que nomeando cores de tinta. No entanto, apesar deste preconceito, a maioria das pessoas mantém alta precisão e desempenho estável mesmo quando confrontadas com longas listas de palavras e cores conflitantes.

Atenção humana versus atenção da máquina

O estudo destaca diferenças importantes entre a inteligência humana e a artificial.

Embora os sistemas modernos de inteligência artificial possam produzir capacidades impressionantes de linguagem e raciocínio, os seus mecanismos subjacentes diferem dos processos de atenção encontrados nos cérebros biológicos.

Muitas vezes, os humanos conseguem manter o foco em um objetivo específico enquanto filtram mensagens concorrentes. Os resultados sugerem que os modelos atuais de IA podem ter dificuldades com este tipo de controle cognitivo à medida que as tarefas se tornam cada vez mais difíceis.

Os pesquisadores acreditam que o colapso de desempenho observado nesses experimentos mostra uma limitação fundamental dos grandes modelos de linguagem atuais. Embora a inteligência artificial possa por vezes imitar o comportamento humano, a sua capacidade de manter a atenção parece ser muito diferente da forma como os humanos funcionam.

Estas descobertas lembram-nos que mesmo os sistemas de inteligência artificial mais avançados ainda apresentam pontos fracos, especialmente quando as tarefas exigem que resistam à distração e se concentrem em grandes quantidades de informação.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui