Início ESPECIAIS Acontece que você pode tornar pequenos modelos de IA muito mais inteligentes...

Acontece que você pode tornar pequenos modelos de IA muito mais inteligentes ensinando-lhes jogos como Battleship.

22
0

Um pequeno modelo de IA conseguiu melhorias surpreendentes em um jogo muito antigo.

Pesquisador do MIT Usamos uma configuração estilo navio de guerra para testar se poderíamos melhorar a forma como os agentes de IA coletam informações antes de se moverem. Os resultados melhoraram drasticamente o desempenho de sistemas de pequena escala, incluindo um modelo que passou de vencer os humanos por pouco para vencer a maioria dos jogos depois que os pesquisadores mudaram a forma como ele vasculhava o tabuleiro.

Esta mudança vai diretamente para uma das maiores fraquezas dos agentes de IA atuais. Muitas vezes somos solicitados a realizar tarefas onde a resposta depende de detalhes que ainda não temos. A pesquisa do MIT sugere que um melhor planejamento de perguntas pode fazer com que modelos mais baratos se comportem de forma significativamente mais competente.

Quão inteligente você se tornou?

O teste do MIT usou uma versão do Battleship construída em torno de questões de linguagem natural. Um agente de IA atuou como membro da equipe tentando encontrar navios escondidos, enquanto o outro agente de IA respondeu acessando o tabuleiro.

O maior salto veio do Llama 4 Scout. O MIT disse que o modelo pequeno inicialmente venceu jogadores humanos em apenas 8% dos jogos. Depois que os pesquisadores adicionaram uma estratégia de inferência mais cuidadosa, a estratégia superou os humanos em 82% e superou um modelo de fronteira maior, operando a um custo de cerca de 1%.

Se você se preocupa com o custo da IA, esses são números aos quais você deve prestar atenção. O modelo venceu não por ficar maior, mas por escolher perguntas mais precisas e aproveitar melhor cada resposta.

Por que o Battleship ajuda a IA a aprender

Battleship funciona como um teste porque força os agentes de IA a agirem com informações limitadas. Como você não pode ver o quadro inteiro, cada pergunta que você fizer deve ajudar a restringir sua pesquisa e definir seu próximo passo.

Isso mapeia perfeitamente para ferramentas práticas de IA. Bots de suporte, assistentes de pesquisa ou planejadores geralmente precisam solicitar acompanhamento antes de poder ajudar. Se esse processo for interrompido, o modelo poderá perder detalhes importantes, repetir-se ou fazer recomendações demasiado cedo.

A abordagem do MIT pressiona estas fraquezas. Mede se os agentes conseguem reunir as informações corretas antes de gerar uma resposta.

Para onde podemos ir a seguir?

O teste mais difícil é se a mesma abordagem funciona fora dos jogos. Como o Battleship é controlado, é mais fácil pontuar do que fluxos de trabalho de agentes abertos em pesquisa, suporte ao cliente ou software de local de trabalho.

Ainda assim, vale a pena assistir a direção. À medida que os pequenos modelos aprendem a fazer perguntas mais incisivas antes de agir, as empresas podem criar ferramentas de IA acessíveis que pareçam mais adequadas para o uso diário.

O próximo passo é a transição do tabuleiro de jogo para a ação real. Tarefas com instruções pouco claras, arquivos ausentes e usuários apressados ​​são muito mais difíceis de resolver.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui