Numa experiência recente, a Anthropic criou um mercado classificado onde agentes de IA representam compradores e vendedores, conduzindo transações reais por bens reais e dinheiro real.
Reconhecido pela empresa O teste, denominado Project Deal, foi um “experimento piloto usando um grupo de participantes selecionados a dedo” de 69 funcionários da Anthropic que receberam um orçamento de US$ 100 (pagos por meio de vale-presente) para comprar itens de colegas de trabalho.
No entanto, a Anthropic disse estar “surpresa com o quão bem o Project Deal funcionou”, com 186 negócios fechados, com um valor total de mais de US$ 4.000.
A empresa disse que na verdade operava quatro mercados separados com modelos diferentes. Uma é “real” (onde todos são representados pelo modelo mais avançado da empresa e os negócios são realmente feitos após experimentos) e os outros três são para pesquisa.
Claramente, quando os usuários são representados por um modelo mais avançado, eles obtêm “resultados objetivamente melhores”, disse a Anthropic. Mas os usuários não parecem notar essa diferença, levantando a possibilidade de uma lacuna na “qualidade do agente”, onde “as pessoas do lado da vítima podem não perceber que estão em uma posição pior”.
Além disso, as instruções iniciais dadas ao agente não parecem ter qualquer efeito na probabilidade de venda ou preço negociado.



