O chatbot de IA “em busca da verdade” de Elon Musk, Grok, tem algumas verdades duras. Não é muito bom e poucas pessoas o usam. Essa é a nova lição Reuters relatórioIsso porque Grok descobriu no ano passado que pouco aparece nos registros federais sobre como o governo dos EUA usou a IA. Apesar de Musk ter colocado o xAI no centro do maior IPO da história, este não é o único sinal de que o chatbot exclusivo do xAI está enfrentando problemas.
Reuters Analisamos mais de 400 casos de uso de IA governamental onde fornecedores específicos foram nomeados. Grok, ou xAI, apareceu apenas em três produtos usados para fins básicos, como elaboração de documentos ou gerenciamento de mídias sociais, e sempre ao lado de concorrentes como Microsoft e OpenAI. Em comparação, o modelo OpenAI apareceu em mais de 230 casos, enquanto Google e Anthropic apareceram dezenas de vezes cada.
Um padrão semelhante surgiu em outro banco de dados de um projeto governamental de IA mais ambicioso, direcionado a um número menor de usuários. Grok apareceu apenas três vezes. Duas vezes foi usado em trabalho administrativo de rotina para a Comissão de Assistência Eleitoral, e uma vez apareceu em um piloto do Departamento de Energia no Laboratório Nacional Lawrence Livermore para Resumo de Documentos e Estudos Gerais. Reuters Encontramos 140 itens relacionados à Microsoft e OpenAI, e uma análise rápida encontrou pelo menos 10 itens para Antrópico e dezenas de itens para Google Gemini.
Esta lista é uma medida incompleta e desigual da adoção governamental. Existem muitos outros exemplos listados sem fornecedores específicos, e está claro que não existe uma definição universal do que é considerado IA. Os dados também não capturam agências de inteligência ou o Departamento de Defesa, onde a xAI recebeu um contrato de US$ 200 milhões no ano passado e foi recentemente autorizada a operar em redes confidenciais após ser colocada na lista negra da Anthropic.
Ainda assim, não parece bom para Grok. Eles aparecem com muito menos frequência do que seus concorrentes e, quando aparecem, são principalmente para tarefas administrativas básicas. Não se enquadra no modelo Frontier de classe mundial de que Musk se vangloria há anos.
“Simplesmente não é o melhor modelo.”
pessoas com quem conversei Reuters A explicação, ele sugeriu, era simples. Grok não é tão bom quanto seus concorrentes. “Não é o melhor modelo”, disse uma fonte não identificada do Ministério da Defesa, acrescentando que o pessoal tendia a preferir Gemini ou Claude. Tabela de classificação pública para classificar modelos de IA Pese essa opinião. Anthropic, Google e OpenAI ocupam as primeiras classificações, enquanto Grok raramente está entre os 10 primeiros, exceto ocasionalmente nas categorias de imagem ou vídeo.
Isso é estranho para Musk e ainda mais estranho para a SpaceX, que absorveu xAI no início deste ano. IPO da Rocket Venture arquivamento Isso mostra que a empresa colocou a IA, e especificamente a Grok, no centro de sua abordagem aos investidores. A SpaceX afirma ter identificado “o maior mercado viável e coletivamente acessível na história da humanidade”. Esta é uma oportunidade incrível de 28,5 biliões de dólares, mas infelizmente não existe um calendário para chegar lá. Na verdade, todo esse valor estimado vem da IA, especialmente da IA empresarial, e não de foguetes ou satélites.
Reuters Eles salientam que o desempenho de Grok em agências governamentais pode ser um indicativo do seu desempenho também em outros locais de trabalho. Como parte de seu impulso xAI para clientes empresariais, Musk Conhecido como um banco de braços fortes Se você deseja participar do IPO da SpaceX, recomendamos adquirir uma assinatura Grok. No entanto, se você não estiver fazendo o seu dinheiro valer a pena, esses acordos podem ser uma solução de curto prazo.
Como se o desempenho chato não fosse estranho o suficiente, Musk admitiu recentemente que o xAI ajudou a treinar e melhorar o Grok usando modelos do OpenAI. Esse processo, conhecido como destilação, é padrão quando a empresa utiliza modelo próprio, mas é muito mais polêmico quando utiliza sistema de concorrente. Grok não consegue nem vencer o modelo que está treinando.
Na versão para consumidor divulgada ao público, Grok é intencionalmente ofensivo. Musk classificou o chatbot como uma alternativa menos tendenciosa e menos censurada a ferramentas como o ChatGPT, mas isto foi interpretado como um produto com padrões probatórios frouxos, uma obsessão doentia por Musk e um longo historial de produção ofensiva, conspiratória e sexual. Mesmo que as grades de proteção no local de trabalho sejam diferentes, pode não ser algo que as empresas aceitem. O histórico estelar de Grok inclui elogiar Adolf Hitler, questionar o número de mortos no Holocausto, pintar milhões de deepfakes sexuais não consensuais em todo o X, incluindo crianças, e empoderar imitações racistas e transfóbicas da Wikipédia e namoradas de anime picantes. E não vamos esquecer os dias em que ele se autodenominava “Mecha Hitler”. Se Grok fosse um funcionário humano, não acho que demoraria muito para que o RH se envolvesse.
A SpaceX parece entender o problema. No documento, a empresa alertou que o modo “picante” ou “desequilibrado” de Grok acarreta “altos riscos”, incluindo danos à reputação, escrutínio regulatório e litígios. Discurso Corporativo: Este chatbot vai nos processar.
Discurso Corporativo: Este chatbot vai nos processar.
Grok leva o nome de Robert A. Heinlein. estranho em uma terra estranhaGrosso modo, significa uma compreensão profunda e profunda de algo. O que você precisa entender aqui não é particularmente complicado. Musk gastou bilhões de dólares construindo um chatbot que não é muito bom, não é muito popular e é de alguma forma fundamental para justificar a avaliação astronômica da SpaceX. boa sorte.



