Início ANDROID A automação de tarefas do Gemini é lenta, desajeitada e absolutamente impressionante

A automação de tarefas do Gemini é lenta, desajeitada e absolutamente impressionante

18
0

Tenho testado a nova automação de tarefas do Gemini no Pixel 10 Pro e no Galaxy S26 Ultra, que pela primeira vez permite que o Gemini assuma o controle e use aplicativos para você. No momento, está limitado a uma pequena porção – alguns serviços de entrega de comida e serviços de transporte compartilhado – e ainda está em versão beta. É lento, às vezes desajeitado e não resolve nenhum problema sério que você tenha ao usar o telefone. Mas é impressionante e não creio que seja exagero dizer que é um vislumbre do futuro. Ainda temos um longo caminho a percorrer, mas esta é a primeira vez que vejo um assistente de IA realmente trabalhar em um telefone – não em uma apresentação principal ou em uma demonstração cuidadosamente controlada dentro de um salão de convenções.

Primeiro: Gêmeos é muito mais lento do que você, ou eu, ou a maioria das pessoas no uso de seus telefones. Se você precisar pedir um Uber neste exato momentoVocê ainda é a melhor pessoa para o trabalho. No entanto, antes de excluí-lo, lembre-se de que a automação de tarefas foi projetada para ser executada em segundo plano enquanto você faz outras coisas no telefone. Melhor ainda, ele continua funcionando enquanto você está lá Não olhe para o seu telefone para poder fazer coisas como verificar se o seu passaporte está na sua bolsa pela décima vez.

Mas se você estiver curioso, como eu, poderá ver tudo acontecer. Quando está funcionando, um texto aparece na parte inferior da tela mostrando o que o Gemini está fazendo. Coisas como “Escolher uma segunda porção de frango Teriyaki para o combo”, que aconteceram quando eu o orientei a pedir o jantar no sábado à noite. Observar Gêmeos resolver problemas rapidamente é uma regra honesta. Eu pedi um prato combinado de frango; o cardápio apresenta opções em múltiplos de meias porções, então adicionar duas porções e meia de frango é o correto.

Gêmeos percebe que duas porções e meia equivalem a um pedido de frango teriyaki.

Gêmeos tem mais dificuldade em encontrar o lado verde exibido bem no meio da tela aqui.

Recomendamos que ao iniciar uma automação com Gemini, o comportamento padrão seja executá-la em segundo plano. Você deve tocar no botão e abrir outra janela se quiser ver o Gemini realizando a tarefa. E pode ser muito insuportável. Observar o computador tentando encontrar o lado vegetariano no menu do Uber Eats naquela época sentado ali mesmo, no topo da tela como assistir a um filme de terror e saber que o assassino está no armário ao lado do protagonista. Quero dizer, exceto pela parte do assassinato. Gemini cometeu alguns erros ao preparar meu pedido de teriyaki, que acabou pegando, mas o episódio inteiro durou cerca de nove minutos. Não é o ideal.

Gêmeos deve realizar suas tarefas até a hora de confirmar e reservar um carro ou jantar para que você possa verificar seu trabalho. Na minha opinião, esta é a única maneira razoável de usar esse recurso no momento, e não me importo com o atrito adicional ao concluir pedidos. Nos testes que fiz nos últimos cinco dias, nunca cometi um erro e isso completou meu pedido. E acontece que os resultados são muito precisos; Só preciso fazer alguns ajustes no pedido final. Se falhar – o que já vi acontecer algumas vezes – tende a acontecer nos primeiros dois minutos, quando algo no aplicativo precisa da minha atenção, como dar permissão para usar minha localização ou alterar o local de entrega em domicílio em vez de Nevada, que foi o último lugar onde usei o aplicativo. Tive que descobrir qual era o problema em casos como esse, mas depois que o problema foi resolvido consegui reiniciar a automação sem problemas.

Isso é o que realmente me interessou. Coloquei um evento em minha agenda para um voo para São Francisco no dia seguinte (uma viagem de mentira para mim, mas detalhes reais do voo). Dei instruções vagas a Gêmeos para agendar um Uber que me levaria ao aeroporto a tempo para meu voo de amanhã. Como o Gemini tem acesso ao meu e-mail e calendário, ele pode encontrar essas informações. Exigiu um pouco mais de orientação – talvez porque o voo não estava no meu e-mail como esperado. Mas com isso, ele encontrou as informações do voo, sugeriu sair às 11h30 ou 11h45 (horário lógico para um voo de 13h45, considerando que moro perto do aeroporto) e perguntou se eu queria agendar uma viagem para um desses horários. Eu tinha o tempo acertado e o passeio começou a ser configurado em cerca de três minutos, sem necessidade de mais informações da minha parte.

Isso é um pouco mais impressionante quando você considera que o Uber nem sequer chama isso de agendamento passeio – você manter elevador. Essa é a principal diferença entre os assistentes digitais que usamos e os assistentes de IA que estão surgindo hoje. Ser capaz de usar uma linguagem natural ao falar com um computador faz uma grande diferença na hora de controlar sua casa inteligente ou pedir o jantar. Se um computador tropeça e pede esclarecimentos quando você esquece que o restaurante chamou sua refeição de “prato” e não de “combo”, ou se você pede “salada” em vez de “repolho picado”, então não é mais útil do que os assistentes que usamos na última década para definir temporizadores e tocar música.

Ainda assim, observar Gêmeos tocar e pesquisar pelo Uber Eats deixa uma coisa bem clara: se você projetar um aplicativo para uso de IA, ele não se parecerá com o que temos hoje. Você sabe, os aplicativos são projetados para humanos. O assistente de IA não será tentado por um grande anúncio no meio da página para economizar 30% em seu pedido. Uma foto apetitosa e bem montada do prato que ela pediu não convence mais do que uma foto de baixa qualidade. Você fornecerá um banco de dados, não um monte de confusão que precisa ser eliminada – algo que a indústria está trabalhando no Model Context Protocol, ou MCP.

Um modelo de IA usando uma interface centrada no ser humano parece a maneira mais impraticável e frágil de pedir pizza. Às vezes bate na parede e não é bom avisar você Por que não pode fazer nada. Esta versão de automação de tarefas parece um paliativo até que os desenvolvedores de aplicativos adotem métodos mais sofisticados: MCP ou funções de aplicativos Android. O chefe do Android do Google, Sameer Samat, me disse recentemente que Gemini adota uma abordagem sensata, dada a ausência dos outros dois. Talvez esta versão da automação de tarefas seja a nossa prévia do que é possível, ou uma forma de encorajar os desenvolvedores a adotar um dos outros métodos. De qualquer forma, este parece ser um primeiro passo importante em direção a uma nova maneira de usar nossos assistentes móveis – estranho, lento, mas muito promissor.

Fotografia de Allison Johnson/The Verge

Siga tópicos e autores desta história para ver mais coisas semelhantes em seu feed inicial personalizado e para receber atualizações por e-mail.


Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui