A Apple prometeu um Siri mais inteligente e capaz na WWDC 2024. A apresentação foi convincente. Siri entende sua situação pessoal, analisa suas mensagens e e-mails, executa tarefas dentro de aplicativos e se transforma em um verdadeiro assistente.
Dois anos depois, esse sonho ainda continua sendo um sonho. Mas aqui está algo que pode mudar o rumo da assistente da Apple. De acordo com o relatório, o Siri não está mais vinculado a um único cérebro de IA. A Apple está construindo flexibilidade para encaminhar solicitações para o modelo externo que melhor se adapta à tarefa.
Isso me levou a fazer uma pergunta. Se o Siri puder usar qualquer IA, qual IA ele deverá usar? O modelo externo padrão atual é ChatGPT. Mas eu diria que Gémeos é a escolha mais lógica. Aqui está o porquê:
Siri é um mecanismo de busca
Pense em como você realmente usa o Siri todos os dias. Pergunte sobre o tempo de hoje. Pergunte sobre o restaurante mais próximo. Ele pede que você procure coisas na web. Uma parte significativa do uso do Siri envolve pesquisas ou consultas semelhantes, e nenhuma empresa no planeta pesquisa melhor do que o Google.
O Google vem construindo alguns dos mecanismos de busca mais poderosos há décadas e agora esse conhecimento flui diretamente para o Gemini. Quando você pergunta algo a Gêmeos, isso não vem apenas de um modelo de linguagem. Extrai dados do índice da web em tempo real do Google, Google Maps, Google Shopping e muito mais.

Usar isso para aprimorar os recursos de pesquisa do Siri o levará a um novo nível incomparável com outros provedores de LLM.
A Apple prometeu privacidade, mas a Gemini está cumprindo.
Um dos maiores pontos de discussão na apresentação WWDC 2024 da Apple foi a privacidade. A Apple mostrou a Siri exibindo informações contextuais em todo o aplicativo para responder perguntas como “Mãe, quando meu avião pousa?” Ou “Mostre-me uma foto de Stacey com um casaco rosa em Nova York”.

Em forma de demonstração, é realmente impressionante. Mas quando peço para ver fotos de pessoas vestindo camisetas pretas, recebo fotos aleatórias de pessoas vestindo camisetas pretas na web. Não é exagero dizer que os recursos de inteligência pessoal da Siri foram um fracasso colossal.

Enquanto isso, a Gemini lançou silenciosamente seu próprio recurso de inteligência pessoal. Inferir dados pessoais e responder a questões complexas do contexto de vida usando Gmail, Agenda, Google Fotos, Drive e muito mais. Não é perfeito, mas pelo menos está funcionando.

Esta é uma representação direta do que a Apple demonstrou como um futuro recurso do Siri. No entanto, Gêmeos está fazendo isso atualmente. Se a Apple quiser fornecer esses recursos aos usuários rapidamente, o Gemini pode ser o atalho de que precisam.
Gemini já está fazendo o que a Siri prometeu.
O Apple Intelligence combina processamento no dispositivo que preserva a privacidade com computação baseada em nuvem para tarefas mais exigentes, distribuindo modelos de IA compactos e capazes entre aplicativos do sistema. O processamento no dispositivo e os aspectos de privacidade são o que diferencia a Apple de seus concorrentes. Mas agora você não está sozinho.

Gemini Nano já faz isso em dispositivos Pixel e Samsung Galaxy. Resumos off-line, respostas inteligentes e recursos contextuais são suportados sem conexão com a Internet. No Pixel 9 e posterior, o Gemini Nano é multimodo e pode processar imagens, texto e idioma diretamente no dispositivo.

A Apple está desenvolvendo produtos que o Google já lançou. Em vez de reinventar a roda, usar a implantação existente do Nano do Gemini como base para a funcionalidade Siri no dispositivo pouparia à Apple muitas dores de cabeça e dinheiro.
O kit de ferramentas criativas de Gêmeos está completo
É aqui que tudo fica realmente interessante. Gêmeos não é apenas um modelo de texto. Isso vem com todo um ecossistema criativo que a Apple pode explorar.
Veo lida com a criação de vídeos de até 1080p, incluindo estilo cinematográfico e clipes com mais de 1 minuto. Lyria do Google DeepMind é responsável pela geração de música e áudio. Para imagens, o Nano Banana (serviço de criação de imagens do Google) recebeu recentemente uma grande atualização com renderização de texto aprimorada, consistência de assunto e suporte para todas as proporções.

A Apple lançou recentemente seu próprio Creator Studio, dando aos usuários acesso a ferramentas criativas por meio de uma assinatura mensal fixa. Se uma empresa quer realmente competir com a Adobe, ela precisa oferecer recursos de criação. O Gemini já possui todos esses recursos, então integrá-lo ao pacote criativo da Apple seria perfeito.

Já existe uma parceria.
Este ponto não foi suficientemente discutido. O Google supostamente paga à Apple cerca de US$ 20 bilhões por ano para manter o mecanismo de busca padrão do Safari. Este é um dos acordos de distribuição mais valiosos da história da tecnologia. O relacionamento entre Apple e Google é profundo, duradouro e financeiramente significativo para ambas as empresas.
Expandir o relacionamento de “Google potencializa a pesquisa no Safari” para “Gemini potencializa os recursos de IA da Siri” não é um salto dramático. Esta é uma evolução natural de uma parceria que faz metade do que acontece quando você abre um navegador no seu iPhone.
Então, qual modelo devo seguir?
Claude é excelente em longas leituras de contexto e raciocínio matizado. ChatGPT possui um grande ecossistema e poderosas ferramentas de codificação e agente. Ambos funcionam muito bem como especialistas escolhidos pelo usuário. Eu uso Claude no meu computador.
Mas com o motor subjacente sob o capô do Siri? Eles não são a escolha certa. Gemini opera no nível do sistema operacional móvel, entende o contexto pessoal e de pesquisa, existe no formato Nano do dispositivo e está no centro do relacionamento comercial mais importante da Apple com qualquer empresa de tecnologia.
As peças estão todas lá. Se o Gemini pode oferecer suporte a um Siri mais inteligente, não é a questão. É questionável se Google e Apple conseguirão chegar a um acordo mutuamente benéfico. E se os rumores continuarem, as coisas já podem estar caminhando nessa direção.



