Início AUTO Mais pessoas estão falando seus e-mails, mensagens e códigos graças ao ditado...

Mais pessoas estão falando seus e-mails, mensagens e códigos graças ao ditado de voz da IA

37
0

Gavin McNamara largou o teclado e passa o dia todo conversando em vez de digitar.

Ele passa horas conversando em seu computador e telefone, enviando e-mails, escrevendo apresentações, postando no LinkedIn e até codificando conversas usando o aplicativo de ditado de IA da startup Wispr Flow, com sede em São Francisco.

A IA pontua, formata e adapta suas divagações em uma cópia coerente. McNamara digita em média 125 palavras por minuto, o dobro da velocidade média de digitação.

“Neste momento, faço tudo o que pode ser feito, escrevendo e falando”, disse o fundador da agência de software Why Not Us, de 32 anos. “Estou apenas conversando.”

Imprimiu quase 300.000 palavras em 77 aplicativos nos últimos cinco meses; Isso equivale a escrever três romances.

Os gigantes tecnológicos e as startups da Califórnia estão na vanguarda de um movimento para utilizar a inteligência artificial e os grandes modelos de linguagem em que se baseiam para encorajar as pessoas a interagir com a tecnologia usando a voz em vez dos dedos.

“A IA e a pós-graduação mudaram a dinâmica”, disse CJ Pais, criador do aplicativo gratuito de ditado de voz para texto baseado em San Diego, Handy. “Usar a voz é muito mais rápido do que digitar.”

Uma mistura de desenvolvedores independentes e startups, incluindo Handy, Wispr Flow e Willow de São Francisco, entre outros, surgiu para oferecer interação de voz precisa com IA.

Os maiores nomes da tecnologia também estão criando novas maneiras de as pessoas fazerem parceria com a IA. Os mais recentes óculos inteligentes da Meta são baseados em voz. OpenAI e Meta criaram diferentes personas para os chats de voz de seus bots. Até mesmo a Alexa, da Amazon, e a Siri, da Apple, estão passando por atualizações de IA, e as empresas prevêem que isso permitirá que todos falem mais com sua tecnologia.

Esses métodos gratuitos e pagos de uso da palavra falada em computadores atraíram milhões de usuários, incluindo programadores, assistentes administrativos, advogados, criadores de conteúdo e médicos. Alguns otimistas acham que o teclado pode se tornar obsoleto.

“Estou emocionado em anunciar que estamos removendo os teclados dos prêmios de televisão mais prestigiados do mundo”, disse o fundador da Willow, Allan Guo. LinkedInEle observou que a equipe do Emmy Awards está usando o ditado de voz de Willow para enviar mensagens do Slack e limpar as caixas de entrada com mais rapidez, em preparação para a premiação de 2026.

Ao longo dos anos, grandes empresas de tecnologia adaptado Por conveniência, muitos de seus produtos vêm com recursos de áudio prioritários. Hoje, há uma mudança da voz como recurso de acessibilidade para uma ferramenta de produtividade.

Produtor do ChatGPT no final de 2022 começou a dar acesso ilimitado Ela mudou para um modelo de reconhecimento automático de fala chamado Whisper, treinado em 680 mil horas de dados multilíngues. OpenAI compartilhou tecnologia precisa de transcrição de voz, que já foi um grande segredo tecnológico bem guardado. Agora qualquer pessoa pode baixar e executar transcrições de IA de alta qualidade gratuitamente em seu laptop.

A nova onda de aplicativos de ditado de IA basicamente usa o Whisper e se baseia nele para oferecer ditado ao vivo. Embora existam alternativas gratuitas, as assinaturas pagas custam entre US$ 8 e US$ 12 por mês.

O ditado alimentado por IA está agora ganhando terreno entre programadores e usuários casuais, permitindo que as pessoas falem com seus laptops. Seja escrevendo um e-mail, enviando um SMS, projetando um site ou atribuindo tarefas a IAs, os primeiros usuários dizem que o ditado lhes permite trabalhar mais rápido, pensar com mais clareza e ser mais produtivo.

“As pessoas que adotaram a voz em grande escala não vão voltar. Quando você fala em seu laptop 20 horas por semana, digitar parece um atrito”, disse Naveen Naidu, diretor-gerente do aplicativo de ditado de voz Monologue, com sede em Nova York. “Acho que estamos indo nessa direção: a voz se torna a camada de delegação. Você diz sua intenção e as coisas acontecem.”

Esses novos aplicativos de ditado de IA são da Apple chips avançados em iPhones e Macs para executar ditado privado no dispositivo.

Geoffrey Huntley, um desenvolvedor de software independente, mudou quase inteiramente para a voz no trabalho em junho.

Ele frequentemente inicia projetos ativando um comando de voz e pedindo à IA que o entreviste sobre suas preocupações e necessidades do projeto antes de qualquer código ser criado.

“Eu converso com ele de um lado para o outro, como se estivesse tocando em uma banda de jazz”, disse Huntley. Essa dança vocal ajuda a melhorar os recursos, então a IA assume o controle. e cria software.

Além da codificação, Huntley usa áudio para “deixar rolar” ao capturar ideias ou mensagens de postagens de blog, usando as seguintes práticas: super sussurro ou use o Wispr Flow para obter um “primeiro despejo” de pensamentos antes de passar para o teclado para a edição final.

Um número crescente de desenvolvedores de software no Vale do Silício passa horas ditando instruções de codificação em vez de escrevê-las. Combinação de agentes de inteligência artificial em rápido avanço que podem codificar horaAs entradas de voz, que capturam pensamentos mais rapidamente do que a digitação, aumentaram a produtividade.

Autodenominado “codificador de vibração”, McNamara desenvolveu mais de 25 aplicativos da web em poucos meses; este foi um ritmo de desenvolvimento que não teria sido possível sem instruções de voz.

“Não acho que (digitar) seria de alguma forma eficiente ou eficaz para chegar a esse ponto tão rapidamente quanto chego falando”, disse McNamara.

Demorou uma conversa indireta e várias horas para construir a IA Presentes de brotoUma lista de presentes e um aplicativo para crianças avalie qualquer item com fotos.

É claro que a IA pode cometer erros e o seu funcionamento precisa ser verificado.

Enquanto isso, a adoção generalizada gerou novos aborrecimentos, já que até mesmo usuários avançados se sentem desconfortáveis ​​ao falar com seus laptops. Escritórios abertos e lotados não foram projetados para que muitas pessoas possam conversar com seus computadores ao mesmo tempo.

“Gosto do som, mas não em ambiente de escritório”, disse um deles usuário Sobre X. “Não gosto de falar na frente de outras pessoas. Faria isso em um escritório fechado ou trabalharia no meu carro.”

McNamara usa um fone de ouvido para que as pessoas pensem que ele está em uma ligação.

“É como o hack social que tive”, disse ele.

Embora seja muito cedo para dizer se e quando o teclado Qwerty seguirá as fitas e os aparelhos de fax e se tornará obsoleto, o ritmo da voz está se acelerando, disse Dylan Fox, fundador da AssemblyAI, com sede em São Francisco, que fornece modelos de voz para empresas.

“Estamos definitivamente no início do que consideramos ser um aumento de 10 a 100 vezes na demanda por voz, aplicativos e interfaces de IA”, disse ele.

Para o programador McNamara, conversar mais com chatbots fez dele um amigo melhor.

Ele era ruim em responder mensagens. Agora ele retorna imediatamente para seus amigos.

“Eu respondo tão rapidamente que penso: ‘Quem é esse cara?’ “eles dizem”, disse ele.

Source link