Início ESPECIAIS Tecnologia de IA que entende até palavras que não são faladas em...

Tecnologia de IA que entende até palavras que não são faladas em voz alta

21
0

Desenvolvido por pesquisadores da Universidade de Ciência e Tecnologia de Pohang (POSTECH) Tecnologia vestível inovadora Ele pode transformar a fala calma em uma voz audível, lendo movimentos sutis dos músculos do pescoço. Esta pesquisa, liderada pelo Professor Seongmin Park e pelo Dr. Seongguk Hong, foi publicada na Cyborg and Bionic Systems e fez progressos importantes na comunicação entre humanos e máquinas.

Do movimento muscular à fala

A inovação baseia-se em ideias simples, mas poderosas. Em outras palavras, a voz não envolve apenas sons. Quando uma pessoa fala ou tenta falar baixo, ocorrem pequenos movimentos nos músculos e na pele ao redor do pescoço. Esses movimentos formam uma espécie de “mapa invisível” da voz pretendida.

Para capturar isso, os pesquisadores criaram um dispositivo vestível chamado sensor de mapeamento de deformação multieixo. O sistema combina silicone flexível com marcadores fiduciais incorporados e uma câmera em miniatura para detectar até as menores deformidades da pele. Projetado para uso diário, o sensor se ajusta confortavelmente ao pescoço e recalibra automaticamente quando reposicionado.

Os dados coletados são processados ​​por meio de inteligência artificial, que interpreta padrões de tensão e reconstrói a palavra ou frase pretendida. Ao combinar isto com a síntese de fala treinada no perfil vocal do usuário, o sistema pode produzir uma fala que se assemelha muito à voz natural de uma pessoa, mesmo quando nenhum som é produzido.

Um verdadeiro avanço em relação aos sistemas existentes

Os métodos tradicionais de restauração da voz dependem de técnicas como eletromiografia (EMG) ou eletroencefalografia (EEG), que muitas vezes requerem equipamentos volumosos e podem ser desconfortáveis ​​para uso a longo prazo.

A abordagem da equipe POSTECH remove essas barreiras, fornecendo uma alternativa leve e fácil de usar. Em testes, o sistema demonstrou alta precisão na reconstrução de voz mesmo em ambientes ruidosos, como ambientes industriais, onde os microfones tradicionais têm dificuldades.

Impacto real e potencial futuro

As implicações desta tecnologia são de longo alcance. Pacientes que perderam a voz devido a danos nas cordas vocais ou cirurgia laríngea podem receber um novo caminho de comunicação que lhes permite “falar” novamente usando seu próprio perfil de voz.

Além da área médica, este sistema pode permitir uma comunicação silenciosa em ambientes onde é impossível falar alto, como bibliotecas, conferências e locais de trabalho barulhentos. Ele também abre a porta para interfaces humanos-IA mais naturais que podem traduzir a intenção em fala sem vocalização física.

Olhando para o futuro

Os pesquisadores pretendem refinar a tecnologia, melhorar a precisão e expandir os recursos de linguagem para uma implantação mais ampla no mundo real. As iterações futuras poderão integrar-se de forma mais perfeita com os dispositivos de consumo, transformando potencialmente a forma como as pessoas comunicam tanto em ambientes pessoais como de trabalho.

À medida que a IA continua a integrar-se com a tecnologia wearable, inovações como esta marcam uma mudança em direção a formas de interação mais intuitivas e discretas, onde até o que não é dito pode finalmente ser ouvido.

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui