Telepatia? Óculos leem seus lábios sem você emitir um único som

Equipe de cientistas do SciFi (Laboratório de Interfaces Inteligentes de Computadores para Interações Futuras), da Universidade Cornell (EUA), desenvolveu um sistema de reconhecimento de fala capaz de identificar até 31 palavras em inglês. Mas o EchoSpeech, como o sistema é chamado, não é um aplicativo – é um par de óculos inteligente, com IA (inteligência artificial).

Acessório consegue ler lábios do usuário e ajudar aqueles que não podem falar a realizar tarefas básicas – por exemplo, desbloquear celular ou pedir à Siri para aumentar o volume da TV. Tudo sem precisar emitir um único som. Parece telepatia, mas é ciência.

Leia mais:

IAs usam lista secreta para parecerem humanas; conheçaNvidia lança software que torna IAs mais segurasApple está desenvolvendo um novo serviço de saúde com IA

Como óculos ‘telepata’ funciona

Óculos com IA têm dois microfones, dois alto-falantes e um microcontrolador pequeno (Imagem: Divulgação/Universidade Cornell)

Com dois microfones, dois alto-falantes e um microcontrolador tão pequeno que praticamente se misturam, óculos desenvolvido pelos cientistas de Cornell funciona como uma espécie de sonar.

Mais de mil espécies usam sonar para caçar e sobreviver. Talvez o mais popular entre eles seja a baleia, capaz de enviar pulsos de som que ricocheteiam em objetos na água e depois retornam para que o mamífero possa processar esses ecos e construir uma imagem mental de seu ambiente, incluindo o tamanho e a distância dos objetos ao redor.

O EchoSpeech funciona de maneira semelhante, exceto que o sistema não se concentra na distância. Em vez disso, ele rastreia como as ondas sonoras (inaudíveis ao ouvido humano) viajam pelo seu rosto e como elas atingem várias partes móveis dele. O processo pode ser resumido em quatro etapas principais.

Alto-falantes (num dos lados dos óculos) emitem ondas sonoras;Ondas sonoras viajam pelo rosto e atingem lábios, mandíbula e bochechas;Microfones (no outro lado dos óculos) coletam essas ondas sonoras;Microcontrolador as processa junto a qualquer dispositivo com o qual óculos estejam emparelhados.

Assista abaixo uma demonstração do óculos, publicada por Ruidong Zhang, principal autor da pesquisa:

Leitura labial

Mas como o sistema sabe atribuir uma determinada palavra a um determinado movimento facial? Aqui, os pesquisadores usaram uma forma de IA (inteligência artificial) conhecida como algoritmo de aprendizado profundo, que ensina computadores a processarem dados da mesma forma que o cérebro humano.

Em vez de outro humano inferir conteúdo de sua fala, equipe usou modelo de IA previamente treinado para reconhecer certas palavras e combiná-las com um “perfil de eco” correspondente do rosto de uma pessoa.

Para treinar a IA, a equipe pediu a 24 pessoas que repetissem um conjunto de palavras enquanto usavam os óculos. Eles tiveram que repetir as palavras várias vezes, mas não consecutivamente.

Sistema de reconhecimento de fala do óculos com IA é capaz de identificar até 31 palavras em inglês (Imagem: Divulgação/Universidade Cornell)

Por enquanto, o EchoSpeech tem o vocabulário de uma criança. Ele pode reconhecer os dez algarismos, capturar direções (“para cima”, “para baixo”, “esquerda” e “direita”) e ativar assistentes de voz (por exemplo, Alexa, Google e Siri). Além disso, acessório se conecta a outros dispositivos com Bluetooth.

Um teste recente durante o qual a equipe emparelhou o sistema com um iPad alcançou 95% de precisão, mas ainda há trabalho a ser feito para melhorar sua usabilidade. E o principal autor da pesquisa disse que aumentar vocabulário do sistema para até 200 palavras não deve ser difícil com a IA atual. Mas qualquer coisa maior do que isso exigiria modelo de IA mais avançado.

Já assistiu aos nossos novos vídeos no YouTube? Inscreva-se no nosso canal!

O post Telepatia? Óculos leem seus lábios sem você emitir um único som apareceu primeiro em Olhar Digital.

 

Você pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *