Eventos

Eventos

Dissertação de Mestrado - Nº 1.917: Reconhecimento de Fala em Tempo Real para Robôs Móveis

25 de março de 2020 às 12:22:08

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.917

Aluno: Eulogio Gutierrez Huampo
Orientador: Prof. Aluizio Fausto Ribeiro Araújo
Título: Reconhecimento de Fala em Tempo Real para Robôs Móveis
Data: 27/03/2020
Hora/Local: 15h – VIRTUAL
Banca Examinadora:
Prof. Hansenclever de França Bassani (UFPE / Centro de Informática)
Prof. Bruno José Torres Fernandes (UPE / Escola Politécnica de Pernambuco)
Prof. Aluizio Fausto Ribeiro Araújo (UFPE / Centro de Informática)


RESUMO:

O reconhecimento de fala para robôs moveis é um campo multidisciplinar que 
envolve processamento de sinais e novos paradigmas de aprendizagem de 
máquina. Entre muitas aplicações, visa ajudar pessoas com restrições de 
mobilidade. O objetivo deste trabalho e propor e implementar modelos de 
reconhecimento de comando de voz em tempo real que podem ser integrados ao 
robô TIAGo, a fim de executar tarefas de navegação. Primeiramente, para 
reconhecimento de palavras isoladas independente do locutor, são 
implementados modelos empregando redes neurais, extrator de características 
MFCC e uma nova base de dados de vocabulário limitado. Neste caso, os 
modelos de redes neurais propostos são o MLP e o incremental supervisionado 
GNG, método online de aprendizagem. Os dois modelos propostos são 
comparados com os mapas topológicos auto-organizáveis implementados como 
categorizador de padrões. Para melhorar o desempenho das redes neurais, 
adiciona-se ruído branco e ruído colorido. Nos resultados, em termos de 
taxa de acerto e tempo de processamento, o melhor caso é o MLP. Para o 
qual, propomos um limiar de ativação para evitar falsos positivos. Além 
disso, o sistema é avaliado em ambientes com ruído acústico, ou seja, teste 
com adição de ruído de ventilador e ruído balbuciante.  Em alternativa, 
para reconhecimento de fala continua, é integrado o modelo PocketSphinx ao 
robô TIAGo através do ROS Kinetic. Neste caso, é possível configurar o 
modelo de linguagem e o dicionário de palavras. Na implementação, para 
evitar falsos comandos de voz e interferência do ambiente ruidoso, 
emprega-se uma palavra-chave associada ao comando. Para os experimentos são 
apresentados dois casos de navegação assistida através dos comandos de voz. 
No primeiro caso, movimento da base do robô através dos comandos de 
velocidade. No segundo caso, localização e navegação em ambientes 
domésticos com desvio de obstáculos.

Palavras-chave: Reconhecimento de fala para robôs. Processamento do sinal 
de áudio em tempo real. Rede neural MLP. Classificador oiSGNG. Navegação 
com desvio de obstáculos.