Painel Administrativo >> Relatório de Artigos >> Artigo

Artigo


2168

CONVERSÃO DE SINAIS DE ÁUDIO PARA TEXTO ATRAVÉS DA REDE NEURAL DEEP SPEECH;

Reinaldo Borges Salla, Blanca Rosa Maquera Sosa;
Arquivo não encontrado

COBENGE19

[35] 13. Temas Transversais à Educação em Engenharia

[126] 13.1 Outros aspectos relevantes relacionados à Educação em Engenharia de uma maneira geral

Este trabalho possui o objetivo de promover a conversão de fala para texto utilizando técnicas de inteligência artificial. Redes neurais profundas vêm ganhando a atenção da comunidade acadêmica e consistem em uma metodologia atraente para solucionar problemas envolvendo a conversão de sinais sequenciais no tempo em um conjunto de letras e palavras que podem ser processadas em máquinas e computadores. A rede neural Deep Speech foi lançada em 2017 pelo grupo Mozilla e pode ser considerada um modelo eficiente treinado de ponta-a-ponta. Assim, utilizando a linguagem de programação Python e conduzindo testes através do conjunto de dados VoxForge, foi possível implementar um sistema que promove a conversão de fala para texto efetuando o reconhecimento correto das letras e a separação correta das palavras.

Inteligência Artificial, Redes Neurais Profundas, DeepSpeech
Voltar