Reconhecimento automático de palavras

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorDajer, María Eugenia-
Autor(es): dc.contributorSpatti, Danilo Hernane-
Autor(es): dc.contributorDajer, María Eugenia-
Autor(es): dc.contributorSpatti, Danilo Hernane-
Autor(es): dc.contributorAgulhari, Cristiano Marcos-
Autor(es): dc.contributorGoedtel, Alessandro-
Autor(es): dc.creatorIshizaki, Mauricio Yoiti-
Data de aceite: dc.date.accessioned2022-02-21T21:52:10Z-
Data de disponibilização: dc.date.available2022-02-21T21:52:10Z-
Data de envio: dc.date.issued2020-11-09-
Data de envio: dc.date.issued2020-11-09-
Data de envio: dc.date.issued2018-06-19-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/7154-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/662439-
Descrição: dc.descriptionAutomatic word recognition is the translation of human speech into text, which has proved useful in man - computer communication. For this reason, several researches were developed in this area and consequently applications, such as virtual assistants, have arisen to make life easier for people. However, people who suffer from any dysphonia (hoarseness) can’t fully enjoy these applications, due to the distortions in their voice. This paper proposes the use of Convolutional Neural Networks (CNNs) to make the recognition of spoken words with this type of distortion. A database of 20 words with 28 samples was used, all voices were from different dysphonic people. Several topology were created for CNN, varying some hyperparameters of the network. All topologies were training and testing. For the test set, the topology with the highest accuracy obtained a result of 82,50%.-
Descrição: dc.descriptionReconhecimento automático de palavras é a tradução da fala humana para texto, o qual se mostrou útil na comunicação homem - computador. Por este motivo, várias pesquisas foram feitas nesta área e consequentemente aplicações, como assistentes virtuais, surgiram para facilitar a vida das pessoas. No entanto, pessoas que sofrem com alguma disfonia (rouquidão) não conseguem desfrutar totalmente destas aplicações, devido às distorções da voz. Este trabalho propõe a utilização de Redes Neurais Convolucionais (CNNs) para fazer o reconhecimento de palavras faladas com esse tipo de distorção. Utilizou-se uma base de dados de 20 palavras com 28 amostras, sendo todas as vozes de diferentes pessoas disfônicas. Foram criadas diversas topologias para a CNN, variando alguns hiperparâmetros da rede. Foi feito o treinamento e teste de cada uma dela. Para o conjunto de teste, a topologia com maior acurácia obteve um resultado de 82,50%.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCornelio Procopio-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Controle e Automação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectSistemas de reconhecimento de padrões-
Palavras-chave: dc.subjectRedes neurais (Computação)-
Palavras-chave: dc.subjectProcessamento de palavras-
Palavras-chave: dc.subjectPattern recognition systems-
Palavras-chave: dc.subjectNeural networks (Computer science)-
Palavras-chave: dc.subjectWord processing-
Palavras-chave: dc.subjectEngenharias-
Título: dc.titleReconhecimento automático de palavras-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.